引言
随着人工智能的飞速发展,机器学习,特别是深度学习,在过去几十年中在许多领域和应用中取得了显著的成就。例如,卷积神经网络(CNN)在图像分类和视觉对象识别方面的准确性常常超过人类,推动了自动驾驶车辆、面部识别、手写识别、图像检索和遥感图像处理等应用的快速发展。同样,循环神经网络(RNN)和基于Transformer的模型在序列学习和自然语言理解方面取得了成功,这些技术推动了机器翻译、语音识别和聊天机器人等应用的发展。然而,大多数机器学习模型的高性能依赖于大量的标记样本进行(半)监督学习,而这些标记样本在现实世界应用中往往成本高昂或不够有效。
在这种背景下,零样本学习(ZSL)和少样本学习(FSL)这两种主要的样本短缺设置备受关注。ZSL被定义为预测在训练中从未出现过的新类别(标签),这些新类别被称为未见类别,而在训练中有样本的类别被称为已见类别。与此相对的,FSL旨在预测那些只有少量标记样本的新类别。零样本学习在过去十年里引起了广泛的关注,提出了许多解决方案。例如,在零样本图像分类中,已经通过CNN从已见类别的图像中学习到的图像特征通常直接被用来为未见类别构建分类器。零样本学习方法通常利用描述类别间关系的辅助信息,如对象的视觉特征(也称为类属性)等。近五年来,知识图谱(KG)作为结构化知识(例如资源描述框架(RDF)三元组)的一种广泛使用的表示形式,引起了广泛的关注,一些基于知识图谱增强的零样本学习方法甚至在许多任务中达到了最先进的性能。
本文回顾了这些研究领域的90多篇文章,介绍了ZSL和FSL中使用的知识图谱及其构建方法,并系统地归类和总结了知识图谱感知的ZSL和FSL方法,将它们分为不同的范式,如基于映射、数据增强、基于传播和基于优化等。此外,本文还介绍了不同的应用领域,包括但不限于图像分类、问题回答、文本分类、知识提取,以及知识图谱补全任务等,最终探讨了不同视角下的挑战和未来的研究方向。
动机和贡献
零样本学习(ZSL)和少样本学习(FSL)的背景
ZSL的定义和应用领域
ZSL的发展和辅助信息
FSL的发展
知识图谱(KG)的背景
定义和范围
通用目的的KGs
ZSL和FSL的KG构建
知识图谱驱动的零样本学习(KG-aware ZSL)
基于映射的范式 (Mapping-Based Paradigm)
基于数据增强的范式 (Data Augmentation Paradigm)
基于传播的范式 (Propagation-Based Paradigm)
基于类别特征的范式 (Class Feature Paradigm)
知识图谱驱动的少样本学习(KG-aware FSL)
基于映射的范式 (Mapping-Based Paradigm)
基于数据增强的范式 (Data Augmentation Paradigm)
基于传播的范式 (Propagation-Based Paradigm)
基于类别特征的范式 (Class Feature Paradigm)
基于优化的范式 (Optimization-Based Paradigm)
基于迁移学习的范式 (Transfer-Based Paradigm)
ZSL和FSL比较
应用方向和数据集(Applications & Resources)
计算机视觉 (Computer Vision)
自然语言处理 (Natural Language Processing)
知识图谱补全 (KG Completion)
KG质量 (KG Quality)
学习范式 (Learning Paradigms)
ZSL和FSL在KG构建中的应用 (ZSL and FSL in KG Construction)
基准测试 (Benchmarking)
作者: