iText2KG是一个开源项目,能够利用大型语言模型(zero-shot)跨领域从文本中提取实体和关系,自动构建和更新知识图谱,并通过Neo4j进行可视化。
iText2KG由四个主要模块组成:文档提取器、增量实体提取器、增量关系提取器、图形集成器和可视化。它们协同工作,从非结构化文本构建和可视化知识图谱。
iText2KG整体架构概述
四个模块中,增量实体提取器与增量关系提取器最为关键,采用大模型来实现,LLM提取代表一个唯一概念的实体,以避免语义混合的实体。
显示了使用 Langchain JSON 解析器的实体和关系提取prompt。分类如下:蓝色 - 由 Langchain 自动格式化的prompt;常规 - iText2KG设计的prompt;斜体 - 专门为实体和关系提取设计的prompt。(a)关系提取prompt和(b)实体提取prompt。
为了说明知识图谱构建的结果,在三种不同场景下,将基线方法与iText2KG进行了比较:
在三个场景中,基线方法与iText2KG在知识图谱构建方面的比较
Incremental Knowledge Graphs Construction Using Large Language Models
本文转载自 PaperAgent
© 版权声明