什么是 知识图谱?
知识图谱是真实世界实体及其关系的结构化表示,组织为节点(实体)和边(关系)的网络,使机器能够理解和推理相互关联的信息。
快速了解
| 创建时间 | 概念源自 2000 年代,2012 年由 Google 推广 |
|---|---|
| 规范文档 | 官方规范 |
工作原理
知识图谱已成为组织和查询复杂信息的基础设施。由 Google 于 2012 年推广,它将事实表示为主语-谓语-宾语三元组(例如「巴黎」-「是首都」-「法国」)。现代应用将知识图谱与 LLM 结合,提供事实基础、减少幻觉并支持复杂推理。主要的知识图谱包括 Wikidata、DBpedia,以及 Google、Amazon 和 LinkedIn 等公司使用的企业特定图谱。
主要特点
- 将实体和关系表示为图结构
- 使用主语-谓语-宾语三元组表示事实
- 支持使用 SPARQL 等语言进行语义查询
- 支持基于关系的推理和推断
- 与 LLM 集成实现有基础的 AI 应用
- 可扩展到数十亿事实和实体
常见用途
- 搜索引擎知识面板
- 具有关系感知的推荐系统
- 具有事实基础的问答
- 药物发现和生物医学研究
- 企业知识管理
示例
Loading code...常见问题
知识图谱和数据库有什么区别?
知识图谱将数据存储为相互连接的实体和关系(三元组),支持语义查询和推理。传统数据库将数据存储在具有固定模式的表中。知识图谱擅长表示复杂关系并支持推理,而数据库则针对结构化数据存储和事务操作进行了优化。
知识图谱如何减少 AI 幻觉?
知识图谱通过提供经过验证的结构化信息为大语言模型提供事实基础。当与 RAG(检索增强生成)集成时,它们检索相关事实作为 LLM 的上下文,减少生成错误信息的可能性。图谱的显式关系也有助于保持逻辑一致性。
知识图谱术语中的三元组是什么?
三元组是知识表示的基本单位,由主语-谓语-宾语组成(例如「巴黎」-「是首都」-「法国」)。主语是一个实体,谓语定义关系,宾语可以是另一个实体或字面值。三元组的集合形成图结构。
什么是 SPARQL,它如何与知识图谱一起使用?
SPARQL 是用于 RDF 知识图谱的查询语言,类似于关系数据库的 SQL。它允许您查询三元组模式、过滤结果和遍历关系。SPARQL 支持复杂查询,如「查找所有人口超过 100 万的欧洲国家的首都城市」。
有哪些流行的知识图谱可以使用?
公共知识图谱包括 Wikidata(结构化的维基百科数据)、DBpedia(从维基百科提取)和 Google 知识图谱(为搜索面板提供支持)。构建自定义图谱的流行工具包括 Neo4j(属性图数据库)、Apache Jena(RDF 框架)和 Amazon Neptune(托管图数据库)。