知识图谱社区分为支持RDF的人和喜欢属性图的人。对于每一个开始图项目的人来说,选择哪一个是一个终极问题。这个问题甚至比选择伴侣还要关键!!!图模型决定了所有方面——基础设施、工具和方法,并且影响招聘和团队决策。这导致了一场没有赢家的圣战,双方各不相让。
这种类型的决定让人害怕,错误的代价不仅是金钱,还可能让整个组织崩溃。
我们如何才能在不付出过高代价的情况下让模型变更更可行?我们在2024年举行的连接数据伦敦大会上讨论了一个想法,即在RDF存储之上构建属性图的分层视图。Oracle做得更多,甚至在上面构建了属性图和RDF视图。
一些组织会对 LPG 进行实时翻译成 RDF。对于大型图而言,这可能会占用大量空间和计算资源。
只是RDF?!注:
在99%的情况下,当你问你的本体应该用什么时,你会得到一个答案——使用RDF!!!RDF可以作为一个基础,但再定义太冗长了。它会产生一个更复杂和混乱的图谱,需要越来越多的三元组来描述关系,并且带有越来越多的预设条件。
当RDF在比赛中输给了LPG
- 边属性和元数据
- 简洁的数据模型和简洁性
- 复杂N关系建模
- 多层结构查询
终点并没有将 LPG 与 RDF 结合在一起,而是那些重度使用 RDF 的人在二进制 HDT 之上构建数据库。
HDT - RDF的HDT(二进制格式),一种紧凑的数据结构和RDF的二进制序列化格式,详情请见HDT 和 Terminus 都值得一篇介绍,其中一个重要特性是它提供了一个基于链接数据文档和 JSON-LD 的图形建模框架。我们可以用 JSON-LD 文档来构建属性图。
MillenniumDB: 领域图 / 多层图结构多级图是第一篇提供足够抽象模型的论文和模型,能够概括LPG、RDF和RDF*模型。
这个想法的核心非常简单:我们构建了一个由层组成的图,其中第0层类似于RDF三元组(主语-谓语-宾语),但有一个小的扩展,我们在三元组中添加了一个边ID,将其变为四元组。第0层不使用边ID。第1层则做了一些神奇的事——它使用第0层的边和节点,并允许在边上添加三元组。这使我们能够为边添加属性和元数据,从而构建了一个更强大的类似RDF*的结构。它还允许我们对图进行逻辑层(如时间或多上下文数据)的管理。
多层图的一个实际应用场景就是MilleniumDB的领域图模型。
MillenniumDB:一个持久的、开源的、图数据库 在这里,我们介绍了MillenniumDB:一个新颖的图数据库系统,该系统具有模块化、持久性和开源特性…arxiv.orgMillennium DB 允许使用 RDF 或 LPG 模型,但现在还不支持切换或混合它们,而是实现了可在多层图之上互换的领域图模型。
GitHub - MillenniumDB/MillenniumDB: 属性图和RDF引擎,该项目仍在开发中 海王星项目:声明图谱 图数据模型间的桥梁:RDF、RDF-star 和属性图作为有向无环图 今天图数据库用户面临着在 RDF 和等… arxiv.org还有一个更健壮的模型将LPG和RDF结合起来,来自亚马逊和Neptun数据库。该模型的核心是一个StatementGraph,它的组成是节点,每个节点有一个输入边和三个固定的输出边,分别指向谓词和对象-主体关系。
RDF 图也是一种结构化的图。
LPG图作为结构化的图
声明图不仅能够对RDF和LPG进行建模,还能对以前无法表示的模型进行建模。
在RDF、RDF-star和LPG之外:表示航班数据的声明图并不是一个OneGraph视图。需要注意的是,主题边用空心箭头来表示,谓词关系边用双箭表示,而客体边用单箭表示。
请看看如何在关系型数据库中建模
关系模型中的多层图在我的前一篇文章中,我讨论了如何在单一模型中统一属性图和RDF存储的模型和策略。volodymyrpavlyshyn.medium.com 结论部分:结构化和领域特定的图支持一种能够融合RDF和LPG的异构模型,并且将有助于在未来有效地转换和计算图模型。目前我们的数据库还没有达到这一水平,但我们可以看到明显的趋势向更好的模型发展。
感谢你加入我们社区在你走之前:
- 记得给作者 点赞 并 关注 哦 👏
- 关注我们: X | 领英 | YouTube | 邮件通讯 | 播客节目
- 试试 CoFeed,智能地了解最新的科技资讯 🧪
- 在 Differ 上免费创建自己的 AI 智能博客 🚀
- 加入我们的 Discord 内容创作者社区 🧑💻
- 更多精彩内容,请访问 plainenglish.io + stackademic.com
共同学习,写下你的评论
评论加载中...
作者其他优质文章