为了账号安全,请及时绑定邮箱和手机立即绑定

使用特定模型通过 Tinkerpop 将(数百万行)数据导入 Janusgraph 的最佳方法

使用特定模型通过 Tinkerpop 将(数百万行)数据导入 Janusgraph 的最佳方法

慕莱坞森 2021-08-17 10:39:35
刚开始使用 Tinkerpop 和 Janusgraph,我正试图根据文档弄清楚这一点。我有三个数据集,每个数据集包含大约 2000 万行(csv 文件)有一个特定的模型,其中变量和行需要连接,例如什么是顶点,什么是标签,什么是边等。在图表中包含所有内容后,我当然想使用一些基本的 Gremlin 来查看模型的工作情况。但首先我需要一种将数据导入 Janusgraph 的方法。可能存在用于此的脚本。但除此之外,它是否可能用python编写,打开一个csv文件,获取变量X的每一行,并将其添加为顶点/边/等。……?还是我完全误解了 Janusgraph/Tinkerpop?提前感谢您的任何帮助。编辑:假设我有几个文件,每个文件包含几百万行,代表人,还有几个变量,代表不同的指标。第一个示例可能如下所示:             metric_1    metric_2    metric_3    ..person_1        a           e           iperson_2        b           f           jperson_3        c           g           kperson_4        d           h           l..        我是否应该将其转换为具有首先由值组成的节点的文件,[a,...,l]。(以及后来可能更精细的属性集)然后 [a,..., l] 被索引了吗?在“现代”图形这里似乎有一个索引(号码1,...,12对所有的节点和边,独立于它们的重叠标签/类别的),例如应在每次测量单独索引,然后连接至一个给定的person_x他们属于哪个?为这些可能直截了当的问题道歉,但我对此很陌生。
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 191 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信