刚开始使用 Tinkerpop 和 Janusgraph,我正试图根据文档弄清楚这一点。我有三个数据集,每个数据集包含大约 2000 万行(csv 文件)有一个特定的模型,其中变量和行需要连接,例如什么是顶点,什么是标签,什么是边等。在图表中包含所有内容后,我当然想使用一些基本的 Gremlin 来查看模型的工作情况。但首先我需要一种将数据导入 Janusgraph 的方法。可能存在用于此的脚本。但除此之外,它是否可能用python编写,打开一个csv文件,获取变量X的每一行,并将其添加为顶点/边/等。……?还是我完全误解了 Janusgraph/Tinkerpop?提前感谢您的任何帮助。编辑:假设我有几个文件,每个文件包含几百万行,代表人,还有几个变量,代表不同的指标。第一个示例可能如下所示: metric_1 metric_2 metric_3 ..person_1 a e iperson_2 b f jperson_3 c g kperson_4 d h l.. 我是否应该将其转换为具有首先由值组成的节点的文件,[a,...,l]。(以及后来可能更精细的属性集)然后 [a,..., l] 被索引了吗?在“现代”图形这里似乎有一个索引(号码1,...,12对所有的节点和边,独立于它们的重叠标签/类别的),例如应在每次测量单独索引,然后连接至一个给定的person_x他们属于哪个?为这些可能直截了当的问题道歉,但我对此很陌生。
添加回答
举报
0/150
提交
取消