有人可以建议哪种数据库更适合存储文本信息,例如用python编写的NLP项目中使用的语音序列,依存关系,句子等部分。现在,此信息存储在文件中,并且每次都需要对其进行解析,以提取所提到的块,这些块将用作下一个处理阶段的输入。考虑的选项-MongoDB,Cassandra和MySQL。NoSQL数据库在这种类型的应用程序中是否更好。谢谢。
1 回答

喵喔喔
TA贡献1735条经验 获得超5个赞
这实际上取决于要存储的内容以及将对这些数据执行的操作。
SQL与NoSQL是一个非常基本的决定,在这里没人能给您一个很好的建议。如果您的数据非常适合关系模型,则可以选择SQL(PostgreSQL或MySQL)。如果您的数据更像文档,请使用MongoDB。
就是说,最近我做了一个搜索引擎。我们必须存储索引页面(原始文本),相同的文本但标记化的内容和一些其他元数据。MongoDB的表现非常好。
添加回答
举报
0/150
提交
取消