Python是如何判断大数据唯一性的呢
1 回答
眼眸繁星
TA贡献1873条经验 获得超9个赞
有些办法。比如使用array, numpy.array。 主要的思路是节约内存的使用,同时提高数据查询的效率。 如果能够注意这些内容,处理几个GB的数据还是轻松的。 接下来就是分布式计算。 按mapreduce的思路。数据尽量在本地处理。所以算法上要优化。
- 1 回答
- 0 关注
- 1010 浏览
添加回答
举报
0/150
提交
取消