第一次问题在这里,再简单描述一下:基于probalistic latent semantic indexing(plsa)做图像检索,需要计算一个条件概率p(z|w,v,d),我直接定义成了“double pzdwtwv[][][][];”简单地说,z是主题,w是英文单词,v是视觉单词,d是文档,大小分别为12100500*7000,就是12个主题,100个英文单词,500个视觉单词,7000个文档,double型的话算下来大概32G,其中z和d的数目是确定的,每个d的w和v的数目是不确定的。因为数组不能全部放进内存,所以之前把他放在mongodb数据库中,但是速度太慢,现在尝试用文件存储,现看了一下java编程思想,感觉应该使用内存映射文件,具体的思路是把这个四维数组拆分成几个内存映射文件,用几个线程一起处理。 不知道应该注意什么,求大神指教
添加回答
举报
0/150
提交
取消