CMS项目数据量大多超10w,有的数据量达到100w以上!这种大数据量的情况下如何实现计算每篇文章跟剩余文章的相似度?求大神指教下!之前的做法是先把所有数据从数据库查出来,放在List里边,然后遍历循环跟剩余的对比,尴尬的是数据量一大直接卡死 查看完整描述