对于一种商品:http://product.dangdang.com/23477630.html用什么算法能知道他和另一家网站的http://www.amazon.cn/gp/product/B00KFM43CO/ref=s9_wish_gw_d66_g14_i1_gs9w?ie=UTF8&colid=39NFRLNN4TZIE&coliid=I8RBEPEFXAQE3&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=center-2&pf_rd_r=123EVCKD7936886JAY79&pf_rd_t=101&pf_rd_p=212028152&pf_rd_i=899254051是同一种商品呢?
2 回答
尚方宝剑之说
TA贡献1788条经验 获得超4个赞
正好接触过这方面的东西.这个问题属于Recordlinkage范畴.可以参考一下StanfordEntityResolutionFramework.这里有个文档比较好,可以看看.
添加回答
举报
0/150
提交
取消