已解决430363个问题，去搜搜看，总会有你想问的

是否可以使用scikit-learn K-Means聚类指定自己的距离函数？

关注

首页猿问是否可以使用scikit-lear...

是否可以使用scikit-learn K-Means聚类指定自己的距离函数？

Python

弑天下 2019-11-07 10:27:10

是否可以使用scikit-learn K-Means聚类指定自己的距离函数？

查看完整描述

3 回答

慕虎7371278

TA贡献1802条经验获得超4个赞

不幸的是，没有：scikit-learn当前的k-means实现仅使用欧几里得距离。

将k均值扩展到其他距离并非易事，并且denis的上述回答并不是为其他度量实施k均值的正确方法。

反对回复 2019-11-07

白衣非少年

TA贡献1155条经验获得超0个赞

只需使用nltk即可，例如

from nltk.cluster.kmeans import KMeansClusterer

NUM_CLUSTERS = <choose a value>

data = <sparse matrix that you would normally give to scikit>.toarray()

kclusterer = KMeansClusterer(NUM_CLUSTERS, distance=nltk.cluster.util.cosine_distance, repeats=25)

assigned_clusters = kclusterer.cluster(data, assign_clusters=True)

反对回复 2019-11-07

3 回答
0 关注
2718 浏览

关注

添加回答

举报

0/150

提交

取消

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号