为了账号安全,请及时绑定邮箱和手机立即绑定

tf-idf 病态学习将“词”与词分开

tf-idf 病态学习将“词”与词分开

哆啦的时光机 2021-06-27 12:47:00
我与在那里如果是在这种格式中找到的单词在文本分类问题工作的“字”,将有不同的重要性,从如果以这种格式发现字 ,所以我尝试这个代码    import re    from sklearn.feature_extraction.text import CountVectorizer    sent1 = "The cat sat on my \"face\" face"    sent2 = "The dog sat on my bed"    content = [sent1,sent2]    vectorizer = CountVectorizer(token_pattern=r"(?u)\b\w\w+\b|!|\?|\"|\'")    vectorizer.fit(content)    print (vectorizer.get_feature_names()) 结果是    ['"', 'bed', 'cat', 'dog', 'face', 'my', 'on', 'sat', 'the']我希望它在的地方    ['bed', 'cat', 'dog', 'face','"face"' 'my', 'on', 'sat', 'the']
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 106 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号