为了账号安全,请及时绑定邮箱和手机立即绑定

为什么NLTK的PoS标记器为单词中的每个字母标记而不是为每个单词标记?

为什么NLTK的PoS标记器为单词中的每个字母标记而不是为每个单词标记?

www说 2021-04-05 13:14:15
说我有这样的句子:I am a boy。我想找出句子中每个单词的词性。这是我的代码:import nltksentence = 'I am a good boy'for word in sentence:    print(word)    print(nltk.pos_tag(word))但这会产生以下输出:I[('I', 'PRP')][(' ', 'NN')]a[('a', 'DT')]m[('m', 'NN')][(' ', 'NN')]a[('a', 'DT')][(' ', 'NN')]g[('g', 'NN')]o[('o', 'NN')]o[('o', 'NN')]d[('d', 'NN')][(' ', 'NN')]b[('b', 'NN')]o[('o', 'NN')]y[('y', 'NN')]因此,我尝试改为这样做:sentence = 'I am a good boy'for word in sentence.split(' '):    print(word)    print(nltk.pos_tag(word))这将产生以下输出:I[('I', 'PRP')]am[('a', 'DT'), ('m', 'NN')]a[('a', 'DT')]good[('g', 'NN'), ('o', 'MD'), ('o', 'VB'), ('d', 'NN')]boy[('b', 'NN'), ('o', 'NN'), ('y', 'NN')]为什么要为每个字母而不是每个单词找到PoS?以及我该如何解决?
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 174 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号