为了账号安全,请及时绑定邮箱和手机立即绑定

文本标记器模式的解释

文本标记器模式的解释

ibeautiful 2021-06-05 13:15:35
我想确切地知道在这个标记器中使用指定的模式对文本做了什么:from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'[a-zA-Z]\w+\'?\w*')text_token = text.apply(tokenizer.tokenize)其中“text”是一个熊猫系列,每一行都是一个句子。我特别想了解r'[a-zA-Z]\w+\'?\w '* 部分。详细信息(每个组件的解释)将不胜感激。
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 124 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信