已解决430363个问题，去搜搜看，总会有你想问的

按模式精确过滤熊猫

首页猿问按模式精确过滤熊猫

按模式精确过滤熊猫

Python

SMILET 2022-08-16 16:37:17

我正在尝试按字符串中是否有单词来过滤数据框，我尝试了以下方法：text="Abacus and androgeny and for"tokenized = tknzr.tokenize(text.lower())pattern= "|".join(tokenized)lexicon = lexicon[lexicon["English (en)"].str.match(pattern, na = False)]这实际上不起作用，因为以“for”开头的单词（如伪造）会匹配。为了清楚起见，我只需要与文本中的某个单词完全匹配的行。

查看完整描述

1 回答

牧羊人nacy

TA贡献1862条经验获得超7个赞

如果我正确理解你，你只是使用匹配来确定列中的单词是否是文本中的单词之一？如果是这样 - 我会尝试：

lexicon = lexicon[lexicon["English (en)"].isin(tokenized)]

这样，匹配项将出现在确切的单词上，因为它会将其与单词列表进行比较。

反对回复 2022-08-16

1 回答
0 关注
137 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

按模式精确过滤熊猫

按模式精确过滤熊猫

1 回答

添加回答