我想知道如何从数据集中删除一些变量,特别是数字和字符串列表。例如。 Test Num0 bam 1321 - 652 creation 473 MAN 324 41 831... ... ...460 Luchino 21461 42 4126 7462 finger 43463 washing 1我想要有类似的东西 Test Num0 bam 1322 creation 47... ... ...460 Luchino 21462 finger 43463 washing 1我(手动)删除了 MAN (它应该包含在字符串列表中,如停用词)、-和数字。我尝试过 isdigit 但它不起作用,所以我确信我的代码中有错误:df['Text'].where(~df['Text'].str.isdigit())对于我的停用词:my_stop=['MAN','-']df['Text'].apply(lambda lst: [x for x in lst if x in my_stop])
添加回答
举报
0/150
提交
取消