我清理了包含 50000 行文本的 csv 文件并标记了每一行。然而,在每一行,单词被分成单独的列:202MAY || 失败 || 领主 || 同行 || 返回 || 新|| 莱维森但我希望每一行都被连接起来,而不是被每个标记化的词分开:202 年 5 月击败的领主同龄人回到新的水平每行中的一列每行都有不同数量的单词,所以不同数量的列,我该如何解决这个问题?
3 回答

Smart猫小萌
TA贡献1911条经验 获得超7个赞
str = "202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON"
print str.replace(' ||', '')

万千封印
TA贡献1891条经验 获得超3个赞
你想要这样的东西吗?
some_text = "202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON".split("||")
print("".join(some_text))
#expected output:
#202MAY DEFEATED LORDS PEERS BACK NEW LEVESON
添加回答
举报
0/150
提交
取消