我无法将文本文档拆分为数据框中的多个句子并为每个句子创建行,而其他列值应该相同。让我解释一下:最初A | B | C | D
-------------
x | A.B | x | x
y | C.D.E | y | y我想要什么(在 B 列中拆分文本后)A | B | C | D
-------------
x | A | x | x
x | B | x | x
y | C | y | y
y | D | y | y
y | E | y | y到目前为止我做了什么?我已成功使用 split() 方法将文本文档拆分为不同的句子。现在我陷入了第二部分。非常感谢您的帮助。
1 回答
holdtom
TA贡献1805条经验 获得超10个赞
使用str.split('.')和explode():
str.split('.')返回一个列表以准备爆炸。爆炸需要列中的列表格式才能工作。
df['B'] = df['B'].str.split('.')
df
Out[10]:
A B C D
0 x [A, B] x x
1 y [C, D, E] y y
然后分解列表,将列作为参数传递,表示要根据该列分解数据框:
df['B'] = df['B'].str.split('.')
df = df.explode('B')
df
Out[11]:
A B C D
0 x A x x
0 x B x x
1 y C y y
1 y D y y
1 y E y y
添加回答
举报
0/150
提交
取消