为了账号安全,请及时绑定邮箱和手机立即绑定

基于其他列在数据框中标记文本和计数

基于其他列在数据框中标记文本和计数

UYOU 2022-07-26 21:50:22
我需要标记数据,但似乎真的很混乱。我有这样的数据:TEXT               Author               DateThis is a Cat       Jane                 1.01.1997This is a Dog       Sara                 1.02.2009I have a cat        Lesner               5.07.2001我需要这样的输出:Date:1.01.1997    This1.01.1997    is1.01.1997     a1.01.1997    cat....有没有办法实现这样的输出?
查看完整描述

1 回答

?
牛魔王的故事

TA贡献1830条经验 获得超3个赞

Series.str.splitSeries.explodepandas 0.25+ 中使用Series


s = df.set_index('Date')['TEXT'].str.split().explode()

print (s)

Date

1.01.1997    This

1.01.1997      is

1.01.1997       a

1.01.1997     Cat

1.02.2009    This

1.02.2009      is

1.02.2009       a

1.02.2009     Dog

5.07.2001       I

5.07.2001    have

5.07.2001       a

5.07.2001     cat

Name: TEXT, dtype: object

如果想要 2 列DataFrame添加Series.reset_index


df = s.reset_index(name='text')

print (df)

         Date  text

0   1.01.1997  This

1   1.01.1997    is

2   1.01.1997     a

3   1.01.1997   Cat

4   1.02.2009  This

5   1.02.2009    is

6   1.02.2009     a

7   1.02.2009   Dog

8   5.07.2001     I

9   5.07.2001  have

10  5.07.2001     a

11  5.07.2001   cat


查看完整回答
反对 回复 2022-07-26
  • 1 回答
  • 0 关注
  • 108 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号