为了账号安全,请及时绑定邮箱和手机立即绑定

句子被标记为 pandas 中的单词,但索引从 0 到第一句的长度,第二句的索引从 0 开始

句子被标记为 pandas 中的单词,但索引从 0 到第一句的长度,第二句的索引从 0 开始

潇潇雨雨 2023-05-23 10:30:42
我有一个 python df,     DF1 = Index  Words    Tags             0      I       O             1     Love     B             2     India    I             0    Flowers   B             1      are     O             2   Beautiful  B我希望输出是   DF1 = Index  Words    Tags   Sent             0      I       O    1             1     Love     B    1             2     India    I    1             0    Flowers   B    2             1      are     O    2             2   Beautiful  B    2我想要一个df
查看完整描述

1 回答

?
慕勒3428872

TA贡献1848条经验 获得超6个赞

试试这个,pandas.DataFrame.Shift创建一个布尔掩码并应用pandas.Series.cumsum

df['Sent'] = (df.Index - df.Index.shift()).lt(0).cumsum() + 1

   Index      Words Tags  Sent

0      0          I    O     1

1      1       Love    B     1

2      2      India    I     1

3      0    Flowers    B     2

4      1        are    O     2

5      2  Beautiful    B     2


查看完整回答
反对 回复 2023-05-23
  • 1 回答
  • 0 关注
  • 73 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信