为了账号安全,请及时绑定邮箱和手机立即绑定

我如何将这个数据框转入这个数据框?

我如何将这个数据框转入这个数据框?

狐的传说 2023-04-11 16:17:02
我怎样才能把df1变成df2?df1 = pd.DataFrame(  {  'item1_aspect1' : ["a", "b", "c"],  'item1_aspect2' : [1,2,3],  'item1_aspect3' : ["[12,34]", "[56,78]", "[99,10]"],  'item2_aspect1' : ["a", "b", "c"],  'item2_aspect2' : [1,2,3],  'item2_aspect3' : ["[12,34]", "[56,78]", "[99,10]"],  'item3_aspect1' : ["a", "b", "c"],  'item3_aspect2' : [1,2,3],  'item3_aspect3' : ["[12,34]", "[56,78]", "[99,10]"]  })df2 = pd.DataFrame({  'aspect_1' : ["a", "b", "c", "a", "b", "c", "a", "b", "c"],  'aspect_2' : [1,2,3,1,2,3,1,2,3],  'aspect_3' : ["[12,34]", "[56,78]", "[99,10]", "[12,34]", "[56,78]", "[99,10]", "[12,34]", "[56,78]", "[99,10]"]})即列名是一个标识符,它分成几行。我不知道该怎么做。
查看完整描述

4 回答

?
胡说叔叔

TA贡献1804条经验 获得超8个赞

我们需要先调整列类型,然后wide_to_long


df1.columns=df1.columns.str.split('_').map(lambda x : '_'.join(x[::-1]))


yourdf=pd.wide_to_long(df1.reset_index(),

                       ['aspect1','aspect2','aspect3'], 

                       i ='index', 

                       j = 'drop', 

                       sep = '_',suffix='\w+').reset_index(drop=True)

Out[137]: 

  aspect1  aspect2  aspect3

0       a        1  [12,34]

1       b        2  [56,78]

2       c        3  [99,10]

3       a        1  [12,34]

4       b        2  [56,78]

5       c        3  [99,10]

6       a        1  [12,34]

7       b        2  [56,78]

8       c        3  [99,10]


查看完整回答
反对 回复 2023-04-11
?
qq_笑_17

TA贡献1818条经验 获得超7个赞

如果你想坚持使用 pandas 操作,不想不断更改数据类型并更喜欢列表理解。试试这个方法 -


lst = list(df1.columns)

n=3

new_cols = ['aspect_1', 'aspect_2', 'aspect_3']


#break the column list into groups of n = 3 in this case

chunks = [lst[i:i + n] for i in range(0, len(lst), n)]


#concatenate the list of dataframes over axis = 0after renaming columns of each 

pd.concat([df1[i].set_axis(new_cols, axis=1) for i in chunks], axis=0, ignore_index=True)

aspect_1    aspect_2    aspect_3

0   a   1   [12,34]

1   b   2   [56,78]

2   c   3   [99,10]

3   a   1   [12,34]

4   b   2   [56,78]

5   c   3   [99,10]

6   a   1   [12,34]

7   b   2   [56,78]

8   c   3   [99,10]


查看完整回答
反对 回复 2023-04-11
?
江户川乱折腾

TA贡献1851条经验 获得超5个赞

获取唯一的尾列名称:

cols = df1.columns.str.split("_").str[-1].drop_duplicates()

在数据框上使用 numpy 的重塑,并创建一个新的数据框:

pd.DataFrame(np.reshape(df1.to_numpy(), df1.shape[::-1]), columns=cols)


aspect1 aspect2 aspect3

0   a   1   [12,34]

1   a   1   [12,34]

2   a   1   [12,34]

3   b   2   [56,78]

4   b   2   [56,78]

5   b   2   [56,78]

6   c   3   [99,10]

7   c   3   [99,10]

8   c   3   [99,10]

或者,我们可以结合使用numpy split和numpy vstack来获得输出:

column_count = df1.columns.str[-1].astype(int).max()


pd.DataFrame(np.vstack(np.split(df1.to_numpy(), column_count, axis=1)), columns=cols)


aspect1 aspect2 aspect3

0   a   1   [12,34]

1   b   2   [56,78]

2   c   3   [99,10]

3   a   1   [12,34]

4   b   2   [56,78]

5   c   3   [99,10]

6   a   1   [12,34]

7   b   2   [56,78]

8   c   3   [99,10]


查看完整回答
反对 回复 2023-04-11
?
万千封印

TA贡献1891条经验 获得超3个赞

这是一个相当简单的方法:


df1.columns = [c[6:] for c in df1.columns]

pd.concat([df1.iloc[:, 0:3], df1.iloc[:, 3:6], df1.iloc[:, 6:9]], axis=0)

输出是:


  aspect1  aspect2  aspect3

0       a        1  [12,34]

1       b        2  [56,78]

2       c        3  [99,10]

0       a        1  [12,34]

1       b        2  [56,78]

...



查看完整回答
反对 回复 2023-04-11
  • 4 回答
  • 0 关注
  • 114 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信