4 回答

TA贡献1804条经验 获得超8个赞
我们需要先调整列类型,然后wide_to_long
df1.columns=df1.columns.str.split('_').map(lambda x : '_'.join(x[::-1]))
yourdf=pd.wide_to_long(df1.reset_index(),
['aspect1','aspect2','aspect3'],
i ='index',
j = 'drop',
sep = '_',suffix='\w+').reset_index(drop=True)
Out[137]:
aspect1 aspect2 aspect3
0 a 1 [12,34]
1 b 2 [56,78]
2 c 3 [99,10]
3 a 1 [12,34]
4 b 2 [56,78]
5 c 3 [99,10]
6 a 1 [12,34]
7 b 2 [56,78]
8 c 3 [99,10]

TA贡献1818条经验 获得超7个赞
如果你想坚持使用 pandas 操作,不想不断更改数据类型并更喜欢列表理解。试试这个方法 -
lst = list(df1.columns)
n=3
new_cols = ['aspect_1', 'aspect_2', 'aspect_3']
#break the column list into groups of n = 3 in this case
chunks = [lst[i:i + n] for i in range(0, len(lst), n)]
#concatenate the list of dataframes over axis = 0after renaming columns of each
pd.concat([df1[i].set_axis(new_cols, axis=1) for i in chunks], axis=0, ignore_index=True)
aspect_1 aspect_2 aspect_3
0 a 1 [12,34]
1 b 2 [56,78]
2 c 3 [99,10]
3 a 1 [12,34]
4 b 2 [56,78]
5 c 3 [99,10]
6 a 1 [12,34]
7 b 2 [56,78]
8 c 3 [99,10]

TA贡献1851条经验 获得超5个赞
获取唯一的尾列名称:
cols = df1.columns.str.split("_").str[-1].drop_duplicates()
在数据框上使用 numpy 的重塑,并创建一个新的数据框:
pd.DataFrame(np.reshape(df1.to_numpy(), df1.shape[::-1]), columns=cols)
aspect1 aspect2 aspect3
0 a 1 [12,34]
1 a 1 [12,34]
2 a 1 [12,34]
3 b 2 [56,78]
4 b 2 [56,78]
5 b 2 [56,78]
6 c 3 [99,10]
7 c 3 [99,10]
8 c 3 [99,10]
或者,我们可以结合使用numpy split和numpy vstack来获得输出:
column_count = df1.columns.str[-1].astype(int).max()
pd.DataFrame(np.vstack(np.split(df1.to_numpy(), column_count, axis=1)), columns=cols)
aspect1 aspect2 aspect3
0 a 1 [12,34]
1 b 2 [56,78]
2 c 3 [99,10]
3 a 1 [12,34]
4 b 2 [56,78]
5 c 3 [99,10]
6 a 1 [12,34]
7 b 2 [56,78]
8 c 3 [99,10]

TA贡献1891条经验 获得超3个赞
这是一个相当简单的方法:
df1.columns = [c[6:] for c in df1.columns]
pd.concat([df1.iloc[:, 0:3], df1.iloc[:, 3:6], df1.iloc[:, 6:9]], axis=0)
输出是:
aspect1 aspect2 aspect3
0 a 1 [12,34]
1 b 2 [56,78]
2 c 3 [99,10]
0 a 1 [12,34]
1 b 2 [56,78]
...
添加回答
举报