我试图将数据框转换为这样的列表。这是转换前的数据框。df_gr = df_com.groupby(['Publication_Year_x', 'UPC', 'CPC']).size().unstack(fill_value=0)df_gr_peryear = df_gr.replace(0, '', regex=True)df_gr_peryear这是我尝试使用此代码的列表list_allyear = [(list(i), v) for i, v in df_gr_peryear.stack().iteritems()]list_allyear = pd.DataFrame(list_allyear, columns=["MOC", "count"])list_allyear这是结果但我只想将它拆分为所有行中的第一个元素。预期的结果将是year MOC count1971 [136,-]1971 [136, A01D] ..1972 [231, H01L] 5我已经尝试过,pd.DataFrame(list_allyear.MOC.values.tolist())但它拆分了行中包含的所有元素
1 回答

慕的地6264312
TA贡献1817条经验 获得超6个赞
只是简化了你的代码,你可以使用fill_value='',而不是replace再创建列表理解一个字典有一个最终的DataFrame:
cols = ['Publication_Year_x', 'UPC', 'CPC']
s = df_com.groupby(cols).size().unstack(fill_value='').stack()
L = [{'year': idx[0], 'MOC': list(idx[1:]), 'count': vals} for idx, vals in s.items()]
list_allyear = pd.DataFrame(L)
添加回答
举报
0/150
提交
取消