为了账号安全,请及时绑定邮箱和手机立即绑定

两个数据框的特定列的总和值

两个数据框的特定列的总和值

慕莱坞森 2022-07-26 10:29:19
我想对两个数据框的特定列求和。例如:df1 = pd.DataFrame({'a': [1,1,1], 'b': [1,1,1], 'c':['dd','ee','ff'], 'd':[1,1,1]})df2 = pd.DataFrame({'a': [1,1,1], 'b': [1,1,1], 'c':['dd','ee','ff'], 'd':[1,1,1]})所以我只想总结a,b和d列而不是c。输出 :a b c  d2 2 dd 22 2 ee 22 3 ff 2有什么解决办法吗?谢谢
查看完整描述

3 回答

?
小怪兽爱吃肉

TA贡献1852条经验 获得超1个赞

我使用 add 方法和combine_first方法来获得结果。select_dtypes允许基于数据类型的操作。


(df1

.add(df2.select_dtypes(include='number'))

.combine_first(df1)

)


    a   b   c   d

0   2   2   dd  2

1   2   2   ee  2

2   2   2   ff  2


查看完整回答
反对 回复 2022-07-26
?
慕的地10843

TA贡献1785条经验 获得超8个赞

尝试这个 :


column_names = df1.columns.tolist()


columnTotal_dict = {}


for name in colum_names:

    try:

        df1[[name]] = df1[[name]].astype(int)

        df2[[name]] = df2[[name]].astype(int)


        sumCol_a_df1 = df1['a'].sum()

        sumCol_a_df2 = df2['a'].sum()

        columnTotal_dict[name] = sumCol_a_df1 + sumCol_a_df2

    except ValueError:

        print("Data in this column are not of type int. Skipping")


查看完整回答
反对 回复 2022-07-26
?
收到一只叮咚

TA贡献1821条经验 获得超4个赞

可以试试(假设列c可以取自第一个数据框)


>>> mask = ['a', 'b', 'd']

>>> df_out = df1[mask] + df2[mask]

>>> df_out['c'] = df1['c']

>>> df_out

   a  b  d   c

0  2  2  2  dd

1  2  2  2  ee

2  2  2  2  ff


查看完整回答
反对 回复 2022-07-26
  • 3 回答
  • 0 关注
  • 70 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信