为了账号安全,请及时绑定邮箱和手机立即绑定

将处理过的 Pandas DataFrames 添加在一起

将处理过的 Pandas DataFrames 添加在一起

30秒到达战场 2021-09-02 14:43:17
我试图在 Python 中将两个 DataFrame 添加在一起,首先将它们的索引列设置为等于现有列之一。但是,在以下线程中使用评分最高的方法会出现错误:这是问题的一个简单示例:import pandas as pdimport numpy as npa = np.array([['A',1.,2.,3.],['B',1.,2.,3.],['C',1.,2.,3.]])a = pd.DataFrame(a)a = a.set_index(0)a      1    2    30               A  1.0  2.0  3.0B  1.0  2.0  3.0C  1.0  2.0  3.0b = np.array([['A',1.,2.,3.],['B',1.,2.,3.]])b = pd.DataFrame(b)b.set_index(0)b     1    2    30               A  1.0  2.0  3.0B  1.0  2.0  3.0df_add = a.add(b,fill_value=1)和错误:Traceback (most recent call last):  File "<ipython-input-150-885d92411f6c>", line 1, in <module>    df_add = a.add(b,fill_value=1)  File "/home/anaconda3/lib/python3.6/site-packages/pandas/core/ops.py", line 1234, in f    return self._combine_frame(other, na_op, fill_value, level)  File "/home/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py", line 3490, in _combine_frame    result = _arith_op(this.values, other.values)  File "/home/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py", line 3459, in _arith_op    return func(left, right)  File "/home/anaconda3/lib/python3.6/site-packages/pandas/core/ops.py", line 1195, in na_op    result[mask] = op(xrav, yrav)TypeError: must be str, not int任何有关防止此问题的帮助将不胜感激。
查看完整描述

1 回答

?
慕田峪9158850

TA贡献1794条经验 获得超7个赞

问题出在已定义的 DataFrame 中 - 所有数据都转换为 2d numpy 数组中的字符串:


a = np.array([['A',1.,2.,3.],['B',1.,2.,3.],['C',1.,2.,3.]])

print (a)

[['A' '1.0' '2.0' '3.0']

 ['B' '1.0' '2.0' '3.0']

 ['C' '1.0' '2.0' '3.0']]

解决方案是删除字符串值并按列表指定索引:


a = np.array([[1.,2.,3.],[1.,2.,3.],[1.,2.,3.]])

a = pd.DataFrame(a, index=list('ABC'))


b = np.array([[1.,2.,3.],[1.,2.,3.]])

b = pd.DataFrame(b, index=list('AB'))


df_add = a.add(b,fill_value=1)

print (df_add)

     0    1    2

A  2.0  4.0  6.0

B  2.0  4.0  6.0

C  2.0  3.0  4.0

或者在将 index 设置为floats后转换 DataFrames :


a = np.array([['A',1.,2.,3.],['B',1.,2.,3.],['C',1.,2.,3.]])

a = pd.DataFrame(a)

a = a.set_index(0).astype(float)


b = np.array([['A',1.,2.,3.],['B',1.,2.,3.]])

b = pd.DataFrame(b)

b = b.set_index(0).astype(float)


df_add = a.add(b,fill_value=1)

print (df_add)

     1    2    3

0               

A  2.0  4.0  6.0

B  2.0  4.0  6.0

C  2.0  3.0  4.0


查看完整回答
反对 回复 2021-09-02
  • 1 回答
  • 0 关注
  • 136 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信