为了账号安全,请及时绑定邮箱和手机立即绑定

Python:用一列麻木数组填充熊猫数据帧的一行

Python:用一列麻木数组填充熊猫数据帧的一行

青春有我 2022-09-13 10:15:45
我有一个熊猫数据帧(1413行)和一个numpy数组(1412行)。type(df1)Out[193]: pandas.core.frame.DataFramedf1.shapeOut[194]: (1413, 15)type(arr1)Out[195]: numpy.ndarrayarr1.shapeOut[196]: (1412, 3)我想用arr1 + nan中的列填充df1中的列,但它不起作用df1['aaa'] = np.vstack((np.nan, arr1[:,0]))任何人都可以让我知道如何做吗?
查看完整描述

4 回答

?
杨__羊羊

TA贡献1943条经验 获得超7个赞

使用numpy.hstack向数组添加一个值:1d


df1 = pd.DataFrame({'a': range(6)})


arr1 = np.arange(15).reshape(5,3)

print (arr1)

[[ 0  1  2]

 [ 3  4  5]

 [ 6  7  8]

 [ 9 10 11]

 [12 13 14]]


df1['aaa'] = np.hstack((np.nan, arr1[:,0]))

print (df1)

   a   aaa

0  0   NaN

1  1   0.0

2  2   3.0

3  3   6.0

4  4   9.0

5  5  12.0

如果可能,另一个想法是使用具有索引的构造函数:DataFrameSeriesdf1.index


df1 = pd.DataFrame({'a': range(6)}, index=list('abcdef'))


arr1 = np.arange(15).reshape(5,3)

print (arr1)

[[ 0  1  2]

 [ 3  4  5]

 [ 6  7  8]

 [ 9 10 11]

 [12 13 14]]


dif = df1.shape[0] - arr1.shape[0]

df1['aaa'] = pd.Series(arr1[:,0], index=df1.index[dif:])

print (df1)

   a   aaa

a  0   NaN

b  1   0.0

c  2   3.0

d  3   6.0

e  4   9.0

f  5  12.0

最后位置:


dif = df1.shape[0] - arr1.shape[0]

df1['aaa'] = pd.Series(arr1[:,0], index=df1.index[:-dif])

print (df1)

   a   aaa

a  0   0.0

b  1   3.0

c  2   6.0

d  3   9.0

e  4  12.0

f  5   NaN

编辑:


arr1 = np.arange(15).reshape(5,3)

df1 = pd.DataFrame({'a': range(6)})

如果选择只得到带有形状的数组,那么就有必要 numpy.hstack:01d(6,)


a = np.hstack((np.nan, arr1[:,0]))

print (a)

[nan  0.  3.  6.  9. 12.]


print (a.shape)

(6,)


df1['aaa'] = a

如果通过获取具有形状的尺寸的数组来选择,则可以使用numpy.vstack:[0]2dMxN(6,1)


a1 = np.vstack((np.nan, arr1[:,[0]]))

print (a1)

[[nan]

 [ 0.]

 [ 3.]

 [ 6.]

 [ 9.]

 [12.]]


print (a1.shape)

(6, 1)



df1['aaa1'] = a1

print (df1)

   a   aaa  aaa1

0  0   NaN   NaN

1  1   0.0   0.0

2  2   3.0   3.0

3  3   6.0   6.0

4  4   9.0   9.0

5  5  12.0  12.0   


查看完整回答
反对 回复 2022-09-13
?
弑天下

TA贡献1818条经验 获得超8个赞

虽然我可以看到其他几个答案,但没有一个真正解决了手头的问题。直观地说,你的方法是可以的;您正在列数组上垂直堆叠。nan

df1['aaa'] = np.vstack((np.nan, arr1[:,0]))

它应该工作,但它没有。这里的小问题是搜索列维度。 具有形状 ;它没有第二个维度。简单地重塑它将使工作正常。vstackarr1[:,0](1412, )(1412,1)vstack

df1['aaa'] = np.vstack((np.nan, arr1[:,0].reshape(-1,1)))


查看完整回答
反对 回复 2022-09-13
?
四季花海

TA贡献1811条经验 获得超5个赞

你可以这样做,这里有结果。添加列,第一行是 NaN:


df['aaa'] = pd.Series(ar1[:,0])

ea = np.empty(df.shape[1]).fill(np.nan)

df.loc[-1] = ea

df.index = df.index + 1

df = df.reset_index(drop=True).sort_values(by=['aaa'], na_position='first')

这是您的数据框架:


c1  c2  c3

0   1   2   3

1  10  20  30

下面是数组:


[[  5  55]

 [ 50 550]]

结果是这样的:


     c1    c2    c3   aaa

2   NaN   NaN   NaN   NaN

0   1.0   2.0   3.0   5.0

1  10.0  20.0  30.0  50.0


查看完整回答
反对 回复 2022-09-13
?
POPMUISE

TA贡献1765条经验 获得超5个赞

您可以使用 np.附加

df1['aaa'] = np.append(np.nan, arr1[:,0])


查看完整回答
反对 回复 2022-09-13
  • 4 回答
  • 0 关注
  • 86 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信