我的数据框有两列(l_cats 和 r_cats),类型为 np 数组。这是示例数据l_name,l_cats,l_gh,r_name,r_cats,r_gh,scorepiggly wiggly,1|2|4|0|0,1,piggly wiggly,1|2|4|3|0,1,1piggly wiggly,1|2|4|0|0,1,piggly wiggly,1|2|4|3|0,1,1piggly wiggly,1|2|4|0|0,1,piggly wiggly,1|2|4|3|0,1,1piggly wiggly,1|2|4|0|0,1,piggly wiggly,1|2|4|3|0,1,1..................................<79 rows>下面是我如何将数据读入这两列 data = pd.read_csv(self.path, converters={'l_cats': lambda x: np.array([y for y in x.split('|')]), 'r_cats': lambda x: np.array([y for y in x.split('|')])})flat = data['l_cats'].valuesprint(str(flat.shape))# Output: (79,)print(str(flat[0].shape))# Output: (5,)print(str(type(flat[0])))# Output: <class 'numpy.ndarray'>的输出不应该print(str(flat.shape))是 (79, 5) 吗?
1 回答
交互式爱情
TA贡献1712条经验 获得超3个赞
不,不应该。
如果你只是这样做,print(flat)你应该明白为什么。这是flat:
[array(['1', '2', '4', '0', '0'], dtype='<U1')
array(['1', '2', '4', '0', '0'], dtype='<U1')
array(['1', '2', '4', '0', '0'], dtype='<U1')
array(['1', '2', '4', '0', '0'], dtype='<U1')]
如您所见,它不是二维矩阵,而是一维数组或一维数组。要将其转换为 2D 矩阵,您可以执行以下操作:
mtx = np.stack(flat)
添加回答
举报
0/150
提交
取消