为了账号安全,请及时绑定邮箱和手机立即绑定

具有 2 种不同数据类型的结构化 numpy 数组

具有 2 种不同数据类型的结构化 numpy 数组

千巷猫影 2023-06-27 13:38:16
我将 csv 文件导入到 numpy 数组中,需要将其转换为结构化数组,其中仅第一列作为 dtype 字符串,所有其他 47 列作为 float。如何在单个操作中定义其他 47 列的数据类型?我是否必须逐列指定 dtype?
查看完整描述

1 回答

?
繁华开满天机

TA贡献1816条经验 获得超4个赞

您可以像结构化数组一样读取源文件。

假设您输入的文件包含:

  • 一个字符串字段,命名为Id

  • 只有四个 浮点字段,分别命名为F1F2等。

所以它的内容是:

ABCD,160.72,180.21,260.13,451.48

EFGH,252.42,132.21,150.11,612.56

IJKL,541.77,455.21,268.76,543.81

要读取这样的文件,您可以使用np.loadtxt方法,将dtype作为结构化类型(定义列表)传递,可以在列表理解中生成:


nFloats = 4

a = np.loadtxt('Input.csv', delimiter=',',

    dtype=[('Id', 'U10')] + [( f'F{i+1}', '<f4' ) for i in range(nFloats)])

请注意,我传递了U10作为Id列的类型(10 个字符)。如果需要,请设置该字段的其他大小。


结果是:


array([('ABCD', 160.72, 180.21, 260.13, 451.48),

       ('EFGH', 252.42, 132.21, 150.11, 612.56),

       ('IJKL', 541.77, 455.21, 268.76, 543.81)],

      dtype=[('Id', '<U10'), ('F1', '<f4'), ('F2', '<f4'), ('F3', '<f4'), ('F4', '<f4')])

当然,在代码的目标版本中相应地增加nFloats(可能应该是47)。


查看完整回答
反对 回复 2023-06-27
  • 1 回答
  • 0 关注
  • 78 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信