假设我有以下带有一些示例行的DataFrame: id first_name last_name age 0 1 John Doe 18 1 2 Joe Shmuck 21假设我还有一个自定义的Python类Person,它应该代表上面的DataFrame的值。为了方便起见,DataFrame的列名与该类的属性完全对应。class Person: id first_name last_name age我知道我可以通过提供列索引或列名称来直接从(数据帧的)行中检索值,例如:df.iloc[0]['age']但是,我希望在我的整个应用程序和调用中有一个稍微安全些的编码实践,person.age甚至最好是一个getter person.get_age()。我正在做的唯一的原始方法是遍历DataFrame的一行的列,检索每个单元格并将它们逐个分配给新Person对象的变量。例如:person.first_name = df.loc[0]['first_name']DataFrame或Series或任何其他Python库提供了有用的工具来简化此过程吗?即一些如意算盘person = df.loc[0].transform(type=Person)
1 回答
小怪兽爱吃肉
TA贡献1852条经验 获得超1个赞
您真的需要一堂课吗?您可以df.itertuples用来创建“ Person”namedtuple的列表:
>>> list(df.itertuples(index=False, name='Person'))
[Person(id=1, first_name='John', last_name='Doe', age=18),
Person(id=2, first_name='Joe', last_name='Shmuck', age=21)
]
在您可以访问其属性(p.age,p.id等)的意义上,namedtuple的行为与类非常相似。
for p in df.itertuples(index=False, name='Person'):
print(p.first_name)
John
Joe
添加回答
举报
0/150
提交
取消