在 Python 中对大型数据集使用 OOP 是否有益？

我正在对两种类型的测量实施卡尔曼滤波器。我每秒 (1Hz) 进行 GPS 测量，一秒 (100Hz) 进行 100 次加速度测量。所以基本上我有两张大桌子，它们必须在某个时候融合在一起。我的目标是：我真的很想写出可读和可维护的代码。我的第一种方法是：两个数据表都有一个类（所以一个对象是一个数据表），我在类方法中进行批量计算（所以我的几乎所有方法都包括一个 for 循环），直到我到达实际过滤器。我发现这种方法有点太僵硬了。它可以工作，但是数据类型转换太多，而且不是那么方便。现在我想更改我的代码。如果我想坚持 OOP，我的第二次尝试是：每一个测量都是 GPS_measurment 或加速测量的对象。这种方法似乎更好，但这样会创建数千个对象。我的第三次尝试是数据驱动设计，但我对这种方法并不十分熟悉。我应该使用哪种范式？或者也许它应该通过上述范式的某种混合来解决？或者我应该使用 Pandas 数据框来使用过程编程？

查看完整描述

2 回答

守着星空守着你

TA贡献1799条经验获得超8个赞

听起来您想使用pandas. 顺便说一句，OOP 是一个概念，而不是你明确地不灵活地编码的东西。一般来说，如果您计划扩展它们或封装某些功能，您只想定义自己的类。pandas并且numpy是 2 个模块，它们几乎可以完成您对数据的所有要求，并且它们的执行速度更快。

反对回复 2021-09-24

热搜

最近搜索清空

在 Python 中对大型数据集使用 OOP 是否有益？

在 Python 中对大型数据集使用 OOP 是否有益？

2 回答

添加回答