通常,对我来说,首先从服务器上的 SQL 数据库加载数据,然后在我的计算机上使用 pandas 进行操作。然而,许多其他人首先在 SQL 中预处理一些数据(如case等),然后用 pandas 预处理其余数据。所以我想知道哪个更好,为什么?谢谢!
1 回答
www说
TA贡献1775条经验 获得超8个赞
这个问题很笼统。要获得更具体的答案,我们需要更多地了解您的设置。
我做了一些假设来回答您的问题:我假设您的数据库正在服务器上运行,并且您的 python 代码在您的本地机器上执行。
在这种情况下,您必须至少考虑两件事:
通过网络传输数据
数据处理
如果发出一般的 SQL 请求,则会通过网络传输大量数据。接下来,您的机器必须处理数据。您的本地计算机可能不如服务器强大。
另一方面,如果你提交一个特定的 SQL 请求,强大的服务器可以处理数据,只返回你真正感兴趣的数据。
SQL 查询可能会变得冗长且难以理解,因为您必须将其作为一条语句传递。在 python 中,您可以通过多行代码处理数据。
添加回答
举报
0/150
提交
取消