3 回答
TA贡献1875条经验 获得超5个赞
您可以添加运行第二行后收到的输出/错误吗?您可以添加用于创建cdc_new
变量的行吗?
您已经创建了变量cdc_new
吗?尝试运行:
cdc_new.head()
查看您的数据是否与您正在查询的表匹配。
如果是这样,您应该能够运行:
cdc_new[(cdc_new.Industry_type=='Hospitals') & (cdc_new.Employee_Insurance_Premium=='Decreased')]
您的代码的其余部分看起来不错。您不需要将其包装起来,pd.DataFrame()
因为存储在其中的数据cdc_new
应该已经是DataFrame
.
如果遇到问题,请仔细检查运行 SQL 查询时是否获得输出以及变量中的数据cdc_new
是否与数据表匹配。
TA贡献1884条经验 获得超4个赞
假设您已经从 sql 中读取了整个表,如下所示:
cdc_new = pd.read_sql(query, conn)
您可以使用以下语法:
df = (cdc_new.loc[(cdc_new['Industry_type'] == 'Hospitals') &
(cdc_new['Employee_Insurance_Premium'] == 'Decreased'),
['Industry_type',
'No_of_Employees',
'Employee_Insurance_Premium',
'Percent_Female_Employees']]
.sort_values('Percent_Female_Employees', ascending=False))
df
TA贡献1821条经验 获得超6个赞
如果这有效并返回记录:
SELECT Industry_type, No_of_Employees, Employee_Insurance_Premium, Percent_Female_Employees FROM cdc_new WHERE Industry_type= 'Hospitals' AND Employee_Insurance_Premium='Decreased' ORDER BY Percent_Female_Employees DESC;
记录集已被修剪和排序,因此您应该按写入方式使用它。这里使用 pandas 进行演示,而不是分析。
然后使用:
import pandas as pd
cxn = "Connection string to your database"
inSQL = "SELECT Industry_type, No_of_Employees, Employee_Insurance_Premium, Percent_Female_Employees FROM cdc_new WHERE Industry_type= 'Hospitals' AND Employee_Insurance_Premium='Decreased' ORDER BY Percent_Female_Employees DESC;"
df = pd.read_sql(inSQL,cxn)
添加回答
举报