我有一个 csv 文件 test.csv。它有 5000 列。某些列(例如 50 列)在所有行中具有相同的值。如何找到多少列具有相同的值并在单独的 csv 中打印这些列。例子,A B C D1 2 2 31 2 3 31 2 4 31 2 5 31 2 7 3我想找到具有类似值/元素的列,例如 A,B 和 D 。然后将 A、B 和 D 打印在单独的 CSV 文件中,并将 C 打印在单独的 CSV 文件中。谢谢你。
3 回答
一只萌萌小番薯
TA贡献1795条经验 获得超7个赞
我建议使用熊猫。你可以用下面的方法解决你的问题(这应该让你开始)。
您需要查看此链接,该链接将为您提供10 分钟的熊猫概述(即读入/操作数据)
import pandas as pd
data = {
'A': [1] * 5
, 'B': [1] * 5
, 'C': [1] * 5
, 'D': [i for i in range(2, 7)]
}
df = pd.DataFrame(data)
# loop through each column
for col in df.columns.tolist():
# check if every value in the column is equal to the first value
if (df[col] == df[col][0]).all():
print('all values match in {col}'.format(col=col))
else:
print('{col} has non-uniform values'.format(col=col))
添加回答
举报
0/150
提交
取消