2 回答
TA贡献1827条经验 获得超9个赞
要检查一个对象是否在某物中而不是检查它是否等于某物,请使用in.
if place in different:
同样地
elif place in normal:
编辑:
如果你把它变成一个函数,它应该是这样的。基本上,您只需要做一些def my_function_name(arguments):事情,然后缩进其余代码,使其属于该函数。像这样:
import pandas as pd
def get_subset(df, place):
normal = ['a','b']
different = ['v','w','x','y','z']
different_subset_start = 2
normal_subset_start = 4
subset_end = 8
if place in different:
df1 = df[(df['period'] >= different_subset_start) & (df['period'] <= subset_end)].drop_duplicates(subset = 'period')
elif place in normal:
df1 = df[(df['period'] >= normal_subset_start) & (df['period'] <= subset_end)].drop_duplicates(subset = 'period')
else:
df1 = None
return df1
df = pd.DataFrame({
'period' : [1.0, 1.0, 2.0, 2.0, 3.0, 4.0, 5.0, 7.0, 7.0, 8.0, 9.0],
})
place = 'a'
print(get_subset(df, place))
TA贡献1798条经验 获得超3个赞
看看for val in df:你的代码。这样的结构很奇怪,因为您不使用val变量。
将代码的最后一个片段更改为如下所示:
def fn():
if place in different:
print('place is different')
return df[df.period.between(different_subset_start, subset_end)]\
.drop_duplicates(subset='period')
elif place in normal:
print('place is normal')
return df[df.period.between(normal_subset_start, subset_end)]\
.drop_duplicates(subset = 'period')
else:
print('Incorrect input for place. Please check value')
在您的情况下subset = 'period'是多余的,因为period是 DataFrame 中的唯一列。
也不需要最后一次返回。如果函数执行到代码末尾,它会返回而不返回任何值。
还有一个细节:如果您的DataFrame有一个列,那么一个Series就足够了?
添加回答
举报