我有一个数据框,它在建筑物数据集上具有各种属性。这些建筑物都被分配到一个住宅组(公寓/半独立式住宅/独立式住宅/排屋)和一个小区域代码。这些建筑物也有建造年份栏,但除了面积较小(约 80 栋建筑物)外,没有唯一的标识符。我想编写一个 for 循环,将这些建筑物分组为它们的住宅组,然后将它们分解为各自的小区域,并分别为它们分配该小区域中该住宅组的建造年份中位数。例如,将所有公寓划分为小区域 12345,并单独(在新列中)为它们分配该小区域中公寓的建造年份中位数。到目前为止,geo_dwelling 是一个带有列的 GeoDataFrame;In [20]: geo_dwelling.head(5)Out[20]: cso_small_area 都柏林 邮政编码 建造年份 建造年份范围 住宅类型描述 能源评级 ... height_ag height_bg 楼层_ag 楼层_bg 类别 住宅组别 7101 268109005 DUBLIN 1 2009.0 2005 起 中层公寓。B3 ... 10.02 0 3 0 R 公寓 7101 268109005 DUBLIN 1 2009.0 2005 年起 中层公寓。B3 ... 10.73 0 3 0 R 公寓 7101 268109005 DUBLIN 1 2009.0 2005 年起 中层公寓。B3 ... 10.56 0 3 0 R 公寓 7101 268109005 DUBLIN 1 2009.0 2005 年起 中层公寓。B3 ... 10.75 0 3 0 R 公寓 7101 268109005 DUBLIN 1 2009.0 2005 年起 中层公寓。B3 ... 10.85 0 3 0 R 公寓geo_dwelling = geo_dropped[geo_dropped["Dwelling Group"].str.contains("Apartment", na=False)]geo_dwelling.groupby(["cso_small_area"])[["Year of construction"]].median()任何帮助深表感谢!
添加回答
举报
0/150
提交
取消