为了账号安全,请及时绑定邮箱和手机立即绑定

python - 地理分箱 - 地理边界内的平均值

python - 地理分箱 - 地理边界内的平均值

一只甜甜圈 2022-08-02 16:55:40
使用如下数据, - 捕获各种近距离位置的测量值Lat Long    val35.611053   139.628525  -72.8235.61105336 139.6285236 -78.0435.61105373 139.6285223 -72.9935.61105409 139.6285209 -69.0435.61105445 139.6285195 -65.435.61105482 139.6285182 -66.6835.61105518 139.6285168 -65.8235.61105555 139.6285155 -64.4735.61105591 139.6285141 -71.2635.61105627 139.6285127 -68.3635.61105664 139.6285114 -74.4835.611057   139.62851   -74.2735.61105736 139.62851   -77.9735.61105773 139.62851   -68.6635.61105809 139.62851   -70.2135.61105845 139.62851   -76.0535.61105882 139.62851   -88.8335.61105918 139.62851   -73.1735.61105955 139.62851   -67.6335.61105991 139.62851   -71.8535.61106027 139.62851   -77.4235.61106064 139.62851   -71.0835.611061   139.62851   -79.27需要对此数据执行分档操作 - 即获取每个0.1x0.1米中所有值的平均值。一种方法是找到边缘(如NW,SW,NE和SE),并将其划分为一组0.1x0.1米的网格和每个网格内的查找值,并计算平均值并归因于网格中心的纬度/经度,以便我们得到如下结果。valLat Long    Mean_val    Sample_count虽然所提议的方法可能很幼稚,但还想知道是否可以有一种基于以下方法的方法:pandas
查看完整描述

1 回答

?
万千封印

TA贡献1891条经验 获得超3个赞

通过 0.1 m * 0.1 m 面积轻松解决平均数据

为此,您必须将纬度,经度坐标转换为x,y坐标。


在这里,我使用模块:utm


x,y,_,_ = utm.from_latlon(latitude, longitude) 

之后,您可以创建一个新列,以分米为单位表示x,y坐标:


def apply_fun (raw):

    x,y,_,_ = utm.from_latlon(raw['Lat'],raw['Long']) 

    return str(np.round(x*10))+"|"+str(np.round(y*10))

然后将其添加到您的数据帧:


x = df.apply(lambda row : apply_fun(row),axis=1)

df.insert(3,'Group',x)

并应用 groupby 函数:


gdf = df.groupby(['Group']).agg({"Lat":["mean"],"Long":["mean","count"],"val":["mean"]})

gdf = gdf.reset_index().drop(columns=['Group'],level=0)

gdf.columns = [' '.join(col) for col in gdf.columns]

我们完成了!:)


上一个解决方案的泛化

要按 k1 米 * k2 米面积对数据进行分组,只需修改此函数:


def apply_fun (raw):

    x,y,_,_ = utm.from_latlon(raw['Lat'],raw['Long']) 

    return str(np.round(x/k1))+"|"+str(np.round(y/k2)) 

对先前解决方案的批评

正如我之前指出的那样,为了解决这个问题,我们必须将纬度,long转换为x,y坐标。


在前面的解决方案中,我将纬度,经度转换为utm坐标。utm系统是一个制图投影,将地球划分为120个区域:60个北部和60个南部。因此,当我们这样做时:


x,y,area_number,NS = utm.from_latlon(raw['Lat'],raw['Long'])

(x,y)是我们在该地区的位置。我们可以得出结论,当我们的传感器位于同一UTM区域时,我们的解决方案才有效。(area_number,NS)


我们还可以使用 ECEF 转换进行此转换,该转换直接将纬度,经度转换为 x,y 坐标。我不知道这些方法的精度,由于我们被要求精确到十分之一米,我更喜欢选择看起来更准确的utm转换。


如果要使用 ECEF 方法,请按如下方式完成:


import pyproj

def gps_to_ecef_pyproj(lat, lon, alt):

    ecef = pyproj.Proj(proj='geocent', ellps='WGS84', datum='WGS84')

    lla = pyproj.Proj(proj='latlong', ellps='WGS84', datum='WGS84')

    x, y, z = pyproj.transform(lla, ecef, lon, lat, alt, radians=False)


    return x, y, z


x,y,z = gps_to_ecef_pyproj(raw['Lat'],raw['Long'],0)

(我从这里获取代码:https://gis.stackexchange.com/questions/230160/converting-wgs84-to-ecef-in-python)


查看完整回答
反对 回复 2022-08-02
  • 1 回答
  • 0 关注
  • 126 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号