为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas:WiFi 日志中每小时的唯一每日值

Pandas:WiFi 日志中每小时的唯一每日值

明月笑刀无情 2023-10-18 20:59:03
上下文:WiFi DHCP 租约记录在系统日志中。DHCP 租用期限为 24 小时,一条记录代表一次成功的 WiFi“会话”。有些设备(例如手机)每天会启动多个会话,因此我们只需每 24 小时计算唯一的 Mac 地址。但我们想知道第一次连接的时间戳。最后,我们需要能够按小时和天进行求和。TL;DR:需要显示按小时细分的每日唯一 MAC 地址。不是按小时唯一,而是按天……然后按小时细分并求和。示例数据框:branch          timestamp  mac 0   branch_a    2020-09-01 00:00:00 48:c7:96:1d:91:af1   branch_a    2020-09-01 00:08:00 48:c7:96:1d:91:bx   2   branch_b    2020-09-01 00:36:07 48:c7:96:1d:80:ff   3   branch_b    2020-09-01 00:41:24 48:c7:96:1d:86:ff   4   branch_c    2020-09-01 00:44:33 48:c7:96:1d:76:bv脚步:按分支分组每天首次出现或唯一的 MAC 地址按小时计算 mac 地址总和这显示了相同的 mac。branch_daily = wifi.groupby(['branch','month', 'timestamp'])['mac'].first()预期结果:branch          timestamp           mac 0   branch_a    2020-09-01 00:00:00 51   branch_a    2020-09-01 00:01:00 10   2   branch_a    2020-09-01 00:02:00 3   3   branch_a    2020-09-01 00:03:00 4   4   branch_a    2020-09-01 00:04:00 11其中 mac 是按小时计算的总和。wifi['timestamp'] = pd.to_datetime(wifi['timestamp'], format='%b %d %Y %H:%M:%S')wifi['month']     = wifi['timestamp'].dt.monthwifi['day']       = wifi['timestamp'].dt.daywifi['hour']      = wifi['timestamp'].dt.houruniq_per_day = wifi.drop_duplicates(subset=['day','mac'], keep='first')# Hourlyuniq_per_day.groupby(['branch','month','day','hour']).agg({'mac':'count'})# Dailyuniq_per_day.groupby(['branch','month','day']).agg({'mac':'count'})#...etc.
查看完整描述

1 回答

?
泛舟湖上清波郎朗

TA贡献1818条经验 获得超3个赞

您可以通过三个步骤来完成此操作:

  1. 首先从时间戳中提取日期。

  2. 其次,使用 keep=first 和 subset=day/mac 执行 drop_duplicates。

  3. 第三,进行分组并计数。


查看完整回答
反对 回复 2023-10-18
  • 1 回答
  • 0 关注
  • 114 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信