课程名称:构建数据分析工程师能力模型,实战八大企业级项目
课程章节:2-6 高效处理带有时间序列数据
课程讲师:fish
课程内容:
高效处理带有时间序列的数据
- 日期和时间数据
- Pandas时间序列基础
- 日期的范围、频率及移动
什么是时间序列:
- 时间序列(Time Series)是一种重要的结构化数据形式,在多个时间点观察或测量到的任何事物都可以形成一段时间序列:
分为:
- 定期的时间序列:数据点是根据某种时间序列定期出现的(如每10秒,每15分钟)
- 不定期的时间序列:没有固定时间单位或单位之间的偏移量。
日期和时间数据
- Python 标准库包含用于日期(date)和时间(time)数据的数据类型,主要用到的模块有 datetime 和 time。
- Pandas 提供了一组标准的事件处理工具和数据算法,如进行切片/切块、聚合、对定期\不定期的时间序列进行重新采样等。
datetime中的数据模型
- date:以公历形式存储时间日期(年、月、日)
- time:将时间存储成时、分、秒、毫秒
- datetime:存储日期和时间
- timedelta:表示两个datetime值之间的差(日,秒,毫秒)
- datetime.datetime 或称为 datetime,是用的最多的数据类型
datetime类型
- 查看现在的日期和时间(记录到毫秒),为 datetime 类型。
- 可使用如下方法分别查看年、月、日
- 两个 datetime 对象之间的时间差(日、秒、毫秒)为 timedelta 类型。
- 给 datetime 加上或减去一个或多个 timedelta,会产生一个新的对象。
- 字符串与 datetime 之间通常需要进行转换,有以下三种转换方式:
日期转换成字符串
Pandas 时间序列基础
课程收获
感谢老师带来的关于带有时间戳的数据的处理的解决方案,使我了解到更多的python的关于时间序列的数据处理方式,以及对Pandas处理相关数据的方式有了更多的认识,认识到pandas处理数据的强大。
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦