课程名称:构建数据分析工程师能力模型,实战八大企业级项目
课程章节:2-6 高效处理带有时间序列数据
课程讲师:fish
课程内容:
高效处理带有时间序列的数据
日期和时间数据
Pandas时间序列基础
日期的范围、频率及移动
什么是时间序列:
时间序列(Time Series)是一种重要的结构化数据形式,在多个时间点观察或测量到的任何事物都可以形成一段时间序列:
分为:
定期的时间序列:数据点是根据某种时间序列定期出现的(如每10秒,每15分钟)
不定期的时间序列:没有固定时间单位或单位之间的偏移量。
日期和时间数据
Python 标准库包含用于日期(date)和时间(time)数据的数据类型,主要用到的模块有 datetime 和 time。
Pandas 提供了一组标准的事件处理工具和数据算法,如进行切片/切块、聚合、对定期\不定期的时间序列进行重新采样等。
datetime中的数据模型
date:以公历形式存储时间日期(年、月、日)
time:将时间存储成时、分、秒、毫秒
datetime:存储日期和时间
timedelta:表示两个datetime值之间的差(日,秒,毫秒)
datetime.datetime 或称为 datetime,是用的最多的数据类型
datetime类型
查看现在的日期和时间(记录到毫秒),为 datetime 类型。
可使用如下方法分别查看年、月、日
两个 datetime 对象之间的时间差(日、秒、毫秒)为 timedelta 类型。
给 datetime 加上或减去一个或多个 timedelta,会产生一个新的对象。
字符串与 datetime 之间通常需要进行转换,有以下三种转换方式:
日期转换成字符串
Pandas 时间序列基础
课程收获
感谢老师带来的关于带有时间戳的数据的处理的解决方案,使我了解到更多的python的关于时间序列的数据处理方式,以及对Pandas处理相关数据的方式有了更多的认识,认识到pandas处理数据的强大。
共同学习,写下你的评论
评论加载中...
作者其他优质文章