上一篇:【时间序列(二)】【时间序列基础+索引、选取、子集构造】
带有重复索引的时间序列
在某些应用场景中,可能会存在多个观测数据落在同一个时间点上的情况。
=====================================
通过检查索引的is_unique属性,可以确认它是不是唯一的
=====================================
对这个时间序列进行索引,要么产生标量值,要么产生切片,具体要看所选的时间点是否重复
=====================================
想要对具有非唯一时间戳的数据进行聚合。一个办法是使用groupby,并传 入level=0
日期的范围、频率以及移动
pandas中的原生时间序列一般被认为是不规则的,它们没有固定的频率。对于大部分应用程序而言,这是无所谓的。但是,它常常需要以某种相对固定的频率进行分析,比如每日、每月、每15分钟等(这样自然会在时间序列中引入缺失值)。pandas有一整套标准时间序列频率以及用于重采样、频率推断、生成固定频率日期范围的工具。
将时间序列转换为一个具有固定频率(每日)的时间序列,只需调用resample。
字符串“D”是每天的意思。
下面是如何使用基本的频率和它的倍数。
生成日期范围
pandas.date_range可用于根据指定的频率生成指定长度的DatetimeIndex。
默认情况下,date_range会产生按天计算的时间点。
=====================================
只传入起始或结束日期, 那就还得传入一个表示一段时间的数字
=====================================
起始和结束日期定义了日期索引的严格边界。想要生成一个由每月最后一个工作日组成的日期索引,可以传入"BM"频率(表示business end of month),这样就只会包含时间间隔内(或刚好在边界上的)符合频率要求的日期
=====================================
date_range默认会保留起始和结束时间戳的时间信息
=====================================
产生一组被规范化 (normalize)到午夜的时间戳。normalize即可实现该功能。
++++++++++++++++++++++++++++++++++++