时序数据也就是我们平时经常说到的时间序列数据,在统计学课本中成为常见。时间序列的定义是:同一统一指标按时间顺序记录的数据列。要求在同一数据列中数据之间具有可比性,也就是说各个数据的口径必须相同,数据可以是时期或者时点。进项时间序列数据分析的目的一般是通过找出样本内时间序列的统计特性和发展规律性,构建时间序列模型,进行样本外预测。
时间是一个经常会出现在我们分析中的维度和属性,在数据分析上经常出现且占有较大比重。在DataFocus系统中也有专门预设的一类数据类型timestamp,专门用于选择时间序列数据,很多的关键词搜索都能够依据这个数据类型化进行,比如计算数据的同比环比或者增长率等等。
一般情况下,具有时间属性且随时间变化的数据可以称之为时变数据。时变数据大致上可以分成两类,一类是按时间轴排列的时间序列数据,比如股票交易变动的数据,每日安排的工作计划,每天销售的产品记录等等;另一类是不宜时间为变量,但数据集存在固有的测序序列,比如生物DNA测序、化学质谱等。时变数据的分析和理解通常可以通过统计、数值计算和数据分析方法来完成。
具体有两种方法可以可视化时变数据。一种方法是使用静态方法来显示数据中记录的内容。该方法数据不随时间变化,通过多角度对比,找出数据随时间变化的趋势和规律,在DataFocus系统中可以用柱状体、折线图等一类图形进行展示。另一种方法,则是使用动画来动态地显示随着时间变化的感觉和过程,有更多的限制,需要认真考虑其可视化的可行性和表达能力,但动态的时序数据更加生动且能实时追踪数据变动情况,更加实用。同样可以在DataFocus系统中利用动态的时序柱状体、时序气泡图、熟悉条形图进行展示。