近5年来,企业级的数据进入飞速增长阶段。这种局部海量数据的形成,必然催生大量的数据需求。因而,传统的固定化BI报表已不能满足现代快速变化的商业需求。决策者需要将由IT主导的特定分析转为由广大业务人员主导的探索性分析,企业的BI工具建设也需要更强大的架构。首先,传统BI工具在数据仓库搭建方面更有优势,专业IT人员可专注于数据仓库开发、数据治理等工作,而分析人员则可以通过自助式BI工具连接后方数据仓库,实现探索性分析,最大程度地释放企业的数据生产力。
数据分析说复杂也复杂,但说简单,无外乎两个核心概念:数值与维度。BI分析就是依据不同的维度(如地区、时间、性别等)将聚合数值(如销售量、销售金额)切割成具体的数据立方体,即分析结果,如某年某地区的销售金额。这个过程被称之为切片。可想而知,切片越多,数值结果越详尽,分析的角度就越广,其所具有的洞察力就更强。
因此,一款BI工具的执行力除了取决于其聚合能力,还取决于其创建维度的能力。
1、原生维与派生维
原生维与派生维的概念很直观:直接来源于数据源的字段,即为原生维,原生维可用于最基本的维度分析。而把原生维进行加工生成新的维度,即派生维。派生维的存在形式是依存于原生维的,例如在原生维【订单数量】和【销售金额】的基础上,通过计算,衍生出的【客单价】维度,就是派生维。使用派生维,可增加分析维度。如果仅仅依靠原生维,则分析会受到局限。派生维的应用为数据分析师带来更加具有洞察力的分析结果。
因此,一款优秀的BI工具,应该能够让业务人员尽可能简单、便捷地生成更多派生维度,从而形成丰富地角度分析。在DataFocus中,用户可以使用搜索关键词的方法直接使用原生维和派生维,极大地拓展了使用维度,在此基础上,还配置了增加公式的方式,来便捷地创建新的派生维,用于更精细的分析。
2、数据可视化的技、术、道
邱南森(Nathan Yau)在《数据之美:一本书学会可视化设计》这本书中对数据可视化进行了精辟的解释:数据是对世界的简化和抽象表达。当你可视化数据的时候,其实是在将对现实世界的抽象表达可视化,或至少是将它的一些细微方面可视化表达,所以,最后你得到的是一个抽象的抽象。
数据可视化的能力修炼不是一蹴而就的事情,需要系统地学习与实践才能有长足的进步。一般人的数据可视化学习之路可以分为以下3个阶段。
1)技法
在此阶段,分析师能通过数据和图形准确地呈现数据分析结果,并发现数据背后的规律,可以利用工具派生新的分析维度;同时,能很好地理解各种图形的使用场景和特点,能帮助分析师在技法层面最大程度地发挥可视化的特性与优点
2)术法
在此阶段,分析师除了要熟练掌握工具的使用技巧外,还需要对数据可视化有更加深入的理解,能够通过最终所呈现的视觉效果使读者产生情感共鸣。如通过颜色的变化传达要表达的情感,通过形象化图表的使用,表现出背后的行业信息和深度。
3)道法
本质上,所有的数据分析都是围绕解决一个问题而展开的分析:数值和维度的关系。在此阶段,数据分析不再停留在视觉享受的层面,反而进入了一种返璞归真的状态。分析师舍弃了一切绚丽浮华的非重点修饰之后,将精力投入在解决关键问题上,用最简单的方式解决最重要的问题。
当然,学习数据可视化是一个循序渐进的过程,没有扎实的“技”的积累,就不会有 “术”的升华,更不会达到最后“道”的境界。
接下来,我们会继续使用DataFocus,一起学习商业智能数据分析实战,掌握能用于实践的数据分析能力,一起修炼数据可视化进阶之道。