在这个大数据时代,很多企业开始频繁的利用大数据分析赋能企业决策,让决策更加的精准和高效。那么在数据分析上就需要有专业的人员或工具进行支持,比如聘请专门的数据分析人员或是购买类似于DataFocus、Thoughtspot等BI分析工具。但无论是专家还是工具,都离不开方法的支持,用各类的数据分析方法、数据分析公式、数据洞察策略去赋能各类数据分析应用场景。而其实对于真正的决策者来说,数据分析从来赋能的不是他的决策,而是整个决策树。
何为决策树,我们先来看一个例子。
现想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话
女儿:多大年纪了?
母亲:26。
女儿:长的帅不帅?
母亲:挺帅的。
女儿:收入高不?
母亲:不算很高,中等情况。
女儿:是公务员不?
母亲:是,在税务局上班呢。
女儿:那好,我去见见。
这个女孩的决策过程就是典型的分类树决策。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别:见和不见。假设这个女孩对男人的要求是:30岁以下、长相中等以上并且是高收入者或中等以上收入的公务员,那么这个可以用下图表示女孩的决策逻辑。
决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数有两大优点:
1)决策树模型可以读性好,具有描述性,有助于人工分析;
2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
应用方面我相信很多人都了解,比如常见的客户数据分类,像是银行等等,就会用如下决策树:
对于企业朋友来说,数据分析的结果也会应用于类似下列流失客户数据决策树:
总而言之,数据分析赋能的是决策树而非单一决策,尤其是针对大型机构和组织,只有用决策树才能真正做到科学、错误最小化的决策,并融入数据分析体系。