数据分析如何更好的与企业业务相结合

传达与业务利益相关者有效合作的技巧,并作为数据科学家提供价值

我们的教育系统倾向于强调硬技能,大学毕业后,我的主要重点是尽可能多地学习数据实践和技术,并擅长我的技术技能。我仍然是一个极客和重视学术知识,但在各个行业工作后,我开始意识到软技能是打开技术技能的价值的关键。投资者、亿万富翁沃伦?巴菲特(Warren Buffett)在接受采访时表示,"比现在多值50%的一条简单方法就是磨练你的沟通技巧"。沟通是我过去绩效评估中常见的改进领域,我认为其他人也会与我联系,因为LinkedIn分享,沟通在美国技能差距排行榜上名列第一。在潮汐,我有幸与那些帮助我把这种弱点转化为力量的人一起工作,因此,我想在这篇文章中分享帮助我成为一个更好的沟通者的主要技巧。
84e38ca78515.png

沟通框架

我们,数据人,要求商务人士更注重数据驱动,但我们是以业务为导向的吗?

在一般沟通时,重要的是要从为什么西蒙·西内克在他著名的泰德演讲中所说。但是,在机器学习项目方面,什么是"为什么"呢?当成为数据科学家时,我们经常被告知,这是培训模型并验证它们。然而,这确实是"如何",而不是"为什么"。那么,数据科学项目背后的"原因"是什么呢? "为什么"总是与实现某种商业目标有关。无论是通过自动化获得更多的客户还是提高流程效率,始终有一个业务目标。创造价值的不是模型培训本身,而是模型的使用。正如约书亚·塞登在他的著作《产出超过产出的结果》中所解释的那样,这改变了我们从产出到结果的心态。

我们如何做到这一点?金字塔原理是做到这一点的好方法。我们可以从"为什么"开始,捕捉我们想要实现的目标(例如优化发票收集策略,为我们的会员增加 NPS 分数)。稍后,我们可以继续使用"如何",解决我们为应对这一挑战而可以遵循的不同方法(例如自动发票追逐问题、预测高风险发票、推荐收款解决方案)。最后,我们可以详细阐述每个解决方案,并包括更多细节(例如预期影响、可交付性、项目复杂性、实验技术)。有了这种自上而下的思想结构,听众可以尽快理解每个论点的相关性,并在需要时积极指导对话。

项目的透明度

模型或见解不被使用和遗忘并不罕见,从经验来看,业务和数据团队之间的不协调是其背后的主要原因之一。这些数据科学项目中反复出现的错误是,从构想阶段开始,无法与业务取得联系,这通常会导致大量返工以使任何模型运行。数据科学家应该与产品团队讨论决策项目的各种主题:

  1. 成功的定义——一个项目应该始终有特定的目标,可以带来商业价值。因此,数据科学家应该对企业最重要的课题可能是这个项目的成功是什么样子,以及如何衡量它。这还应确定模型目标以及模型目标的任何代理的定义(如果与成功标准不同)。有一篇关于某人如何在这里陷害机器学习问题的好文章。在测试了假设后,我们可能会发现跟踪指标中的权衡取利,数据科学家可以帮助企业了解权衡的影响。
  2. 运营问题——正如之前讨论的那样,模型在运行时主要产生价值。为了避免项目交付的延迟,我们应该尽早问以下问题:"如何使用某个模型?","您多久需要更新一次预测?","谁将使用这些数据?"否则,错误的假设可能导致过度设计的建筑解决方案和错误的培训数据集。
  3. 数据集和可解释性-功能是实体的属性,可以帮助我们预测某个事件。编写一个数据集来培训模型阶段需要大量的域知识,并建议在此阶段引入几个在特定领域具有丰富经验的人员。机器学习应用于对风险敏感的环境中(这在像 Tide 这样的金融科技公司中很常见),对于利益相关者来说,能够不同意或同意模型而不成为 ML 专家是很有用的。换句话说,要具有可解释的功能,商业专家将能够感知检查,帮助建立ML和业务之间的信任。
  4. 精益实践——不仅要了解成功是什么样子(即我们需要前进的方向),还要了解为了创造有价值的东西而必须达到的最低范围。由于业务方面的人往往缺乏技术背景,数据科学家应该将最低可行精度带到表中,从而影响模型技术的努力和决策。这基本上是模型需要达到的最低精度,以便有合理的情况下将模型投入生产。它不代表所需的精度,但更多的是一个最低边界,使项目去/不去决定。在这些讨论中,数据科学家需要向利益攸关方强调,所选的最低准确性可能无法通过获得的数据和训练有素的模型实现,因此,还应商定这一阶段(通常为 1–2 冲刺)的可接受时间框。
  5. 回顾-沟通是双向的,我们是在潮汐敏捷实践和反馈周期的超级粉丝。我们邀请回顾性会议的利益相关者共同思考项目中的好坏。例如,挑战如何处理某些拦截器或限制可能会为数据团队与产品团队的互动创建新的实践和提示。

创建数据文化

投入时间创建一家注重数据的公司大有裨资,应该能够在数据部门和其他规模上实现更轻松的沟通。数据团队最近在大多数公司中引入,与其他更成熟的职能(如财务或法律职能)相比,它们往往与其他业务没有很好地整合。除此之外,他们没有众所周知的做法和流程。有各种方法可以弥补这一差距:

  1. 数据团队可以集体开始记录许多商定的过程(例如,我们如何测试假设,如何在风险策略中使用统计模型)和常见术语(例如,功能、机器学习模型、基本模型性能指标)。这样,数据科学家就不需要多次研究相同的概念。
  2. 培训或"午餐和学习"类型的活动也有助于知识共享(例如,机器学习项目的生命周期阶段是什么,每个团队在每个阶段的作用是什么)。这些通常会引起数据科学领域的很多关注,这些团队还没有机会与数据部门合作。
  3. 以数据问答会话的形式阻止通信时间也可以使数据团队更接近业务需求。
  4. 最后,其他游击战术,如在工作通信平台上发布可交付数据的见解和测量的影响,可能会打破我们与组织其他成员之间看不见的孤岛。
  • 微信-二维码
立即体验大数据分析工具 DataFocus
免费体验,内置100+分析模版供你体验
立即使用