数据科学家的崛起仍在继续,社交媒体充满了成功的故事 - 但那些失败者呢?没有任何封面文章赞扬许多数据科学家的失败,他们没有辜负炒作,也没有满足利益相关者的需求。
数据科学家的工作是解决问题。而一些数据科学家无法解决它们。他们要么不知道如何,要么对工艺的技术部分着迷,忘记工作的全部内容。有些人感到沮丧的是,“那些商人”要求他们在“ 非常重要和复杂”事情上做“简单的琐碎数据任务”。接下来,这里是对三个重大错误的总结,这是来源于失败的直接总结,希望它们可以帮你通往成功。
错误#1 - 沟通越少越好
我所看到的威胁数据科学家是他们首先是传播者,数据极客是第二位。数据科学家犯的一个非常常见的错误就是不惜一切代价避开商人。这意味着他们试图与他们保持最小量的互动,以便回去做“酷极客”。现在我真的很喜欢这项工作中令人讨厌的部分。这就是我首先进入这个领域的原因。但我们被雇用来解决问题而没有沟通,这些问题将无法解决。数据科学家必须跟进数据分析的进展并始终收集同行的反馈意见,特别是当他们没有发现任何特殊情况时 - 这可能是个好消息?不仅收集反馈很重要,而且还要根据反馈调整分析和假设。这是“数据”中的“科学”科学 “ - 科学方法建立在重新定义基于新数据的假设的原则之上。收集和解释新数据的唯一方法是与首先确定假设的利益相关者进行沟通!
错误#2 - 延迟业务团队的简单数据请求
这是一个黄金问题 - 简单的数据请求驱动数据科学家疯狂(“这只是30行SQL代码,哎呀!”)。这就是他们失败的地方。虽然数据科学家可能非常简单 - 数据可能已经可用,但它可能会解决多年的问题。但数据科学家倾向于像工程师一样思考(“相信我,我是工程师”),并试图构建可扩展的架构来支持长期解决方案。但是 - 业务并不关心架构,规模,工程 - 他们只关心洞察力,可操作的洞察力。如果你没有提供它们 - 你的眼睛就会失败。而且,他们做销售,所以他们的决定很重要。如果你不帮助改进这些决定 - 你只是沉没成本,而金融理论有一些非常粗略的建议如何处理它。不要忽略简单的请求。首先要确保他们支持一个决定,如果它有数据,那么这个决定将改善业务 - 当你这样做时,吞下你的骄傲并运行那些微不足道的30行SQL代码 - 你将转向高投资回报率单位而不是沉没成本。
错误#3 - 对简单解决方案的偏好
非常昂贵的错误。它实际上是围绕数据科学家职业建立的一个完整的口头禅。数据科学家作为终极天才的描述,可以编码,做数学和统计,比大多数人更好地了解业务,这对该行业造成了很大的伤害。期望变得不合时宜 - 数据科学家认为他们需要通过应用顶级的统计和计算机科学方法来解决问题。最终,你会遇到这样一种情况,即初级数据科学家认为一切都可以通过深度学习解决,并且不知道如何探索数据,因为该行业将复杂性的经验卖给了他们。基础数据探索和可视化是数据科学家的主要工具,您将花费大部分时间来探索数据。没有建立机器学习模型 - 除非你被雇用专门这样做。不构建可扩展的后端架构。没有为一个简单的商业问题编写一份10页深入的假设检验研究。除非你被雇用或被特别要求这样做。您的主要职责是发现可操作的见解,并与利益相关方分享这些见解。
不要过分复杂已经过于复杂的领域过多的迷信。最典型的情况表明这个错误是数据科学家希望在每个用例,每个项目中应用机器学习。这不仅减慢了所需输出的传递速度,而且在许多情况下根本不需要机器学习模型!正如我之前解释的 那样 - 数据科学家的核心工作是解决问题; 不要申请和使用每一个闪亮的新工具,选择最好用最适合你的那个。