当前位置:

在数据驱动项目中取得成功的要素——你需要回答这三个问题

数据驱动项目的成功有很多挑战和障碍。以下是通过简单地问自己三个问题来了解如何克服它们。

数据已成为公司现在可能拥有的最有价值的资产。它可以让您深入了解客户的行为和业务运营,推动销售并优化交付链,预测产品和服务需求。由于丰富的数据,人工智能,物联网或区块链等最令人兴奋和最有前途的技术是可能的。但这是否意味着数据的可用性是数据驱动项目成功的保证?

不幸的是,最近的一些研究表明,即使所有数据都浮出水面,大多数项目仍然失败。2017年,Gartner表示,60%的大数据项目都失败了,但在他最近发布的推文中,Gartner分析师Nick Heudecker纠正了这个数字,并表示当时Gartner对此过于保守,收盘率约为85% 。麦肯锡的另一项研究显示,公司只捕获了其数据中可用价值的10%-40%。这是为什么?

成功的数据驱动项目存在许多障碍和挑战。需要改变组织的文化,不切实际的目标和期望,缺乏熟练的专业人员。但是,既然我们在谈论数据,那么让我们关注特别是围绕这个问题的问题。在确定了项目的可行概念证明之后,数据科学家和数据专家需要立即回答三个关键问题。

“我有合适的数据吗?”

很容易假设您的公司有足够的数据可以立即着手实施该项目。毕竟,公司多年来一直坐在数据上,现在是时候了解它。但是,经常被忽视的问题是,这些数据可能会为您提供有关过去运营,失败和成功的具体见解。但是,如果使用这些历史数据训练算法,他们只会找到过去可能应用于场景的模式,但这些模式只是次优甚至完全与未来无关。

您需要新的数据,最好是实时或接近实时。或者您可能已经确定了要在项目中解决的全新问题,但尚未提供一致的数据集。因此,在实际启动项目之前,您需要确定需要的数据集以及如何获取它们。这将我们带到下一个问题。

“我知道这些数据在哪里吗?”

没有一家公司没有数据库。许多公司还建立了数据仓库,甚至可能开始使用数据库。当然,通过这些丰富的数据池,您需要的数据就在那里,只需一臂之力。还是真的吗?

正如最近的Gartner论文“ 如何避免数据湖失败 ”一样,数据湖,“很少以一个明确的目标开始,而是以模糊的愿望开始,创造单一版本的真相”或者,民主化我们的数据'。“这很难称为战略目标。正如Databricks的首席执行官Ali Ghodsi在一次采访中雄辩地说:“这些公司中的许多公司已经构建了这些数据湖,并在其中存储了大量数据。但是,如果你问公司你对数据湖的预测有多成功,那么你将会发现他们所遇到的很多困难。“

此外,根据同一篇Gartner论文,数据湖泊将成为“企业中所有数据的一个目的地”的假设可能会产生误导,因为数据源太多了。

从这个意义上讲,数据仓库和数据库并不是更好。大多数情况下,它们是为解决一个具体问题而创建的,因此它们存储的数据可能或者很可能不适用于您即将开始的此特定AI或IoT项目。

因此,有必要更广泛地思考并寻找驻留在数据仓库之外的数据或考虑组合多个数据库。也许您甚至需要从第三方来源或公司的合作伙伴网络获取数据。例如,为了建立纳税人总收入的概况以发现违规行为并建立非法活动,HMRC的软件系统连接来自多个政府和企业来源的链接数据。

这导致我们进入下一个问题。

“我如何将所有这些数据合并在一起?”

无论您参考哪个研究或研究数据相关项目失败的原因,几乎每个项目都将孤立数据列为罪魁祸首之一。这并不奇怪,因为大数据有多种形式,来自各种来源 - 企业软件应用程序,用户手机,物联网传感器,合作伙伴系统,社交媒体流......,这个列表实际上是无穷无尽的。汇总所有这些数据源以便开始协调数据并从中获取有意义的见解可能非常困难。

问题必然不在于缺乏技术。市场上有许多工具和软件系统可以简化和加速云和内部部署之间的数据集成,分批和实时地在数据仓库,软件应用程序和物联网平台之间进行数据集成 - 您可以这么说。通常缺乏对数据集成的关键作用的理解是最大的挑战。毕竟,确保为人工智能试点项目提供资金要容易得多 - 因为人工智能很花哨而且很酷 - 而不是确保预算能够正确解决如何更有效地整合数据和应用程序的问题。

这种情况正在发生变化,尽管速度很慢。Corinium Digital最近的报告“ 欧洲数据与分析状况 ”指出,虽然人工智能/机器学习和预测分析继续保证最大的投资,但紧随其后的是数据整合,78%的受访者表示他们是计划在未来几个月内投入1-2百万英镑或更多。

然而,无论多么有希望,这些结果依赖于对欧洲仅有130名数据和分析从业者的采访。许多组织仍未意识到,为了充分发挥数据和分析的潜力,他们需要确保坚实的基础,这意味着确保他们使用来自每个相关来源的正确数据。

  • 微信-二维码
立即体验大数据分析工具 DataFocus
免费体验,内置100+分析模版供你体验
立即使用