为了保证企业的安全,数据科学现在是必须的。
但并非所有数据都是平等的。
为了为机构安全做出最明智的决策,您的数据需要准确、最新和正确地描绘。漂亮的仪表板或花哨的图形显示屏不能替代可靠的安全决策 - 这意味着数据质量应该是您的最高优先事项之一。
在五部分系列的第三篇文章中,我们深入了解了为什么您的代理安全操作应该关心数据质量,以及如何在您根据数据做出关键决策之前确定数据的准确性。
在第一部分中,我们讨论了强大的数据收集策略,以加强安全决策,在第二部分中,我们研究了如何避免与数据仪表板工作时常见的陷阱。
了解数据的质量需要您在数据仪表板的表面层下挖掘并调查数据背后的基本故事。如果不评估数据质量,您的机构安全决策是在黑暗中做出的。
以下是您的国防或情报机构需要采取的三个步骤,以提高您的数据质量,增强您对数据驱动决策的信心:
1. 尽可能自动消除人为错误
从数据分析中得出的结论总是容易出现某种程度的人为错误。但是,您应该努力消除尽可能多的错误行为,尤其是在数据质量方面。一般来说,机器往往更快、更准确地执行可重复的任务,遵循明确的逻辑。简单的更改(如编写程序以在仪表板后端输入数据,而不是依靠容易出错的管理员手动输入数据)可以减少混淆的数据错误。
当涉及到数据收集时,确定哪些手动处理会产生数据错误,并在可能的情况下实现自动化。
2. 努力提高可重复性
您可能无法自动执行所有健全的数据收集策略,但您肯定需要复制它们。使用诸如"标记"和"GitHub"等鼓励可重复数据科学最佳实践的工具,确保以书面形式捕获创建仪表板时执行的任何数据检索、数据清理和数据分析任务。
此外,记住数据科学可能是您作为机构安全或适当性执行官工作的基本功能,但您不必是一个成熟的数据科学家。请专业顾问或承包商创建数据仪表板是明智的决定,只要您不让外部合作伙伴向您隐瞒他们的方法。
3. 识别离群值及其背后的故事
您的仪表板应允许您轻松识别外层数据点并检查其背后的故事。离群值可能是表明您的新安全战略或运营实践正在产生卓越的结果。或者,离群值可能表示如何测量变量的数据质量问题。
如果您没有得到一致的测量,或者误差幅度过大,则无法从您的信息中做出数据驱动的决定。使用数据分析方法,如监控标准偏差和识别虚假关联,将帮助您了解数据试图告诉你的真实故事。
.高质量决策基于高质量数据。今天提高您的数据质量,您的代理安全决策将在明天变得更加可靠。