数据很像电——每次一点点,没有太多的直接接触,你就没事了。例如,一个9伏的电池不能提供足够的能量来点亮一个家用灯泡。事实上,需要一打9伏的电池才能点亮一个灯泡,而且只能持续大约一个小时。只有当大量的电力以一种可控的方式流动时,你才能看到真正的效果,比如让电动机运转起来,点亮公路广告牌,加热烤箱或为通勤列车提供动力。
它与数据相同。在单个出口商店的销售单个蓝色衬衫并不有多数据。即使您将其与该商店的所有销售组合在一起,它仍然没有太多。但是一年的数据来自多个地方?大量数据也可以为我们做出惊人的事情。我们在当今的数据中为中心的商业环境中看到了哪些控制数据可以做的。
一些例子包括:
多亏了控制,所有这些都可以做到数据分析。
这里的关键词是“受控”。“拥有海洋工程和岸边发电的背景,我目睹了电力和其他能源不受控制时可能发生的事情。“你可曾见过几根焊条通过转速为36,000转、设计公差为千分之一英寸的蒸汽涡轮机时会发生什么吗?”这不是漂亮。经过多年的数据库技术、数据分析和可视化,我也看到了大量不受控制的数据所造成的损害。在他的书中信号:辨别出在噪音世界中最重要的事情在美国,作家Steven Few用半开玩笑的方式展示了一张图表,“证明”了冰淇淋的销售是暴力犯罪的直接原因。还是恰恰相反?这是一个明显的滑稽夸张,用来说明他的观点,即我们需要小心我们如何分析和关联数据。
与'大数据'爆炸,支持者会告诉你“如果有点好,那就更好了。”这是一个明显的延伸,但它准确了吗?是否有像“太多的数据”这样的东西吗?
让我们说你是商场里的零售商店。在过去十年中拥有数据,通过项目,商店,日期,销售人员和任何数量的其他维度分解,可能是必不可少的。如果我们还包括怎么办?全部的销售全部竞争对手的产品、季节性天气历史、人口统计变化、商场的人流量模式,以及任何可能影响顾客购买产品决定的因素,甚至包括他们在购买前午餐吃了什么?结果很可能是不受控制的数据分析。这往往会导致错误的关联和错误的决定。例如,你可能会发现,如果顾客午餐吃披萨,他们购买的可能性是其他人的四倍,但你从来没有意识到,在你的商店附近有比其他类型的食品服务更多的披萨餐厅!
当涉及到数据时,坚持使用你所知道的好数据。确保它干净、可靠,最重要的是,相关。最重要的是,确保你控制了你的数据。没有控制,可能无法阻止所造成的损害。