国际数据集团(IDG)今年早些时候发布的一份研究报告显示,各大公司正开始认真对待大数据。近一半(49%)的受访者表示,他们已经或已经开始实施大数据解决方案。在这些投资的公司中,受访者称CEO是“大数据努力的最大支持者”。“如果制造商、分销商和零售商了解大数据是什么、它与传统报告的区别以及云计算如何推动ROI(即使是对小公司),他们就会从大数据中获益。
您目前是否正在与您的首席执行官合作采购、管理和执行大数据战略?或者你正在努力理解什么是大数据,更别说理解它能为你的业务做什么了?
传统上,业务智能活动通常从数据仓库的概念开始。数据仓库已经成为一种很好理解的东西:它是来自许多来源、范围广泛(通常包含数年的数据)的中央存储库,用于业务报告、聚合和趋势分析。数据仓库通常由与业务直接相关的数据组成。很容易理解为什么我们需要添加、平均或总结这种类型的数据,以询问“我们的业务做得怎么样?”
大数据是一种不同类型的数据,旨在回答一系列不同的问题。大数据通常是我们传统上认为没有价值的数据。然而,模式可以帮助我们优化决策。例如,当我们的顾客(作为一个群体)不在我们的零售店时,他们在做什么?这是一个更表面的问题,大多数零售商都想知道他们的顾客光顾的其他商店是什么。这些见解可以带来联合营销的机会。
另一个例子:我们生产产品所需的原材料在世界的哪些地区流动?这些材料的成本会受到全球气候模式的影响吗?供应链受到外部变量的影响。为了优化它们,分析师们可能会往外看。
还有:一家家庭保健产品分销商决定将库存从美国东北部转移到美国东南部,因为来自亚特兰大的“咳嗽”、“感冒”或“发烧”等词在推特上飙升了15%。在这种情况下,一个收入机会被抓住了。
这些数据从何而来?可公开获取的数据正在迅速扩展。提供消费者订阅数据、在线评论、位置数据和数字媒体的公司每天都有。移动设备和社交媒体推动了这种扩张,但同样重要的是允许机器在没有人干预的情况下传输数据的技术。另一个例子是,“智能电网”技术利用机器生成的数据,帮助能源公司根据消费者需求的变化优化产能。
大数据是应用于海量数据的统计分析,因此,大数据带来了一系列新的挑战。如果没有非常大的容量,就不能推断出有用的统计模式。大数据可以包括事务数据和非结构化数据;例如,图像、视频、GPS坐标、文档、推特等。因此,大数据工具必须能够从数据中推断出结构,而不是将数据转换成符合预先设计的结构。最后,大数据的生成速度比传统工具处理它的速度要快。体积,各种和速度(3 Vs)都是大数据分析的特点和挑战。
为了进行这种统计分析,我们需要能够处理大数据的3v的工具。我们需要廉价的存储器来存储大量的数据。我们需要一种软件,它能从它所分析的数据中推断出结构,并能分布到数千台一起工作的服务器上。我们需要“超尺度”的能力,这样我们就可以根据被分析事件的速度放大或缩小。如果没有云计算的好处,这些挑战对于中小型组织来说是无法克服的。
大数据不需要大量的资本投资。云计算使计算能力高度可扩展,成本持续下降。十多年来,互联网软件巨头一直致力于大数据(并从中受益)。今天,想要补充传统报告环境的公司可以免费使用Hadoop等开源工具。