专题 “大数据”创造的未来
大数据的“真面目”及其利用

安宅和人 [作者简介]

[2015.03.09] 其它語言 : ENGLISH | 日本語 | 繁體字 | ESPAÑOL |

大数据到底是什么?笔者将根据它的定义及特征,指明大数据最能发挥“威力”的领域,剖析在日本有碍大数据利用的问题所在。

大数据的定义

近年来,人们对“大数据”的关注度日益提高。这都归因于麦肯锡全球研究院在2011年发布的研究报告。该报告认为人们即将迎来一个利用规模大到超出现有数据处理系统能力的巨量信息时代,并暗示战略性地利用这些信息数据,就有可能产生巨大的商业机会。

那么大数据到底是什么呢?从字面来看,它指的是以现有信息处理技术无法应对的庞大信息量。而实际上,当我们将储蓄了各种服务的使用信息数据与用户的属性信息相结合,并在这些信息数据发生时能够全量获取,就被称做大数据。

典型的是互联网服务的利用数据。另外还包括零售业销售数据(POS数据)、电力使用数据、来自加速度传感器和无线运动监控器等设备的传感器测量数据。

与抽样数据不同,大数据网罗了来自各种服务用户的所有利用数据,它积累的信息不是以一天、一小时,而是以每分、每秒的实际发生情况为基础的。从地区信息方面来看,它不是以市区町村或其他更小的单位来划分的,许多时候可以精确到6位、7位数的经纬度座标级别。

大数据的三个特性

人们通常以巨量(Volume)、多样(Variety)和高速(Velocity)三个词来概括大数据的特征,统称为“3V”。但诸如作为典型大数据的电力、加速度传感器等探测的数据就谈不上拥有搜索关键词这种“多样性”。从速度和巨量这些条件来看也是如此,未必总能符合3V标准。

从利用角度来看,大数据具有以下三个特性。

一是可获得的“属性深度”低于一般的行为观察和问卷调查数据。即使掌握了何时用过、用了多少等信息,但无法知晓“是在什么状况下,出于什么理由或目的进行了这些行为活动”等利用背景。用户的属性信息(有无幼年子女、职业、教育程度、收入等)也比较少。这可以说是将这些数据用于市场营销时的一个课题。

二是覆盖了所有的发生数据。可以找出抽样数据中无法看到、相当于发生频率较低的尾端部分的数据的独特类型。

三是信息利用的实时性。由于大数据可以实时读取、处理消费和利用过程中各个场合发生的情况,所以可用于捕捉特定行为和需求发生的瞬间。比如,当某位特别关注某种汽车的用户浏览了相关网页时,就可以立刻提供有关该汽车的信息。这是无法借助传统市场营销数据实现的。

大数据发挥优势的事例

下面,让我们以“为顾客提供价值”这种市场营销视角,从六个步骤上来观察一下数据的广泛利用。 

第一步是“看清市场结构与需求”,这是制定各种商品开发与服务战略的基础;第二步是基于这种市场判断,设计所提供的核心价值、服务属性;第三是针对不同顾客的市场营销;第四是像前面提到那样,在需求发生时提供推销服务(广告、邮件、网站内容等);第五是检验实施前四步以后产生的效果;第六是从数值上预测未来情况。

大数据在上述后四个步骤方面尤其具有优势。比如,要提供符合个别用户特性的服务和信息,大数据是不可或缺的前提。在互联网上依据用户的网络记录过滤不恰当信息,提供有针对性的广告及符合个人消费行为的优惠券等,这都属于典型事例。

实时打广告或在搜索框中输入热门话题的部分字眼时,立刻就会自动提示话题相关词汇,这种现象源于积累了用户的使用数据后所产生的“机械学习”。通过这种机械学习利用大数据的特点,在于服务提供方即使不理解具体语境也无妨。

此外,越是要详细获取信息,就越是离不开大数据的帮助。比如,观察在特定的一周内,人们傍晚在某车站附近的店铺内集中购买鸡肉的变化情况这样的例子。

雅虎株式会社首席战略官(CSO)。1993年东京大学研究生院毕业后,进入麦肯锡公司。1997年入读耶鲁大学脑神经科学项目。2001年取得博士学位,回到麦肯锡公司。2008年进入雅虎。历任COO室长、事业战略统筹总部长,2012年起任现职。

相关报道

最新专题

バナーエリア2
  • nippon.com专栏
  • In the news
  • 東方
  • 客观日本