專題 「大數據」創造的未來
大數據的「真面目」及其利用

安宅和人 [作者簡介]

[2015.03.09] 其它語言:ENGLISH | 日本語 | 简体字 | ESPAÑOL |

大數據到底是什麼?筆者將根據它的定義及特徵,指明大數據最能發揮「威力」的領域,剖析在日本有礙大數據利用的問題所在。

大數據的定義

近年來,人們對「大數據(Big Data)」的關注度日益提高。這都歸因於麥肯錫全球研究院(McKinsey Global Institute)在2011年發布的研究報告。該報告認為人們即將迎來一個利用規模大到超出現有數據處理系統能力的巨量資訊時代,並暗示戰略性地利用這些資訊數據,就有可能產生巨大的商業機會。

那麼大數據到底是什麼呢?從字面來看,它指的是以現有資訊處理技術無法應對的龐大資訊量。而實際上,當我們將儲蓄了各種服務的使用資訊數據與用戶的屬性資訊相結合,並在這些資訊數據發生時能夠全量獲取,就被稱做大數據。

典型的是網際網路服務的利用數據。另外還包括零售業銷售數據(POS數據)、電力使用數據、來自加速度感應器和無線運動監控器等設備的感應器測量數據。

與抽樣數據不同,大數據網羅了來自各種服務用戶的所有利用數據,它積累的資訊不是以一天、一小時,而是以每分、每秒的實際發生情況為基礎的。從地區資訊方面來看,它不是以市區町村或其他更小的單位來劃分的,許多時候可以精確到6位、7位數的經緯度座標級別。

大數據的三個特性

人們通常以巨量(Volume)、多樣(Variety)和高速(Velocity)三個詞來概括大數據的特徵,統稱為「3V」。但諸如作為典型大數據的電力、加速度感應器等探測的數據就談不上擁有搜尋關鍵詞這種「多樣性」。從速度和巨量這些條件來看也是如此,未必總能符合3V標準。

從利用角度來看,大數據具有以下三個特性。

一是可獲得的「屬性深度」低於一般的行為觀察和問卷調查數據。即使掌握了何時用過、用了多少等資訊,但無法知曉「是在什麼狀況下,出於什麼理由或目的進行了這些行為活動」等利用背景。用戶的屬性資訊(有無幼年子女、職業、教育程度、收入等)也比較少。這可以說是將這些數據用於市場營銷時的一個課題。

二是覆蓋了所有的發生數據。可以找出抽樣數據中無法看到、相當於發生頻率較低的尾端部分的數據的獨特類型。

三是資訊利用的實時性。由於大數據可以實時讀取、處理消費和利用過程中各個場合發生的情況,所以可用於捕捉特定行為和需求發生的瞬間。比如,當某位特別關注某種汽車的用戶瀏覽了相關網頁時,就可以立刻提供有關該汽車的資訊。這是無法借助傳統市場營銷數據實現的。

大數據發揮優勢的事例

下面,讓我們以「為顧客提供價值」這種市場營銷視角,從六個步驟上來觀察一下數據的廣泛利用。

第一步是「看清市場結構與需求」,這是制定各種商品開發與服務戰略的基礎;第二步是基於這種市場判斷,設計所提供的核心價值、服務屬性;第三是針對不同顧客的市場營銷;第四是像前面提到那樣,在需求發生時提供推銷服務(廣告、郵件、網站內容等);第五是檢驗實施前四步以後產生的效果;第六是從數值上預測未來情況。

大數據在上述後四個步驟方面尤其具有優勢。比如,要提供符合個別用戶特性的服務和資訊,大數據是不可或缺的前提。在網際網路上依據用戶的網路記錄過濾不恰當資訊,提供有針對性的廣告及符合個人消費行為的優惠券等,這都屬於典型事例。

實時打廣告或在搜尋框中輸入熱門話題的部分字眼時,立刻就會自動提示話題相關詞彙,這種現象源於積累了用戶的使用數據後所產生的「機械學習」。通過這種機械學習利用大數據的特點,在於服務提供方即使不理解具體語境也無妨。

此外,越是要詳細獲取資訊,就越是離不開大數據的幫助。比如,觀察在特定的一週內,人們傍晚在某車站附近的店內集中購買雞肉的變化情況這樣的例子。

  • [2015.03.09]

雅虎株式會社CSO。1993年東京大學研究所畢業後,進入麥肯錫公司。1997年入讀耶魯大學腦神經科學項目。2001年取得博士學位,回到麥肯錫公司。2008年進入雅虎。歷任COO室長、事業戰略統籌總部長,2012年起任現職。

相關報道

精選視訊

最新專題

バナーエリア2
  • nippon.com專欄
  • In the news