特集 「ビッグデータ」がもたらす未来
ビッグデータの「正体」とその利活用への道

安宅 和人【Profile】

[2014.10.15] 他の言語で読む : ENGLISH | 简体字 | 繁體字 | ESPAÑOL |

ビッグデータとはそもそも何か。その定義と特徴を踏まえてビッグデータが最も「威力」を発揮する分野を提示するとともに、日本における利活用環境の根本的な問題点に迫る。

ビッグデータの定義

昨今、「ビッグデータ」に対する関心が高まっている。もともとはマッキンゼー・グローバル・インスティチュートが2011年に出したレポートがきっかけだ。既存の情報処理システムでは対応できないレベルの情報量を利活用する時代が来るという主旨の論考で、その戦略的な利活用が大きなビジネスチャンスを生むという可能性を示唆した。

そもそもビッグデータとは何か。字義的には既存の情報処理でカバーできない膨大な情報量を指すが、実際には特定のサービスに関する利用データ(ログデータ)を大量に蓄積したものに、ユーザーの属性データをつなげた(属性データはない場合もある)ものが、発生単位レベルで、全量取得できる時にビッグデータといわれる。

典型的なのはインターネット系サービスの利用データだ。また小売の売上データ(POSデータ)や電力の利用データ、加速度センサーやワイヤレスの活動量計などからのセンサー・データも含まれる。

標本抽出データと異なり、対象としているサービス利用者の全利用データが入っている結果、時間的には1日、1時間を束ねたものというより、毎分・毎秒などの発生ベースのものとなる。地域情報的には、市区町村やその下の区分レベルではなく、6桁、7桁レベルの緯度経度レベルで分かることも多い。

ビッグデータの3つの特性とは

一般的には量(Volume)が膨大で、多様性(Variety)が高く、データ発生の速度(Velocity)がとても速いことがビッグデータの特徴とされ、総称して「3V」と呼ばれる。だが、例えば典型的なビッグデータである電力、加速度センサーのようなセンサー系のデータなどに検索のキーワードのような「多様性」があるとはいえない。速度や量の多さという条件で見たときも同様で、必ずしも3Vが常に当てはまるということではない。

利用視点で見たビッグデータの特性は3つある。

1つは取得できる「属性の厚み」が、一般的な行動観察やアンケートデータに比べると薄いことだ。いつ利用したとか、どのくらい利用したということはわかっても、「どういう状況で、どういう理由・目的でその活動が行われたのか」という利用文脈はわからない。ユーザーの属性情報(幼い子どもの有無、職業、教育レベル、所得水準等々)も薄い。マーケティング利用上の課題といえる。

2つめは、全ての発生データをカバーしていることだ。サンプリングデータでは見えない、発生頻度が低いテール部分に当たるデータ独特のパターンを見出すことができる。

3つめは、情報の利活用のリアルタイム性だ。ビッグデータは消費や利用の各場面で発生したものをリアルタイムで取り込み、対応できるため、特定の行動、ニーズが発生している瞬間を捉えて利用できる。例えば、ある車についてすごく関心があるユーザーが関連のページを見た場合、すぐにその車に関する情報を提供することができる。これは既存のマーケティングデータでは不可能な取り組みだ。

ビッグデータが強さを発揮するケース

次に、顧客への「価値の提供」というマーケティングの視点に立った6つのステップから、データ利活用の広がりについて見てみたい。

1つめのステップは、多くの商品開発、サービスごとの戦略立案の基本となる「市場構造・ニーズの見極め」だ。2つめが、その市場の見立てに基づき、核となる提供価値、サービスの属性を設計するステップ。

3つめは、顧客ごとへのマーケティング、4つめが前述のようにニーズが発生した場面での「打ち手」(広告、メール、サイトコンテンツ等)の提供、5つめが1~4のステップを踏んだ後の効果検証、6つめが、その上で近未来を数値的に予測することだ。

ビッグデータが特に強いのは、上記のステップの3つめ以降だ。例えば、個別のユーザーの特性に合わせたサービス・情報提供にはビッグデータは欠かせない。典型例としては、インターネット上で過去の利用パターンから不適切な情報を排除する広告提供や、消費属性別に作り分けたクーポン提供などがある。

リアルタイムで広告を打つ、あるいは検索窓に今話題の単語の一部分を入力した時、その瞬間に話題になっている関連の言葉が自動的に提示されるのは、利用データの蓄積で生み出された「機械学習」によるものだ。このような機械学習によるビッグデータの活用は、サービス提供者側の人間がコンテキストを理解しなくても使えるのが特徴だ。

また、見たい情報のメッシュを細かくしようとすればするほど、ビッグデータの力なしには不可能になる。例えば、特定の1週間、ある駅前店における夕方の鶏肉のまとめ買いの変化を見るケースだ。

この記事につけられたタグ:
  • [2014.10.15]

ヤフー株式会社チーフストラテジーオフィサー(CSO)。1993年に東京大学大学院卒業後、マッキンゼー・アンド・カンパニーに入社。1997年にイェール大学脳神経科学プログラムに入学。2001年博士号取得。マッキンゼーに復帰。2008年ヤフー入社。COO室長、事業戦略統括本部長を経て、2012年より現職。

関連記事
この特集の他の記事
  • 医療ビッグデータ、その課題~DPCを中心に全国の病院で日々蓄積される患者の診療情報。この膨大なデータを分析し、医療の質向上や医療費削減に活用できるのか。最前線の動きを紹介する。
  • ビッグデータの活用に向けた日本の課題「上手に分析すれば社会や経済活動に大きなメリットがある」――。こんな期待の一方で、プライバシー侵害の不安も消えないビッグデータ利用の将来像。日本政府の制度改正に向けた動きを解説する。

ピックアップ動画

最新の特集

バナーエリア2
  • nippon.comコラム
  • in the news
  • シンポジウム報告