- シンクタンクならニッセイ基礎研究所 >
- ビッグデータで何が変わるか?
文字サイズ
- 小
- 中
- 大
ここ数年で、情報を得るためにウェブサイトを検索する機会が増えた。エコノミストとして電子データを解析する機会も多い。最近は「ビッグデータ」という言葉も良く聞くようになり、改めて大量の情報に囲まれていることを認識させられる。
ビッグデータという言葉には明確な定義はないが、「3V」によって特徴付けされることが多い。これは、「量(Volume)」「多様性(Variety)」「速度(Velocity)」の頭文字で、つまり、「高速で多様かつ大量に生み出される」データのことである。グーグルの検索欄には、この瞬間も多くの人が様々な言葉を入力しているだろうし、ツイッター上には、様々な内容のツイート(つぶやき)が投稿されている。ツイートは世界の多様な言語でなされ、画像がアップロードされることもある。まさに、高速で多様かつ大量のデータ(ここでは検索ワードやツイート)が生み出されており、3Vのイメージに合致する。大規模なだけでなく、多様であり高頻度で生み出されていることも大きな特徴だ。スマートフォンから取得される位置情報データや、防犯カメラで記録される人間の顔(表情)や動きのデータもこうした3Vデータの代表と言える。
(今までの統計学とビッグデータ)
ビッグデータという言葉は良く聞くようになったが、データをどこからがビッグか明確に区切ることはできない。突如として、画期的な分析手法が生まれた訳でもない。そのため、言葉だけが流行っている感じもするが、今まで非現実的(非常識)と考えられていた分析手法に脚光が当たっているという側面も確かにあるだろう。
ビクター・マイヤー=ショーンベルガー、ケネス・クキエは、ビッグデータ分析が進んだことで、(1)できるだけ全データを使う、(2)精度は重要ではなくなる、(3)因果関係ではなく相関関係が重視される、といった変化(いわば、パラダイム・シフト)が起きていると指摘する1。
筆者は、「法則を確かめる道具」としてのデータ分析から「法則を発見する道具」としてのデータ分析に(再び)注目が集まっているように感じる2。上記の(3)に近いが、因果関係と相関関係の違いというよりは、データを分析する前に、あらかじめ強い仮説(仮定)を設けているか、そうでないかという違いが大きいように思う。
具体的に言えば、前者には、「仮説検定」と呼ばれる伝統的な統計の手法がある。これは、読んで字のごとく「仮説」が正しいか調べるために、データを使って検定(検証)する方法である3。例えば、「ある書店がキャンペーンをしたとき売上がどれだけ増えるのか(あるいは、キャンペーンは売上増に貢献するのか)」という事柄を確かめるために、一定期間の売上データを収集して検証するような例が挙げられる。この例では「キャンペーン(原因)⇒売上増(結果)」という仮説(因果関係の想定)があって、それをデータによって確かめている。経済学の分野では、経済理論を、現実のデータを用いて検証する実証分析と呼ばれる研究もさかんである。
一方、あらかじめ強い仮説(仮定)を設けない後者のアプローチは、「データマイニング」と呼ばれる。こちらはデータからお宝となる事実を「発掘(マイニング:mining)」する作業である。このアプローチは、とにかく沢山のモノの中から関係があるものを手当たり次第に探す。その結果、「理由は分からないけど、紙おむつとお酒が一緒に買われることが多いことが判明した」などという事実が発掘される。もちろん、結果的に因果関係などなんらかの関係が推測できることもあるが、とにかく沢山のモノの中からなんらか関係があるものを手当たり次第に探す点に特徴があると言える。
感覚的に言えば、同じツイートと株価の関係を調べるにしても、「ポジティブ(楽観的)なツイートが多いときには株価が上がるだろう」と仮説を設定してデータを調査するのは仮説検定、「株価が上がるときに投稿されているツイートの特徴はなんだろうかと内容、言語、単語数、地域など様々なことを調べていく」方法はデータマイニングと言えるだろう。
前者のようにデータを「仮説を検証する」ために使うならば、母集団が大きくてもビッグデータを使う必要はない4。ただ、データを「法則を発見する」ために使うならば、ビッグデータはできるだけ大きい方が良い。発掘しがいがあり、思い至らなかった知見が得られる期待も高まる5。
これまで、こうした「法則の発見」は、熟練労働者の経験などに頼ってきた部分が大きい。しかし、これらの知識や法則の発見というプロセスに、データの力が役立つようになっている。実際、検索ワード、ツイート、位置情報データ、顔や動きのデータなどから、お宝を発掘する動きは進んでいる。
(人間の役割とコンピュータの役割)
もうひとつ注目すべきは、データを解析するコンピュータやアルゴリズムの発達である。処理能力の向上だけでなく、機械学習(ベイズ推定)など、3Vのデータと相性が良い分析手法・アルゴリズムが発達し、コンピュータが代替できる領域が広がっている。情報の「蓄積や集計」は機械が最も得意とするところだが、それだけではない。
例えば、検索サイトでは、大量のウェブサイトの中から適切と思われるサイトを上位に表示してくれる。この場合、情報の「取捨選択」はほとんど機械がしてくれている。オンラインショッピングで人の購買履歴を学習し、その人が好みそうな商品をオススメすることなども機械が行うようになった。また、受け取ったメールを迷惑メールか否かの判断も機械がしてくれる。これらは、情報の「解釈」を機械がしてくれる例と言えるだろう。迷惑メールか否かの分類は、マークシート方式のテストを正解と不正解に分類するのとは違って、明確な分類基準を設けることは難しい。しかし、人間がメールの内容を読み「これは迷惑メールだろう」と判断するように、機械が迷惑メールとはどういうものかを学習し、分類してくれるのである。
こうした機械による判断は、多くのデータ(購買履歴やメール)を学習させればさせるほど性能が上がる。将棋ソフトは、まだ短時間での全数探索は出来ないけれど、大量の局面(良い手・悪い手)を学習することで、どの手が最も良い手かを判断しており、最近は、将棋ソフトがプロ棋士に勝利できるほどの実力をつけていることで話題にもなった。道徳的な議論を棚上げすれば、人事評価や就職(採用)などの相性判断はすぐに機械化できるだろう(男女の出会いも…)。
これまで、コンピュータはデータを「集計や蓄積」することが主流だったけれど、いまは、コンピュータがデータから「判断や評価」を行うようになっている。
今後、ビッグデータの流行を経て、さらに機械の存在感は大きくなるだろう。それだけ人間の役割は少なくなるかもしれない。
ただ、それは人間がより「人間らしい」仕事に注力できる時代なのかもしれない。そういった「人間らしさ」とはなんだろうかと考えつつ、ビッグデータの今後に注目している。
(2013年11月08日「基礎研マンスリー」)
このレポートの関連カテゴリ

03-3512-1818
- 【職歴】
2006年 日本生命保険相互会社入社(資金証券部)
2009年 日本経済研究センターへ派遣
2010年 米国カンファレンスボードへ派遣
2011年 ニッセイ基礎研究所(アジア・新興国経済担当)
2014年 同、米国経済担当
2014年 日本生命保険相互会社(証券管理部)
2020年 ニッセイ基礎研究所
2023年より現職
・SBIR(Small Business Innovation Research)制度に係る内閣府スタートアップ
アドバイザー(2024年4月~)
【加入団体等】
・日本証券アナリスト協会 検定会員
高山 武士のレポート
日付 | タイトル | 執筆者 | 媒体 |
---|---|---|---|
2025/05/01 | ユーロ圏GDP(2025年1-3月期)-前期比0.4%に加速 | 高山 武士 | 経済・金融フラッシュ |
2025/04/23 | IMF世界経済見通し-トランプ関税で世界成長率は3%割れに | 高山 武士 | 経済・金融フラッシュ |
2025/04/18 | ECB政策理事会-トランプ関税を受け6会合連続の利下げ決定 | 高山 武士 | 経済・金融フラッシュ |
2025/04/16 | 英国雇用関連統計(25年3月)-緩やかながらも賃金上昇率の減速傾向が継続 | 高山 武士 | 経済・金融フラッシュ |
新着記事
-
2025年05月02日
曲線にはどんな種類があって、どう社会に役立っているのか(その11)-螺旋と渦巻の実例- -
2025年05月02日
ネットでの誹謗中傷-ネット上における許されない発言とは? -
2025年05月02日
雇用関連統計25年3月-失業率、有効求人倍率ともに横ばい圏内の動きが続く -
2025年05月01日
日本を米国車が走りまわる日-掃除機は「でかくてがさつ」から脱却- -
2025年05月01日
米個人所得・消費支出(25年3月)-個人消費(前月比)が上振れする一方、PCE価格指数(前月比)は総合、コアともに横這い
レポート紹介
-
研究領域
-
経済
-
金融・為替
-
資産運用・資産形成
-
年金
-
社会保障制度
-
保険
-
不動産
-
経営・ビジネス
-
暮らし
-
ジェロントロジー(高齢社会総合研究)
-
医療・介護・健康・ヘルスケア
-
政策提言
-
-
注目テーマ・キーワード
-
統計・指標・重要イベント
-
媒体
- アクセスランキング
お知らせ
-
2025年04月02日
News Release
-
2024年11月27日
News Release
-
2024年07月01日
News Release
【ビッグデータで何が変わるか?】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。
ビッグデータで何が変わるか?のレポート Topへ