IPよもやま話
IちゃんとP(パパ)と小野田君の会話が続きます。
今日は、パパの「ビッグデータの話」だったわよね。
そうだったね。
愛ちゃん「ビッグデータ」って何のことか想像がつくかな?
そうねぇ。「ビッグ」だから「大きなデータ」か「大事なデータ」ってことかな?
そうだ、機密性が必要で大きなデータとなると「国家のデータのように巨大なデータ量を持つデータ」ってとこでしょ。
どう?正解?
はっはっは。
直訳英語できたか。ピンポーン、正解といいたいところだが、「大容量のデータ」と言う意味だけでは不正解ともいえる。
「ビッグデータ」は愛ちゃんの言う「データ量の大きさ」の意味で解釈すれば「巨大なデータ」となるね。
現在、日本企業の大規模DWH*1の容量は、数テラバイトの規模が多いんだが、例えば、1,000テラバイト(1ペタバイト)の規模のシステムを「ビッグデータ」と言ってもいいとされているんだよ。
あら、じゃあ正解じゃない。
うんうん。
でもね、「大容量」のことだけをいえば、大量のデータを利用している企業は世界にすでに存在しているから、容量だけでは駄目なんだ。
単純なペタバイトなら「ビッグデータ」ではないのだよ。
勿体ぶらずに言えば、いまキチンとした定義は無いんだが、「ビッグデータ」にはもう少し複雑な意味があるんだ。
「ビッグデータとはインターネットの普及とICT技術の進化によって生まれた、これまで企業が扱ってきた以上に、より大容量かつ多様なデータを扱う新たな仕組みを表すもので、その特性は量、頻度(更新速度)、多様性(データの種類)によって表される。」という定義をしているようなんだ。
何か、分かり難いですね。
そうだろうね。
総務省の「ビッグデータの定義」のようなものをみると「ICT(情報通信技術)の進展により生成・収集・蓄積等が容易になる多種多量のデータ(ビッグデータ)を活用することによって、異変の察知や近未来の予測等を通じ、利用者個々のニーズに即したサービスの提供、業務運営の効率化や新産業の創出等が可能」としているね。
するとその範疇に含まれるデータにはどんなものがありますか?
それを図1に示した。
分かり易く言うと、「SNS投稿」「カード履歴」「気象データ」をイメージするといい。
図1 ビッグデータを構成する各種データ(例)
(補足)それぞれのデータの説明は脚注を参照。
図には、いろいろなカテゴリーのデータがあるが、「ビッグデータ」を身近なことで説明すると
などをかき集めて、専門家が分析すると「いろいろなめしの種」が生まれるってことだ。
ピンと来ないわ!
例えば、こんなことができるんだよ。
スマホや携帯電話の通話やメール送信先を分析すれば、他の携帯電話会社に乗り換えられる危険を事前に察知し、個別に値引きキャンペーンや折衝ができるし、クレジットカードが使われた場所とスマホのGPSデータ、住所などを照合すると不正利用か否かも分かるといった具合だ。
要するに我々が日々刻む「デジタルの足跡」が「ビッグデータ」であり「宝の山」ということだ。
そうなんだ。
そういえば、最近の新聞で「ビッグデータ個人保護に穴」という記事を見たの。
「Suica履歴 JR販売」のサブタイトルがあったんだけど、パパはこの記事は読みましたか?
うん、読んだよ。
私も一応読んだのですが、よく理解できませんでした。
悪いけど少し解説してくれないかな。
仕方のないお嬢さんだね。
図1にも書いてあるが「個人に関する様々な情報」は膨大な量*10になってきているよね。こうした膨大な情報(ビッグデータ)は、企業にとっては「宝の山」になるが、個人のプライバシーをどのように守っていくかが問題だと言う記事なんだよ。
その中身は?
図2 suicaの履歴情報が原因
「Suicaの履歴(JR販売)」の話は、JR東日本が日立製作所に市場調査用データとして、Suica情報を平成25年1月から販売し始めたんだ。
「個人情報」にならないように、氏名や住所等は除外して、性別や年令、乗降日時だけを提供しているんだが、Suicaの利用者に事前説明をしていなかったことから、利用者の反発を招いたんだね。
日立さんはどんな考えなの?
新聞報道*11によると「2000年代半ばからビッグデータの活用を模索してきた」「個人のデータに関わる分野では、慎重を期して参入時期を模索してきた」といっているね。
それを購入する企業側(この記事は日立さん)には、どんなメリットがあるの?
パソコンやスマホなどの普及で、ネット上や企業内に大量に蓄積されるようになった個人の情報記録を分析すれば、個人の趣味や嗜好が分かるよね。
これを活用すれば、消費者ニーズに合った広告や商品開発に繋げられると言う期待があるんだよ。
そうなんだ。
その反面「個人のプライバシーを守ること」に、いろいろ問題があるってことね。
そう、その通り。
日本では、法制度面での不備も指摘されているんだ。
具体的に言うと「個人情報保護法では、個人情報を第三者に提供する場合、本人の同意が必要となるんだが、ビッグデータの中で扱われる個人に関するデータ(パーソナルデータ)の大半は、この法律の対象外」なんだよ。
ビッグデータに個人保護の穴があること、それは「法の対象外」で企業頼みになっている現状を大きな問題だと報じているのさ。
さっき言ったが、この法律が「個人情報として規定」するのは、氏名や住所などによって個人が識別される情報だけになっている点だね。
「日本では不備」と言われましたが、海外ではどうなんですか?
うん。「パーソナルデータの取扱い」について、欧米では活用やルール作りが進んでいるんだよ。
アメリカには
EU(欧州連合)は
といったところだね。
日本の現状はどうなっているんですか?
そうだね。
箇条書きで説明すると
というところだ。
冒頭で「ビッグデータ=宝の山」といった説明がありましたが、日本のビッグデータの市場はどのように展望されていますか?
図3 日本のビッグデータ市場予測
うん、最近の新聞報道*13だが、図3のように報じられていたね。
IDCジャパンの予測だが、図3のように日本のビッグデータの市場は急拡大すると図3 日本のビッグデータ市場予測見られいるんだね。
ビッグデータを利用したサービスって、どんなものが出ていますか?
典型的な例は、インターネット検索サイトで、最初の文字を入れた途端に、候補の言葉が自動的に出てくるサービスだ。
例えば、「の」と打つと「乗り換え案内」が選択肢の上位に出てくると言った具合だ。ヤフージャパンによると、検索回数が多い単語ほど上位に出てくるようになっている。
もう一つ例を挙げれば、NTTドコモは、基地局が常に携帯電話の位置情報を把握していることを利用して、データを販売するビジネスを平成25年の10月から始めたそうだ。6200万件の顧客情報と組み合わせて、ある地域で特定の時間に「神奈川県に住む20代の女性が○人いた」という推測ができるから、企業向けに販売したり、行政に対して「帰宅難民の情報の推計」などを提供し防災に役立てるといったようなことだね。
パパ。
新聞報道なら私も1つ報告できます。
えーっ!愛ちゃんが「ビッグデータの記事」を読んで、しかも覚えていたのー?
そうです。
それはね、「観光集客にビッグデータ」というタイトルで、一面トップだったのよ*14。官公庁が携帯電話などのGPS機能を活用して全国8地域で約70万人の観光客のビッグデータを収集・分析して、新たな観光ルート・スポットの発掘に生かしたり、特産品の開発に役立てたりするんですって。
政府は、国の方針として「観光立国」を目指していて、来日外国観光客の目標を2030年までに3000万人にするそうだし、将来はデータを集める地域を増やして観光振興につなげる考えなんだね。
愛ちゃん、大したものだ。しっかり新聞を読んでいるね。
いやいやお陰さまでビッグデータのこと、大変よく分かりました。
有難うございました。
パパ。私、テレビで「情報漏えい」って言葉を聴いたの。
内容は忘れちゃったんだけど、今日勉強したデータが外部に洩れて問題になることでしょう。教えて欲しいな。
はっはっは。いいよ、説明してあげよう。