2020.05.07 最新トレンド・レクチャー第3回「ビッグデータ」

ビッグデータ
今やすっかり定着した用語「ビッグデータ」。会話の中で「もっとビッグデータを活用して……」などと使うこともあるだろう。しかし、「ビッグデータって何ですか?」と聞かれてさっと答えられない人も多いだろう。
そこで、同じ悩みを持つ電波新聞の新人記者つぐみは、ビッグデータについて勉強しようと先輩記者カゲと一緒に、今日もドクターDのもとに取材にやってきた。

おはようございます!
早速ですが「ビッグデータ」って何ですか?

カゲくん。この子は、ほんとに電波新聞の記者なのかね。

残念ですが。
私が「ビックリ大きなデータのことだ」と言っても納得しないんですよ。

カゲくんの説明は、まあまあ正しいんじゃが、ちょっと足らんわな。
それじゃあ、分かりやすい例を示そう。つぐみくん、スマホで写真を撮ったりしているかの?

いっぱい撮ってます!

それじゃ有名なスマホの写真アプリで、「猫」という言葉で検索してみてくれんか?

はい。
ドクター、いっぱい猫の写真が出てきました。

うむ。
何てことないようだが、どうして、スマホアプリは「猫」という言葉に反応して「猫の写真」をピックアップできたのかね?

言われてみれば不思議です…。

それはの、
スマホアプリ運営者がAI(人工知能)に、膨大な数の「猫の画像」 データを読み込ませて、「この形をしたものは猫である」と機械的に学習させた結果なんじゃ。
膨大な写真データを学習しているうちに、AIは「ははーん、こんな形をしたものが猫というのだな」と判断できるようになる。
その結果、つぐみくんが「猫」で検索すると「猫と呼ばれるものはおそらくこれですね」と判断してくれるわけじゃ。
ただ、形で判断するので、生き物の猫だけじゃなくて、「猫の置物」とか「猫の絵を描いた看板」なども探し出してしまうんじゃが。

ここで、AIの学習に使われている膨大な数の「猫の写真」がビッグデータというわけですか?

そうじゃ。
また、今どきはSNSが普及して自分が飼っている猫や外で見かけた猫の写真を撮ってアップロードする人が、とても多いじゃろ。
そうなると、猫の写真がどんどんたまっていきビッグデータとなっていく。そして、それを取り込んで学習したAIは、さらに賢くなっていくわけじゃ。

それじゃ、そのビッグデータを持っている会社などは、AIにデータを分析させて、いろいろ活用ができるのですね。

そうじゃ。そのことを身近な例で説明しよう。
つぐみくんは、インターネットの通販サイトで買い物をすることがあるじゃろ。
その時、「これもどうですか?」とか「おすすめ」とか、サイトから商品を提案してくることはないかな?
これは、つぐみくんが、いつも何を検索しているか、何を買ったか、そんなデータをサイト側でいっぱいため込んでいて、そのデータを使って、つぐみくんが、興味のありそうな商品を勧めてきたというわけなんじゃ。
さらに、つぐみくんと、よく似た趣味のカゲ子さんがいたとする。
そうすると、つぐみくんと、カゲ子さんのデータと比較して、「つぐみさんというお客さまが買ったこの品物は、カゲ子さんにも勧めてみようかな?」と自動的に判断してレコメンド(推奨)するんじゃ。
そして、本当にカゲ子さんが買ったりすると、「買いおった!」というデータを記録して、カゲ子が興味のありそうな別の商品を、また勧めてくるわけじゃ。

こいつはあやしい〇〇とか買い集めていますから、とんでもないものがレコメンドされていると思いますよ。

余計なことを言うな‼(バキッ)

×●△☆※…

そうかあ。
それで「うまいこと勧めてくるなあ」と感じるわけですね。

ところで、これまで、今後の5G時代には「IoT(モノのインターネット)」といって、何でもネットにつながるようになることは話したわな。

はい、聞きました!

洗濯機や冷蔵庫など、何でもインターネットにつながるんですよね。

そうじゃ。
そうすると、ありとあらゆるものからデータが生まれてインターネットにつながり、それが1カ所に集められると「ビッグデータ」になるのじゃ。
例えば、洗濯機なら「よく洗濯する時間帯」とか「主婦の洗剤の使い方」なども解析できるじゃろう。それをもとに商品開発ができたりする。
だから「ビッグデータは宝の山」といえるじゃろう。そして、使い方によってはビジネスや社会のあり方を大きく変える可能性がある。
「データは次の石油」という言葉もあるくらいじゃ。

なんで宝の山なのですか?

お前は、ほんとに分からないヤツだな~。
自動運転車の走行や、流通の予測とかいろんなことに生かせるだろう。

うむ。
鉄道のビッグデータと外食のビッグデータ、人の流れのビッグデータと買い物のビッグデータ。
いろんなものを組み合わせれば、役立つ発見があるかも知れんの。

しかしドクター。洗濯の時間など自分のデータが取られるのは気持ち悪いです……。
それに、ビッグデータを持っている会社って異様に強くなってしまいません? 人のことが、何でも読めるようになってしまいそうで怖いです。

うむ。
個人のデータのあり方が問題になっておるのも確かじゃ。
そして、最近では巨大なIT企業が、ビッグデータを独占するのは、よくないという機運も高まっていて、EU(欧州連合)では新しい法規制を作ったりしている。「巨大IT企業が個人データを勝手に活用するのはけしからん!」というわけじゃ。

しかし、使い方にもよりますよね。
日本の場合は、災害も多いし、伝染病などの対策にも活用できるといいですよね~。

おっ、ようやく記者らしいことを言ったな。
ドクター、例えば、伝染病の対策なら、ビッグデータを使えば、人の流れとかを基に、いかに感染を防ぐかなど研究できますよね?

うむ。ビッグデータはそういう方向に生かしていくべきじゃな。

ありがとうございました!

また聞きに来ます!

待っておるぞ。
ところで、つぐみくん、あやしい〇〇は、ほどほどにの(笑)。
イラスト ⓒくり ひろし