Google検索でフェイク検索結果が表示される
NHKの女子アナの異動関連で「野口葵衣アナ」に関する記事が目にとまりました。管理人が見ている「ブラタモリ」の新年度からのアシスタントになるらしい。
記事内容をざっと読むと、比較的新人アナなのに抜擢、みたいなことが書かれていました。管理人は、「野口葵衣アナ」を知らないので、Googleで検索。すると、検索結果の右側にこんな表示が出ました。
「野口葵衣アナ」は現在39歳なのだそうです。Googleはその根拠として、Wikipediaをあげています。
ここで疑問が。野口葵衣アナが39歳なら、さっき読んだ記事と辻褄が合いません。まるで新人アナのような書き方になっていたので。
そこで、Wikipediaを開いてみると、・・・・。
Wikipediaには正しく26歳と表示されています。
つまり、Google検索結果が、Wikipediaからの引用として表示した内容が嘘だったことが分かります。
さらに深刻なのは、Googleは単に39歳と年齢を間違えただけでなく、生年月日を1982年4月6日としている点です。確かに、1982年4月生まれの方は現在39歳です。だからこそこの間違いはとても深刻だと言えます。誰も間違いに気づかないからです。
生年月日 1982年4月6日(年齢39歳) ×
生年月日 1995年4月6日(年齢26歳) ○
最初は、Wikipediaの記述が間違っていて、その間違った記事の古いキャッシュを表示しているのかと思ったのですが、たぶん違う。Wikiの執筆者は(野口アナに関心を持っているので)こんな間違いは絶対しません。
このような誤った情報が表示される原因は全く分かりません。
問題の部分は、「ナレッジパネル」と呼ばれるもので、Googleがさまざまな情報に基づき作成しているもの。しかし、出典をあげながら出典とは異なる内容を表示するのはフェイク情報であり、言い逃れはできません。
なお、上の画像は3月16日にキャプチャしたものですが、現在は、正常に表示されています。
今回の誤表示は、単に修正すれば済むというものではなく、Google検索の正確性が問われるものです。誤表示がなぜ発生したのか、その原因を説明してほしい。
たぶん、これが間違いの真相
ネットで調べてもGoogle検索でフェイク情報が発信されている原因を見つけることはほぼ不可能です。なぜか分かりますか? そんな記事を書いてもGoogleが上位に表示しないので、そんな記事は誰も書かない(www)。
いろいろ調べてみると、野口綾子さんという1982年4月6日生まれのタレントMC、元グラビアアイドルと誤認したというのが真相のように思います。
野口葵衣さんと野口綾子さんの共通点は、名字が「野口」、誕生日が「4月6日」。それ以外の共通点は見つけることができません。
Googleが使っているアルゴリズムは、過去にも同じような誤検出を繰り返しています。画像検索が最たる例でしょう。画像検索で表示される画像リストの不具合には、通常、誰も気づきません。
Googleが「ナレッジパネル」を表示する場合、画像検索のアルゴリズムが優先して使われ、その結果、今回のような不具合を引き起こしているのではないかと推測します。そして、ディープラーニングしすぎて、どれが正しい情報なのか検索エンジン自体が分からなくなり、キーとなる特定の情報をつなぎ合わせて正解として出力する。キーとなるのは名字と生まれた日付け。ディープラーニングをたくさんした結果がこれ、という結論のようです。
なぜ、そう考えるのかは、過去記事『この美人は誰だとネット検索していたら思わぬ展開に』をご覧ください。
参考
「ナレッジパネルについて」、Google