生成AIは、ユーザーが質問するときに使用している言語の範囲内でしかデータの検索をしていないのではないか。
つまり、日本語で質問する場合、生成AIは、日本語で書かれた情報しか検索していないのではないか。
もしそうであるならば、外国の情報を調べる場合、その国で使われている言語で質問する必要があります。こんなことは誰も書いていないこと。しかし、それは本当かも。
なぜ、気づいたか
生成AIはとても便利です。デタラメを羅列した生成には慣れたので、使い方のコツが分かるととても役立ちます。
ところで、外国の情報を調べていると、出典に挙げられているのが、全て日本語のサイトだと気づきました。例えば、ペルーの新聞の報道を調べようとしても、出典は日本語サイトしか表示されません。日本語サイトを除外して、現地の報道のみ調べるように指示しても、結果は同じです。「日本語サイトを除外して、現地の報道のみ調べます」と回答しながら、回答に書かれている出典は全て日本語サイトのものばかりです。
つまり、生成AIがいつものように嘘を生成していることが確認できます。
では、どうすれば良いのか。
外国の情報を調べるには
外国の情報を調べるには、現地で使われている言語で質問すると、正しく回答を生成することができるようです。
例えば、ペルーの情報を調べるには、スペイン語で質問します。そして、回答は日本語でするように指示します。生成AIに日本語の質問文をスペイン語に翻訳させ、翻訳結果をコピーペして、改めて質問する。この手順が必要です。
ペルー・ナスカで発見された三本指のミイラについて
ナスカで発見された三本指のミイラについて、詐欺師のメキシコ人がいろいろ暗躍しているようで、ネット上で話題になっています。
そこで生成AIに質問したところ、まともな答えを生成できないことに気づきました。すべて、日本語のサイトからの情報をまとめた記述になっています。この件については、そもそも外国ニュースサイトの情報がいい加減なので、それをもっともらしく引用している日本のサイトの情報は読む価値がありません。曖昧、不正確、出典の間違い、意図的な情報操作、肩書き詐称、など、日本メディアの記事のデタラメな内容には辟易します。それを信じている読者もいるようなので困ったものです。
例えば「Claude3」の場合、以下のような回答をします。

しかし、この質問に対する回答は嘘で、日本語データベースしか検索していないのです。その証拠に、スペイン語で質問すると、しっかり回答します。


この状況は、その他の生成AI、ChatGPTやCopilotでも同じです。
外国語で書かれた情報を知りたいのであれば、その言語で質問するのが基本のようです。言語ごとのデータベースを横断的に検索するレベルには達していないようです。
アイヌ語に翻訳できるのはどの生成AIか
アイヌ語の翻訳はほぼ全滅です。CopilotもClaudeも全く翻訳してくれません。そんな中、ChatGPTだけが真摯に取り組んでくれました。結果はデタラメですが。
ChatGPTのこのタイプの回答はデタラメです。でも、それで諦めるのはChatGPTが対話型のツールだと言うことを忘れた使い方です。間違いを指摘することで、どんどん精度が向上していきます。
今回試したのは、「月がとても美しいので湖で歌いました。この文章をアイヌ語に翻訳してください。」という質問です。
これに対し、ChatGPTは、
「ウンペケツイペ ケナ ピカ ユカラクトンプンネペ。」と回答を生成しました。
逐語訳を頼んだら、できないとの回答。そこを頼み込むのが手腕の見せ所です。すると、次の回答が生成されました。
元の文「ウンペケツイペ ケナ ピカ ユカラクトンプンネペ。」は、「月がとても美しいので、湖で歌いました。」という意味です。ここで「ウンペケツイペ」は「月がとても美しい」という意味を表し、「ケナ」は「ので」、「ピカ」は「湖」、「ユカラクトンプンネペ」は「歌いました」という意味です。

「月」はアイヌ語で「チュプ」です。「ウンペケツイペ」は「月がとても美しい」という意味を表し、と訳したようですが、訳文に「チュプ」が見当たらないのはなぜ? 「月」は何と翻訳しているのですか


私はあなたの回答が正しいのか判断できません。この回答は正しいと考えて良いですか


質問するたびに回答が二転三転しますね。この回答で本当に間違いないですか。

確認してみましょう。アイヌ語の逐語訳は次のようになります:
- 「ウンペケツイペ」: 「ウンペケ」(月)+「ツイペ」(非常に)。つまり、「月が非常に」を表します。
- 「ケナ」: 「ケナ」は接続詞で、「ピカ」の後に続くことで「ので」という意味になります。
- 「ピカ」: 「ピカ」は「湖」を指します。
- 「ユカラクトンプンネペ」: 「ユカラク」(歌う)+「トン」(過去形接尾辞)+「プンネペ」(私はした)。つまり、「歌った私は」を表します。
したがって、正しい逐語訳は次のようになります:
「ウンペケ ツイペ ケナ ピカ ユカラクトンプンネペ。」 = 「月が非常に ので 湖 歌った私は。」

歌うは「シノッチャ キ」です。「ユカラク」(歌う)は間違いではありませんか


「ウンペケ」の訳が最初の訳に戻っていますね。「チュプ」はどこに行った?

おっと、すみません、再び混乱を招いてしまいました。アイヌ語で「月」を表す正しい語は「チュプ」です。したがって、正しい逐語訳は次の通りです:
- 「ウンペケツイペ」: 「ウンペケ」(チュプ)(月が)+「ツイペ」(非常に)。つまり、「月が非常に」を表します。
つまり、正しい逐語訳は次のようになります:
「チュプ ツイペ ケナ ピカ シノッチャ キ トン プンネペ。」 = 「月が非常に ので 湖 歌った私は。」
アイヌ語の知識のない管理人には、ChatGPTが生成した最終の回答が正しいかどうか全く分かりません。こんな質問しなければよかったと後悔しています。答えの分かっている問いにすべきでした。ただ、最初の回答と比べ、最後の回答は、かなり改善されていると思います。たぶん。デタラメの可能性もありますが。