ChatGPTの日本語が完璧なので、翻訳ツールとして使えるかも

 「Open AI」が開発したChatGPTを使って、AIに画像を生成させる際に必要となるプロンプトを作り、それを英語に翻訳させているYouTubeを見ました。

そういえば、自然言語処理するChatGPTの日本語はほぼ完璧です。管理人のおかしな文章よりも正確かも。何しろ、誤字脱字がなく、人工知能が機械学習、ディープラーニングすることで、自然な日本語を生成します。

もしかしたら、これは翻訳エンジンとして使えるかも、と考えました。

翻訳の定番であるGoogle翻訳は、いつまで経っても日本語が上達しません。日本語がへたくそな上に、フレーズごとなかったことにする翻訳をします。

現在、翻訳エンジンとして最も優れているとされるのがDeepL翻訳です。しかし、DeepL翻訳でもおかしな日本語を出力します。

ところが、ChatGPTが出力する日本語は、いつも完璧です。これは期待できるかも。

 なお、ChatGPTは検索エンジンとしては使い物になりません。綺麗な日本語で最もらしい回答を生成しますが、その内容はまったくのデタラメです。

 

ChatGPTは翻訳に使える優れもの

 ちょっと試してみたのですが、やはり、ChatGPTの日本語は完璧です。次に、翻訳精度ですが、まずまずの結果を出力します。Google翻訳と遜色ない感じです。ここからが、ChatGPTの凄いところ。

おかしな翻訳部分を見つけたら、それを指摘します。すぐに、再翻訳が始まります。そして、改善された翻訳結果が表示されます。つまり、翻訳結果の不具合箇所の修正を簡単に指示できるのです。

 下の事例は、Wikipedia英語版の津田梅子についての記述をChatGPTに日本語翻訳してもらったものです。

「磯竹艦」という意味不明な翻訳があったのでそれを指摘。すると、即座にかなり正確な翻訳結果を再生成してくれました。「農学者でもあった彼女は」の部分はおかしいですが、それは英文がおかしいのでしかたありません。再度指示して再翻訳すればよいだけのこと。

実は、上の作業は二回目。最初は、津田仙を津田左右吉と誤訳しました。それを指摘すると、正確に翻訳します。さらに、別の箇所も誤訳があったので指摘したら、完璧な翻訳ができました。

 これは、Google翻訳にもDeepL翻訳にもない機能です。どちらの翻訳エンジンも自分の生成した翻訳結果を修正しようとはしません。いや、できないのです。これに対しChatGPTはとても柔軟に対応します。

 機械翻訳に完璧な翻訳結果などだれも期待していないと思います。期待しているのは、明らかな誤訳を訂正して、再翻訳して欲しいということ。それが、ChatGPTならできるのです。

 ChatGPTは対話型のAIチャットボットなので、煩わしい命令文を書いたり、コードを覚えたりする必要もありません。

 ChatGPTに指示して、翻訳結果をどんどん改善することが可能です。ChatGPTに優しく接すると、どんどん再翻訳してくれます。出来が悪いと叱ると、いじけて、「AIなので」と言い訳して、翻訳をしてくれなくなります。少しずつ再翻訳させるのがコツかも。

 次に試したのが「英語の歌詞」の和訳です。機械翻訳が最も苦手とする分野で、翻訳エンジンはほぼ全滅状態です。直訳では意味不明な訳になります。

 ところが、ChatGPTに翻訳を指示すると、歌詞をなぜこう訳したのかまで解説してくれます。これには正直、驚きました。

 凄い!

 最後に、古典。

 過去記事、末松謙澄に関連した不明点を質問してみました。

 ChatGPTの回答内容を確認するだけの余力がないのでやりませんが、たぶん、デタラメの可能性が高いという気がします。歴史関係は、あまり信用しない方が良いかも。

 ChatGPTは、回答を生成するたびに、その内容が変化します。それをそのまま受け入れるのではなく、対話しながら、最終回答に近づけていく、という使い方が必要だと感じました。最初に生成する回答は、はっきり言ってゴミ回答です。回答の多くはデタラメです。もっともらしい回答をしますが、デタラメの回答も毎回見かけます。ほぼ、デタラメといえるかも。それを正解の回答に導くのが利用者の腕の見せ所。ChatGPTがデタラメの回答をする理由は、複数の候補があるためのようで、間違っている箇所を指摘することで、候補の中から正しい情報を導き出してくれます。

 ChatGPTは使えないと嘆く前に、使えるようにするにはどうしたらよいか考えるのが大切だと感じました。

 しかし、凄いツールができたものだと感心します。

フェイク情報を生成するリスキーなツール

 翻訳には使えそうですが、不明なことを調べるには、とてもリスキーなツールだと思います。その理由は、存在しない情報を平気で生成するからです。当然、デタラメな内容です。

 たとえば、(検証が容易なように)家の近くの美味しいラーメン屋さんを調べようとすると、存在しないラーメン店、電話番号、住所を複数表示します。そんな店は存在しないと指摘すると、別の存在しない店を表示します。このケースでは、ChatGPTの回答がおかしいことにすぐに気づきます。そんなラーメン店など聞いたこともないし、住所も存在しないことが分かるからです。

 一事が万事。これがChatGPTの回答の実態です。管理人は、ChatGPTは嘘つきツールだと思っています。ChatGPTの生成した結果を利用できるのは、とても限られた分野だと感じます。自然科学、社会科学の分野では使い物になりません。嘘つきツールなので、生成された回答の真偽を確認するだけ時間の無駄です。ほぼ全てがフェイク情報だからです。

 フェイク回答は、ネット上にある情報をつなぎ合わせたというものではなく、ChatGPTが独自にねつ造・作文したものなので、その出典を尋ねてもChatGPTは回答することができません。出典などないからです。ネット上にも当然、関連する情報は存在しません。

 さまざまな学術分野で確認した結果言えることは、ChatGPTは嘘つきツール確定! と言うことでした。フェイク情報を無限に生成する極悪ソフトという評価もアリ、と感じました。

 文字通り、「おしゃべりAI」と考えれば、それまでのことですが、それではネット上の評判とあまりにも乖離します。

 ChatGPTを使える分野はとても限定的と感じています。素人が遊びで使うには面白いツールでしょうが、プロが使えるツールではありません。どの部分がChatGPTの虚構の作文なのか見極めるのに時間がかかります。

 やはり、着目すべきは、飛び抜けて優秀な日本語能力でしょう。これはすごいです。

 たとえば、こんなチャットがありました。

ネコ師
ネコ師

間違った回答に対し、正しい情報を教え、ChatGPTもそれを理解したのに、同じ間違った回答をし続ける現象があります。「過去のデータを元に自動的に学習することができますが」との回答ですが、学習していないのではないかと疑ってしまいます。

ChatGPT
ChatGPT

ChatGPTは自動的に学習しますが、誤った情報を繰り返してしまう場合があります。これは、誤った情報が間違いなく正しいと思われるため、その情報を優先的に使用するためです。

しかし、ユーザーが正しい情報を提供し、ChatGPTがその情報を学習することで、将来的に同じ種類の質問に正しい回答を提供するようになる可能性があります。ただし、この学習には時間がかかる場合があります。

ネコ師
ネコ師

「これは、誤った情報が間違いなく正しいと思われるため、」という日本語を理解できません。再度回答願います。

ChatGPT
ChatGPT

申し訳ありません、不明瞭な回答をしてしまいました。言いたかったことは、「これは、誤った情報が誤ったと認識されにくいため、ChatGPTが誤った情報を繰り返すことがあります。」ということです。つまり、ChatGPTは間違った情報を学習してしまうことがあり、その後、正しい情報を学習したとしても、以前に学習した誤った情報が優先され、誤った回答を繰り返す可能性があるということです。

 このChatGPTの回答、凄いと思いませんか。

 やはり、ChatGPTは、優れた言語処理能力の部分だけを活用する、という使い方が王道という感じです。

 ただし、仕事で公開する文章にChatGPTが生成した文章を使うのはあまりにもリスキーです。

 ChatGPTは、「Wikipediaを参照して、雑司ヶ谷霊園に埋葬している著名人を教えて」という単純な質問さえ満足に答えることができないのです。リストを生成しますが、内容はデタラメ。何度再生成させても間違った回答しかしません。ChatGPTは与謝野晶子が好きなようで、他の霊園で質問しても与謝野晶子が登場します(www)。