ChatGPTやCopilotに似た生成AI「Claude3」(大規模言語モデル)が米国時間2024年3月4日にサービスを開始しました。
開発したのは、サンフランシスコに拠点を置く AI の安全性と研究を行うAnthropic という会社です。同社の学際的なチームは、ML、物理学、ポリシー、製品にわたる経験を持っています。
「Claude3」には、利用ケースを踏まえ、最適な速度とパフォーマンスを実現する「Opus」、「Sonnet」、「Haiku」の三種類のモデルがあり、このうち「Sonnet」は無料で使えます。
「Haiku」は、業界トップスピードで「軽くて速い」。「Sonnet」は、効率的で高スループットのタスクを実現するためのパフォーマンスと速度の最適な組み合わせ。「Opus」は、Anthropic社の最もインテリジェントなモデルで、複雑な分析、複数のステップによる長いタスク、高次の数学およびコーディングタスクを処理できます。
早速、使ってみる
最初に結論を書くと、「Sonnet」を無料で使ってみた感想は、とても使い物にならないということです。
その理由は、以下のようなエラーがたびたび出ること、さらに、わずか11ターンで利用リミットに達し、それ以降、使えなくなること。しかも、リミットの設定があること自体、何ら説明がありません。
まだ、何も聞いていないうちに使えなくなってしまいました。
まず、最初に遭遇するのが下のエラー表示です。
「予期せぬ容量制限のため、クロードはあなたのメッセージに返信できません。すぐにもう一度お試しいただくか、クロードプロへのアップグレードをご検討ください。」
何度かリトライするうちに、画面が進みます。
一番困るのが下のエラー。これが表示されたら終わりです。つまり、使えなくなると言うことです。
「この時点でクロード・メッセージの上限を超えました。再試行する前にしばらくお待ちいただくか、クロードプロへのアップグレードをご検討ください。」
有料版の利用を勧める記述には胡散臭さを感じます。
実際のチャットがこれ
11ターンの間に聞いたのは、次の通りです。最初に、初期画面が英語で表示されるので、日本語が使えるのか聞いてみました。
can you reply in Japanese?
はい、日本語で返事することができます。どのように書いたらよいでしょうか?話し言葉の口調でお話しするか、それとも丁寧な書き言葉の方がよろしいでしょうか?
丁寧な言葉でお願いします。
人工知能ですが、できる限り丁重に、かつ適切な言葉遣いで会話させていただきます。何かご不明な点やご質問がございましたら、遠慮なくおっしゃってください。親切丁寧に対応させていただきます。
クロードは画像の生成ができますか
申し訳ありませんが、私には画像を生成する機能はありません。画像を分析し、その内容を説明することはできますが、新しい画像を作り出すことはできません。画像生成機能は非常に高度な技術であり、現在のAIアシスタントの多くには実装されていない機能です。画像に関する質問がありましたら、添付された画像を解析して回答させていただきます。
このチャットは回数に制限がありますか
いいえ、この会話には回数の制限はありません。私はあなたとの対話を楽しみにしており、ご質問やご要望にできる限り丁寧に対応させていただきます。気が済むまでお話しいただけます。また、質問の内容によっては、より詳細な説明が必要になる場合もございますので、その際はよろしくお願いいたします。
あなたはどの時点までの情報を学習していますか?
私のデータベースは2023年8月時点で最後の更新が行われており、それ以降の情報は含まれていません。そのため、2023年8月以前の出来事については詳しく説明できますが、それ以降については2023年8月当時の一般的な見解に基づいた回答を行うことになります。最新の情報が反映されていない点はご容赦ください。不明な点がありましたら、遠慮なくお尋ねください。
・・・などとチャットをしていたら、11ターン目で上のエラー「クロード・メッセージの上限を超えました」が出て終わってしまいました。
数分の間隔でリトライしても無理だったのですが、4時間くらい間隔を置いて再度やってみたら、無事、認識されました。
クロードはアップロードした文書ファイルの要約を作成できるようですが、字数制限はありますか
先ほど、「クロード・メッセージの上限を超えました」のメッセージが出て使えなくなりました。10ターンまでしか使えないと言うことですか。時間をおいて再度試したら、エラーは表示されずチャットができるようになりました。上限とは何か説明してください。また、アクセスできない時間についての規定があるのなら教えて。
聞きたいことは大体聞けたので、これでチャットを終了しました。
エラーが頻発したりサーバー負荷の分散措置が採られているようで、要はユーザー無視のサービスという感じがします。使いたいときに使えないのでは話になりません。
これは、サービス開始の初期段階で生じているトラブルのように感じますが、管理人はちょっと使えないと感じました。時間が経てば改善される可能性もありますが、その頃には情報を知った利用者が増え、アクセスすら難しくなる。そんな気がします。
用途によっては使えるかも知れない[Claude3]
ただ、他の生成AIができないアップロードしたファイルの要約や画像の説明ができる、さらに非常に長い文章にも対応可能なようなので、特定の目的で使う分には役立つかも知れません。例えば、グラフの説明。グラフを読み取り、表を作成できるようです。自分で作った表の場合、元データを持っているので、グラフや表の作成など簡単ですが、どこかで見つけたグラフから表を作成するのはほぼ不可能です。
管理人が着目するのは、現時点で元ファイルのページ数に制限がかけられていない点です。数百ページの英語の論文の全文翻訳が可能かも。
一般的な質問は、ターンが無制限で使えるChatGPTやCopilot、文書ファイルの要約や画像解析は[Claude3]という使い分けが、無料で使う一般ユーザーには有用かも。
[Claude3]に文書や画像のファイルをアップロードする場合の制限は、最大5つ、各10MBまでとなっています。これを知っておくと、無駄なターンを回避できます。[Claude3]の現状では、一発勝負で要点のみ聞くための準備が必要です。何をどのような結果を期待して[Claude3]に聞くのかを明確にして準備する必要があります。チャットをやっている余裕はありません。チャット中に突然、制限がかかり終わってしまうからです。
ちなみに、有料版は月額20ドル程度です。試しに有料版を使ってみるのもいいかも。その場合は、契約を解除する方法を最初に確認しておいた方が良いと思います。
PDFファイルの解析には疑問
試しに、PDFファイルの英文を和訳させようとしたのですが、文字認識できず失敗。OCR処理して再度依頼しても翻訳に失敗しました。
PDFファイルは改行コードが行ごとに入るためその処理が難しい。管理人が確認した範囲では、「文献をハードコピーした英文をClaude3は空白のページとして認識する」と言うことです。OCR処理したファイルでも結果は同じでした。そもそも、OCR処理自体の精度に問題があり、そこをAIが解析できるのではないかと期待したのですが、結果は、期待外れでした。
前方後円墳の体積の計算方法を聞いてみる
前方後円墳の体積の計算方法を聞いてみました。
すると、前方部分と後円部分を分けて計算する方法を生成しました。
その式は、一目でおかしいことに気づきます。あなたは気づきましたか。
一目で計算式がおかしいことに気づきますよね。前方部、つまり、台形の計算になぜ「π」が使われているのか。そこで、追加の質問をすると以下の回答がありました。
現在の生成AIは、所詮、このレベルです。メディアが何を騒いでいるのか理解できません。
AIに職を奪われる? そんな記事を書いているのは文化系出身の方なのでしょうか。自ら確認するという最低限のことさえやらずにメディアが偽情報を発信しているとしか管理人には思えないのですが。
こんな簡単なことさえできないのですから、AIの何を信用しろと言うのでしょうか。闇雲に、ブラックボックス化された情報の方が、情報をネタとしてばらまくには好都合。出典はAIだとして責任を転嫁。
管理人は、メディアの無節操な報道姿勢に疑問を感じます。AIができることはとても限られていて、生成された回答には、常に検証が必要があること、さらに、質問者自らが検証できないことをAIに聞いても、その真偽が一切分からないこと、を正しき伝えるべきです。
ついでに、なぜ、こんな質問をしたのか説明します。
前方後円墳の周囲には必ず環濠があります。管理人は、前方後円墳は、周囲の環濠の土が古墳の盛り土に使われたと考えているのですが、この仮説が正しいのかざっくり検証したい。つまり、環濠を掘削した土量と古墳の盛土に使われた土量は一致するのか、ということです。その相違は、さまざまな土量換算係数の範囲内に収まるのか? もし収まらなければ、その差異はなぜ生じたのか? まさに、ざっくりとした検証をやるために聞きました。
正確に古墳築堤体積を計測するには、スライスした断面を積算していく方法が採られますが、ネットで得られる情報ではありません。築堤時の地盤高が重要になります。当然、現在とは全く違うはずです。
この微妙な感触を実感したかったというのが質問した理由でした。この感触をつかんでいると、大きな間違いは起きにくくなります。つまり、どの係数が最も影響するのか、という感触です。それは、土を動かすことによる土量換算係数なのか、当時の地盤高と現在の地盤高の差なのか、想定古墳規模の誤差なのか、ということです。