こんにちは。エイチームライフデザイン技術開発室の鈴木です。
突然ですが、みなさんは「ChatGPT」と「GPT-4」の違いは分かりますか?
OpenAI社は「GPT-4」という大規模言語モデルを開発していて、APIから呼び出して使うことができます。 その「GPT-4」などの大規模言語モデルを、APIを介さず便利に使えるAIチャットサービスの名称が「ChatGPT」となっています。
このように、言語モデルの名称かAIチャットサービスの名称かで異なります。 弊社内でもこれらの違いを混同されて用語が用いられていることが時々ありますが、似たような名称が多くてややこしいのも事実です。 表にまとめてみました。
社名 | 言語モデル(例) | AIチャットサービス |
---|---|---|
OpenAI | GPT-3.5 Turbo GPT-4 GPT-4o mini |
ChatGPT ChatGPT Plus |
Gemini 1.0 Ultra Gemini 1.5 Pro Gemini 1.5 Flash Gemini 1.0 Nano |
Gemini Gemini Advanced |
|
Anthropic | Claude 3 Opus Claude 3.5 Sonnet Claude 3 Haiku |
Claude.ai Claude Pro |
Microsoft | (基本的にOpenAIと同一) | Microsoft Copilot Microsoft Copilot Pro |
※2024年7月時点の情報です
個人の見解としては、大切なのはこれらを暗記することではなく、違いを正しく理解して名称を区別して使う事だと思っています。 それぞれについて、詳細を見ていきましょう。
OpenAI
OpenAIは2022年末「ChatGPT」と「GPT-3.5 Turbo」を公開し、生成AIブームを巻き起こした会社です。 OpenAIのモデルについては、公式ドキュメントに紹介されています。
また名称の扱いという点で特徴的な所として、OpenAIはブランドガイドラインを公開しています。 たとえば「ChatGPT4」という表記を目にすることがあるかもしれませんが、これはブランドガイドライン上は間違ったモデル名だと言われています。 このように、正しい名称の扱いと間違った名称の扱いを区別するよう呼びかけています。
OpenAIの言語モデルは、バージョン番号の後に「Turbo」「mini」などの単語を続けることで性能を区別しています。基本的には、高性能なフラグシップモデルと、低価格で高速な小さいモデルの2種類が用意されており、別々に更新されていきます。
2024年5月に登場した新しいモデルである「GPT-4o」ですが、この「o」は「omni」の略です。公式に明言されていませんがおそらく、テキストだけではなく画像や音声もすべてのデータをひとつのモデルで扱えるようにするという意味を込めて「omni」という名前が付けられているものではないかと思います。
GoogleはPaLMやLaMDAといった言語モデルを開発し、BardというAIチャットサービスを提供していましたが、現在は「Gemini」を提供しています。言語モデルもAIチャットサービスも「Gemini」というブランドに統一しています。
AIチャットサービスの「Gemini」は、有料プランは「Gemini Advanced」と呼ばれます。 Gemini for Google Workspaceとして、「Gemini Business」「Gemini Enterprise」というプランも用意されています。
一方で言語モデルのGeminiについては、「1.5 Pro」や「Ultra 1.0」のように、バージョン名を付けて「Gemini」は付けずに記載されることも多いようです。また、ドキュメントによってはバージョン名が先だったり後だったりもします。
言語モデルの大きさは Ultra>Pro>Flash>Nano の順番で、大きいモデルほど性能が高く、一方で最小のモデルであるNanoはスマートフォン上でも動作すると言われています。
Anthropic
Anthropicは言語モデル「Claude」を公開している会社です。Claudeは初期バージョンが公開された当初から、日本語を含めた性能の高さやコンテキストサイズの大きさが高く評価されていた印象です。
AnthropicはAIチャットサービスの名称もClaudeですが、公式ドキュメントや利用規約では「Claude.ai」という表記を使って区別されています。AIチャットサービスの有料プランはClaude Proと呼ばれます。
言語モデルのClaudeは、大きい順で Opus>Sonnet>Haiku の順番です。 「Opus」は「作品」という意味であり、クラシック音楽の作品番号として付与されていることがあります。「Sonnet」は14行詩、「Haiku」は日本ではおなじみ五・七・五の詩なので、曲や詩の作品としての大きさがモデルの大きさに対応していることが分かります。
おわりに
本稿では言語モデルの名称とAIチャットサービスの名称の区別について説明しました。
本稿はこれらを間違えたからといって過度に責めるような意図はありません。(AIを開発・提供している各社としては、正しい名称を使って欲しいかもしれませんが...) 誰にでも間違いはありますし、特に言語モデルとAIチャットサービスの名称は混同しやすいものになっています。実はOpenAI公式にも「ChatGPT 4o mini」という表記が見られることがありますが、これは一部で同社のブランドガイドライン外の表記として指摘されることもありますが、その意図するところは十分に理解できると思います。
また生成AIについては近年発展が激しい分野なので、公式名称が変更されたり、新しいモデルが登場して命名規則が変わったりすることも頻繁にあります。 モデルの名称を覚えることは本質的ではありません。会話や文章の中で自分が指している物が何なのか、言語モデルなのかチャットサービスなのかを正しく区別して、人に伝わりやすい表現を使うよう心がけることが大切だと思います。
なお先に述べた通り、Googleはかつて言語モデルを「Gemini」、AIチャットサービスを「Bard」と呼び分けていましたが、後に「Gemini」へ統一しました。このように言語モデルとAIチャットサービスと区別すること自体の意味が薄れていくかもしれませんね。 さらに、本稿ではあまり区別せず「言語モデル」という呼び方をしましたが、言語だけでなく画像や音声もシームレスに扱えるモデルも次々に登場しています。生成AIというものが今後どう変化していくのかによって、適切な呼び方も変化していくかもしれません。