2023年11月の OpenAI 側のアップデートによって Azure OpenAI のモデルのバージョンと最大トークン数、そして価格が更新され、そのモデルが Azure OpenAI では2023年12月に順次ロールアウトされて利用できるようになりました。
こらから新たに Azure OpenAI Service を試そうとしている方にとって、その更新を把握していないとたくさんのバージョンがあるけどどれを使えばいいのかわからんとなりそうです。
ということで Azure OpenAI 入門としてモデルのバージョンを軽く整理しておきます。
バージョンに関する基礎知識
2023年11月以前は、Azure OpenAI で利用されているモデルのバージョンは 0314
と 0613
でした。
2023年11月の OpenAI Dev Day でのアップデートによって、Azure OpenAI では 1106
(または 1106-preview
) というバージョンが利用できるようになりました。そこでトークン数の上限も大きく変りました。
ということで、最初に覚えておきたいのは、GPT-4/GPT3.5 のモデルでは以下のことをおさえておくとよいです。
- 基本的には新しいバージョンが性能良くて単価も安いと考えてよい。ただし、価格を正確に把握したい場合はドキュメント確認しよう。
- 2023年12月時点では
1106
(または1106-preview
) のバージョンが単価が安く性能もいいので、このバージョンを使いましょう。 - ただし、リージョンによっては
1106
(または1106-preview
) がまだ使えないので、その時は古いバージョンを選ぶようになります。 - 価格は基本的に OpenAI に合わせてリリースされるとアナウンスされている。
GPT-4 シリーズ
0613
以前のバージョンではモデル ID で最大トークン数がわかれていました。とりあえず 0613
の GPT-4だと以下。
モデル ID | バージョン | 概要 |
---|---|---|
gpt-4 | 0613 | 最大トークン数 8K |
gpt-4-32k | 0613 | 最大トークン数は 32K。価格は 8k のやつの2倍 |
↑これが古いモデルになります。
そこから2023年11月に 1106
が公開され、入力のトークン数が大きくなりました。
トークン数は大幅に増えたのに、価格はgpt-4 (0613):8Kよりも入力が1/3、出力は1/2になってお安くなりました。16kの価格と比べるとさらに安いということです。
※ API の価格は、OpenAI のと同等になるとアナウンスがあったためその情報に基づいて記載しています。確実な情報は公式ドキュメントを確認しましょう。
ということで以下テーブルが GPT-4シリーズの最新のバージョンのモデルで、性能的にもコスパ的にもおすすめになります。
モデル ID | バージョン | 概要 |
---|---|---|
gpt-4 | 1106-preview | OpenAI の GPT-4 Tourbo 。最大トークン数は入力が128K、出力は4K。 |
gpt-4 | vision-preview | OpenAI の GPT-4 Turbo with Vision Preview 。最大トークン数は入力が128K、出力は4K。 |
利用できるバージョンが限られているので、以下の公式ドキュメントを参考にリージョンを選びましょう。
また、価格は以下のドキュメントになります。
GPT-3.5 シリーズ
こちらも0613
以前の古いバージョンは、最大トークン数で モデル ID がわかれていました。
モデル ID | バージョン | 概要 |
---|---|---|
gpt-35-turbo | 0613 | 最大トークン数4K。 |
gpt-35-turbo-16k | 0613 | 最大トークン数16K。API の価格は↑ 4k のやつの2倍。 |
<br<
ここから2023年11月の更新により新しい 1106
では、最大トークン数16kのみになり、価格もgpt-35-turbo (0613) の最大トークン数4k のやつよりちょっと安くなって提供されました。新しい 1106
のバージョンのモデルが使える場合はこれを使うのが性能的にもコスパ的にもおすすめになります。
モデル ID | バージョン | 概要 |
---|---|---|
gpt-35-turbo | 1106 | 最大トークン数は入力が16K、出力は4K。 |
その他 (DALL-E, Wisper, Embeddings)
最近更新が静かな Embeddings や、DALL-E や Wisper といったプレビューのモデルも先ほど紹介した通り、公式ドキュメントで状況を確認しながら利用しましょう。
まとめ
- 基本的に新しいバージョンの方が性能もコスパもよくなる傾向はある。
- 新しいモデルは利用できるリージョンに制限がある可能性がある。
- 以下2つのドキュメントでモデルのバージョンとその性能 (トークン数とか) の一覧、利用できるリージョン、コストを確認して計画的に利用しましょう。