BEACHSIDE BLOG

Azure と GitHub と C# が好きなエンジニアの個人メモ ( ・ㅂ・)و ̑̑

Azure OpenAI のモデルのバージョンの選び方 (2023年12月版)

2023年11月の OpenAI 側のアップデートによって Azure OpenAI のモデルのバージョンと最大トークン数、そして価格が更新され、そのモデルが Azure OpenAI では2023年12月に順次ロールアウトされて利用できるようになりました。

こらから新たに Azure OpenAI Service を試そうとしている方にとって、その更新を把握していないとたくさんのバージョンがあるけどどれを使えばいいのかわからんとなりそうです。

ということで Azure OpenAI 入門としてモデルのバージョンを軽く整理しておきます。

バージョンに関する基礎知識

2023年11月以前は、Azure OpenAI で利用されているモデルのバージョンは 03140613 でした。

2023年11月の OpenAI Dev Day でのアップデートによって、Azure OpenAI では 1106 (または 1106-preview) というバージョンが利用できるようになりました。そこでトークン数の上限も大きく変りました。

ということで、最初に覚えておきたいのは、GPT-4/GPT3.5 のモデルでは以下のことをおさえておくとよいです。

  • 基本的には新しいバージョンが性能良くて単価も安いと考えてよい。ただし、価格を正確に把握したい場合はドキュメント確認しよう。
  • 2023年12月時点では 1106 (または 1106-preview) のバージョンが単価が安く性能もいいので、このバージョンを使いましょう。
  • ただし、リージョンによっては 1106 (または 1106-preview) がまだ使えないので、その時は古いバージョンを選ぶようになります。
  • 価格は基本的に OpenAI に合わせてリリースされるとアナウンスされている。

GPT-4 シリーズ

0613 以前のバージョンではモデル ID で最大トークン数がわかれていました。とりあえず 0613 の GPT-4だと以下。

モデル ID バージョン 概要
gpt-4 0613 最大トークン数 8K
gpt-4-32k 0613 最大トークン数は 32K。価格は 8k のやつの2倍

↑これが古いモデルになります。

そこから2023年11月に 1106 が公開され、入力のトークン数が大きくなりました。
トークン数は大幅に増えたのに、価格はgpt-4 (0613):8Kよりも入力が1/3、出力は1/2になってお安くなりました。16kの価格と比べるとさらに安いということです。

※ API の価格は、OpenAI のと同等になるとアナウンスがあったためその情報に基づいて記載しています。確実な情報は公式ドキュメントを確認しましょう。

ということで以下テーブルが GPT-4シリーズの最新のバージョンのモデルで、性能的にもコスパ的にもおすすめになります。

モデル ID バージョン 概要
gpt-4 1106-preview OpenAI の GPT-4 Tourbo 。最大トークン数は入力が128K、出力は4K。
gpt-4 vision-preview OpenAI の GPT-4 Turbo with Vision Preview 。最大トークン数は入力が128K、出力は4K。

利用できるバージョンが限られているので、以下の公式ドキュメントを参考にリージョンを選びましょう。

また、価格は以下のドキュメントになります。

GPT-3.5 シリーズ

こちらも0613 以前の古いバージョンは、最大トークン数で モデル ID がわかれていました。

モデル ID バージョン 概要
gpt-35-turbo 0613 最大トークン数4K。
gpt-35-turbo-16k 0613 最大トークン数16K。API の価格は↑ 4k のやつの2倍。

<br<

ここから2023年11月の更新により新しい 1106 では、最大トークン数16kのみになり、価格もgpt-35-turbo (0613) の最大トークン数4k のやつよりちょっと安くなって提供されました。新しい 1106 のバージョンのモデルが使える場合はこれを使うのが性能的にもコスパ的にもおすすめになります。

モデル ID バージョン 概要
gpt-35-turbo 1106 最大トークン数は入力が16K、出力は4K。

その他 (DALL-E, Wisper, Embeddings)

最近更新が静かな Embeddings や、DALL-E や Wisper といったプレビューのモデルも先ほど紹介した通り、公式ドキュメントで状況を確認しながら利用しましょう。

まとめ