OpenAI で発表された Responses API と Agents SDK は、Microsoft からも2025年3月11日に 「Azure AI Foundry で数週間程度で利用できるようになる」と発表されたので、その2つの概要をメモしておきます。

OpenAI の Responses API とは
- OpenAI が2025年3月11日に発表した新機能。
- ざっくりいうと Assistants API に置き換わる進化版的な立ち位置。
- ちなみに Assistants API は2026年に提供終了予定。
- Responses API を使用すると、Function Calling や3つのツール (後述します) を使った複数ステップの実行が1回の API 呼び出しで可能になり、実行効率がよい。Assistants API 使ったことがある方なら機能がちょっと増えて深化した API って印象ですかね。
- Chat Completions の API はずっと残ると書かれてたので、シンプルなタスクや完全に制御したいフローのタスクは ChatCompletions、あとは目的に応じて Responses API を使うような感じですね。
前述した3つのツールの概要は以下。
- Web search:
- インターネット上の情報を検索する機能。
- 使い方: Web search - OpenAI API
- 現時点だと料金結構高いのよね。詳細はこちら
- File Search:
- アップロードしたファイルやベクトルストアの検索をしてデータを抽出する機能。
- 使い方: File search - OpenAI API
- 料金はこちら
- Computer Use:
- Operator (ヘッドレスのブラウザ操作や GUI の操作をしてくれるやつ) を API 化した機能。
- 使い方: Computer User - OpenAI API
- サンプル: openai/openai-cua-sample-app
- 料金はこちらの computer-use-preview
Magentic-One がのっかってきた印象すらありですね😊。
OpenAI の Agents SDK とは
- OpenAI が2025年3月11日に発表した新機能。
- 以前から Experimental の機能で存在していた Swam の正式版として Agents SDKになりました。 ようはマルチエージェントのフレームワークのひとつです。
Swarm 改め Agents SDK は、ひとことでまとめると handoff の定義 (どの agent に会話をパスさせれるか) の agent を複数定義して、マルチエージェント構成でタスクを完了させるためのフレームワークって感じです。