BEACHSIDE BLOG

Azure と GitHub と C# が好きなエンジニアの個人メモ ( ・ㅂ・)و ̑̑

Microsoft Build 2025 - Azure AI Foundry 関連まとめ

Microsoft Build 2025 が始まり新しい情報がでてきましたので自分用にざっくりまとめていきます。

このブログでは、AI Foundry blogs で公開された8つの記事と、AI Platform Blog から2つ、Azure AI services Blog から1つの記事を内容をざっくりまとめてます。

Microsoft Build 2025 で発表された内容は、新規に出た内容もあればここ数か月であった内容も含めおさらいって感じのものも多く混在していますが、マー気にせずみていきますかね。

Announcing Developer Essentials for Agents and Apps in Azure AI Foundry

新機能のまとめって感じの内容。

Foundry Models

  • 今回のアップデートにより、Foundry モデルに Azure Llama、Azure Grok、Azure Mistral、Azure DeepSeek、Azure Black Forest Labs など、Microsoft が直接ホストおよび販売する新しいモデルファミリーが、Azure OpenAI と並んで追加に。
  • 6月よりこれらのモデルすべてで Foundry Provisioned Throughput (PTU) による予約済み容量の利用の可能に。
  • Foundry Local は、Windows または macOS で直接モデルを実行できるため、オフラインまたはプライバシーに配慮したワークロードに最適。

Fine-tuning and distillation

  • Foundry Models で GPT-4.1-nano、o4-mini、Llama 4 のファインチューニングが可能に。
  • 新しい低コストの Developer Tier も追加。

Foundry Agent Service が GA。

Foundry Agent Service の一般提供 (GA) 開始に伴い、以下の機能が提供されます。

  • 単一エージェントのホスト、エージェントグループのオーケストレーション、および Agent-to-Agent (A2A) プロトコルによる公開が可能。
  • Microsoft Bing、Microsoft SharePoint、Azure AI Search、Microsoft Fabric などのデータソースとナレッジツールとのシームレスな統合により、エージェント開発が簡素化。
  • Azure Logic Apps、Azure Functions、OpenAPI、Model Context Protocol (MCP) を使用するカスタムツールなどのアクションツールを介したタスク自動化をサポート。
  • Semantic Kernel と AutoGen が 1 つの統合 SDK にマージされ、エージェントの定義、連結、デプロイ(ローカルまたはクラウド)を同じ動作で実行するための単一の構成可能な API が提供。
  • 開発者が簡単にカスタマイズできるエージェントコードサンプルの centralized catalog **があり、事前定義された指示、アクション、API、知識、ツールが含まれています。これにより、Azure AI Foundry を使用してエージェントを迅速に作成およびデプロイできます。

また、関連する進展として以下も発表。

  • Azure AI Search では、自動化されたマルチターン計画、取得、合成を処理するためのエージェントによる取得 (agentic retrieval) がパブリックプレビューで導入。
  • 新しい Voice Live API により、150 以上のロケールでリアルタイムの音声入力と出力が同じエンドポイントを通じて利用可能に。

Content & media

  • 近日公開予定の新しいビデオプレイグラウンドでは、リソースをプロビジョニングすることなく、Foundry Models で Sora(近日公開予定)やその他の最先端のモデルを試すことが可能に。
  • ドキュメントを多用するワークフローの場合、Azure AI Content UnderstandingのProモードでは、かつては複数の抽出呼び出しと人間による検証が必要だった作業が、1つの効率化された操作に集約。例えば、保険金請求と契約条件の比較を1ステップで実行できるように。

Developer productivity

  • Foundry REST APIの GA版により、モデル推論、エージェント操作、評価を1つのエンドポイントに統合し、Python、C#、JavaScript、Java用のSDKを提供
  • 更新されたVS Code拡張機能は、YAML IntelliSense、完全なエージェントCRUD、およびポータル内の新しい「VS Codeで開く」ボタンを提供し、キーとサンプルコードを事前にロードできるように。
  • 一般的なシナリオ向けにAI templates を公開
  • 新しい Microsoft 365 Agents Toolkitのリリースにより、AI Foundryで作成したエージェントをMicrosoft Copilot、Teamsなどに公開可能に。

Deployment & observability

  • 動的なキャパシティ割り当ての機能によりオンデマンドでスケーリングし、Batch Globalおよび DataZone デプロイメントによる動的なトークンクォータにより、最大1兆トークンをキューに入れる新しい機能強化によって、大規模なAIワークロードを強化可能に。
  • Foundry Observabilityの組み込みダッシュボードは、最初のプレイグラウンドテストから本番環境までの品質、コスト、安全性、ROIをカバーし、GitHub ActionsおよびAzure DevOpsに接続されているため、コミットごとに評価が自動的に実行可能に。
  • Foundry Agent Serviceには、トレーシング、評価、モニタリングなどの堅牢なAgentOps機能が含まれており、開発者がエージェントの動作を自信を持って検証、監視、最適化。

Coding the Future of AI with Azure AI Foundry API and SDK

Azure AI Foundry SDK

Azure AI Foundry が統一された Azure のリソースと REST API を提供開始し、リソースのプロビジョニングと管理が簡素化。

  • Azure AI Foundry の playground で実行したコードサンプルをすぐに確認
  • AI Templates の登場 (AIアプリのサンプルコード集) と Azure Developer CLI との統合でアプリケーションのサンプルのプロビジョニングも容易に。
  • OpenAI の モデルだけでなく、Microsoft、Meta、Mistral AI、Cohere、AI21 labs、DeepSeek などのモデルを含む、さまざまなFoundryモデルを組み合わせて実験し、アプリを最適化可能。

Azure AI Foundry Agent Service

  • Agent Service 関連は別のブログで記載します。

Azure AI Foundry Observability

ローカル開発環境で評価を直接実行し、組み込みの安全性および品質評価ツールを使用して、ワークフローが必要な基準を満たしていることを確認できるようになりました。

  • アプリケーションのニーズに合わせて調整されたバッチデータセットを生成・実行することで、テストを効率化します。
  • GitHub Actions などの CI/CDパイプラインのために、評価をシームレスに統合し、開発サイクル全体のアセスメントプロセスを自動化可能に。
  • 評価結果は Foundry Observability ダッシュボードに表示される。

Accelerate App Development with AI Templates in Azure AI Foundry

Azure AI Foundry の Templates で10個の クイックスタート AI テンプレートのセットが用意された。これらのテンプレートは、一般的なAIユースケースをサポートし、開発者がAIソリューションを容易に設計・展開できるようにすることで、プロジェクトをゼロから開始して本番環境にスケールする場合と比較して開発時間を短縮することを目的に作らている。

現時点で用意されているのは以下10 repo。

※ 各 GitHub の repo の README の冒頭や "Business scenario" を読むとより具体定期に何ができるかわかります。

以下の観点で AI Template は作られている。

  • 参照アーキテクチャ
  • デプロイメントガイドと迅速なデプロイメントオプション
  • 主要な技術的特徴
  • 関連するユースケース
  • 料金計算ツール
  • セキュリティガイドライン
  • 特定のニーズに合わせてカスタマイズするためのヒント

Achieve End-to-End Observability in Azure AI Foundry

Leaderboards と Agents Playground

  • 新しくできた Leaderboarsでは、モデルのベンチマークのランキングが可視化可能に。
  • Agents Playground には評価とトレース機能が組み込まれており、エージェントのテスト、デバッグ、改善を1か所で行うこと可能に。
    • 品質チェックはデフォルトで実行され、安全性チェックはトグルを切り替えるだけで有効になり、すべての結果はツール呼び出し、入力、出力、メトリックを完全に可視化するためにトレースにリンクされている。

詳細は Benchmark models in the model leaderboard of Azure AI Foundry portal - Azure AI Foundry | Microsoft Learn

評価の強化

以下の組み込みメトリックを使用して、エージェントスレッドメッセージを直接評価できるようになった。

メトリック 概要
Intent Resolution
(インテント解決度)
エージェントがユーザーの意図をどれだけ正確に識別し、対処しているかを測定。
Task Adherence
(タスク遵守度)
エージェントが識別されたタスクをどれだけうまく実行しているかを測定。
Tool Call Accuracy
(Tool call 精度)
エージェントが正しいツールをどれだけうまく選択し、呼び出しているかを測定。
Response Completeness
(応答の完全性)
応答が真実と比較してどの程度完全であるか(重要な情報が欠落していないか)を測定。

さらに、Azure OpenAI Gradersとの新しい統合によって、より高い精度を得ることも可能に。

  • Label Grader (ラベル評価)
  • String Checker (文字列チェッカー)
  • Text Similarity (テキスト類似度)
  • Custom General Grader (カスタム汎用評価)

詳細は Azure OpenAI Graders for generative AI - Azure AI Foundry | Microsoft Learn

モデルの脆弱性をスキャン

Azure AI Foundry AI Red Teaming Agent により、AIモデルがどのように機能するかを体系的に評価可能に。

Azure AI Foundry AI Red Teaming Agentは、安全でないAIに対する組み込みの防御機能で、MicrosoftのOSS: PyRITを搭載し、敵対的攻撃をシミュレートして、リリース前に脆弱性を発見するための機能。ワークフローに接続するだけですぐに利用可能。

  • コンテンツの安全性のリスクを自動的にスキャン。
  • 攻撃成功率(ASR)などの指標で露出度を測定。
  • 詳細な準備レポートを生成。

評価の自動化

  • GitHub Actions や Azure DevOps Extension で組み込みの評価を使って自動評価が可能に。

継続的なモニタリング、トレース

  • Azure Monitor の Application Insights と Azure Workbooks で実現されたダッシュボードにより、継続的なモニタリングが可能。
    • そのため AI Foundry からも見えるし、Azure ポータルからも見える。
  • トレースを有効にすると、モデルの推論から Tool Call などエージェントの実行が完全に可視化可能に。

コスト

公式ブログからだといまいちスコープがわからんので要調査だが、とりあえず以下がかかれていた...

  • $20/1M input tokens
  • $60/1M output tokens

Unlock Instant On-Device AI with Foundry Local

Foundry Local は、Windowsおよび macOS のローカル上で、モデル、ツール、エージェントを直接実行するクロスプラットフォームAIアプリを構築可能なツール。

  • ONNX Runtime 上で実行される。
    • Windwos だと Windows ML を基盤として AMD, Intel, NVIDIA, Qualcomm などと統合および最適化されている。
    • Mac だと Apple シリコン上で GPUアクセラレーションが含まれる。実行する CPU/GPU/NPU 指定のオプションもあり。
  • コマンドラインで実行可能なほかに、Azure Inference SDK を使ってプログラムからの実行も可能 (ドキュメント見たら foundry local SDK ってのがあったが...)。
  • MCP を使用してローカルツールを呼び出すこともかのうだが、Private preview への参加が必要。

Microsoft and Hugging Face expand collaboration to accelerate Open-Source AI Innovation on Azure AI Foundry

  • Hugging Face との提携の拡張によって、今まで以上に多くのモデルが AI Foundry で利用可能に。
  • Azure AI FoundryカタログのHugging Faceコレクションで利用可能なすべてのモデルは、Hugging Faceによって脆弱性がないかスキャンされています。この提携拡大の一環として、Microsoft は Hugging Face と協力し、特定のモデルをAzureでホストすることも検討しており、これによりユーザーは Hugging Face への外部ネットワークエグレスなしに、これらのモデルをセキュアなエンドポイントとして展開できるようになる予定。

Announcing Grok 3 on Azure AI Foundry

  • イーロンマスク率いる xAI の Grok 3 のモデルが今後2週間程度 (6月上旬~中旬ごろかな) に登場予定.。GitHub Models でも同様。
  • AI Foundry にて Standard または PTUs で利用可能に。料金は Global で 1M Token あたり Input: 3$, Output 15$ のようで GPT-4.1より結構割高。

How Azure AI Foundry and Partners Simplify Governance Without Slowing Developers Down

AIガバナンスに関する内容だが、開発とはちょっとそれるので興味があればブログを直接ご確認ください♪

Azure OpenAI Fine Tuning is Everywhere

Azure OpenAIモデルのファインチューニングで、 Tier として Global と Developer Tier ができたって話。

Global Training とは

  • ほかの Global のオファリングと同様の価格で Azure OpenAI のモデルをファインチューニングが可能
  • Standard training より低コストでトレーニング可能。
  • リージョンは制限あり随時更新される予定なので、利用時にドキュメントを要確認 (Japan East はあるけど Vision がサポート外)
    • データレジデンシーのリージョンや制約もちょっと書かれているので、気になる方はドキュメントを要確認。

Developer Tier とは

  • 任意のトレーニングリージョンまたはGlobal Trainingからファインチューニングされたモデルを24時間無料のファインチューニングモデルホスティングでデプロイできる。
    • デプロイ後、24時間で自動削除される。再デプロイは可能。
  • 現時点で Developer tier 対象のモデルは GPT-4.1 および GPT-4.1-mini のみ。ほかのモデルは coming soon。
  • Developer Tier はデータレジデンシーは非対応。
  • Global Standard のデプロイメントと同様のトークン単位の利用金でテストや評価に利用可能。

What's New in Azure AI Foundry Fine-Tuning | Build 2025

こちらも Fine Tuning の話。前述でかぶってなさそうな話をざっくりまとめ。

o4-mini での強化学習ファインチューニングが Public preview

  • つい先週(5/12)発表があった o4-mini での Reinforcement Fine-Tuning (RFT, 強化学習ファインチューニング) が public preview で登場。
  • 現時点で利用な能なリージョンは East US 2 と Sweden Central。

ファインチューニング済みの GPT-4o and GPT-4o-mini の延長サポート

  • AI Foundry でファインチューニングされた GPT-4o and GPT-4o-mini のモデルの提供終了後、12か月はデプロイおよび推論が可能。

Azure AI Foundry Models: Futureproof Your GenAI Applications | Microsoft Community Hub

今回のアップデート総括的なブログなので特記なメモなし。