AI
Remote MCP server を Azure Functions でホストできますが、Streamble HTTP のサポートが始まりましたのでその実装方法を共有です。 ローカル環境のセットアップ Function App で MCP の Streamable HTTP の利用 Function App のプロジェクト作成 Streamabl…
Responses API 推奨になって結構経ちますが、使う理由のおさらいとして OpenAI Cookbook の以下記事をざっくり要約しました (+ Overview は私の気分で箇条書きにがっつりまとめちゃいましたが)。 Better performance from reasoning models using the Respon…
GPT-5 も、日本語の利用だと (?) 色々と癖 (というか解釈しきれてない感じ?) があるようで、以前よりプロンプトによる指示が大事と感じる今日この頃ということで、OpenAI から出てる以下のドキュメントを自分用にまとめてみました (単なる翻訳・要約です)。 …
OpenAI の GPT-5 の機能やベストプラクティスがまとまった以下のドキュメントのまとめです。 Using GPT-5 - OpenAI API サンプルコードは、公式ドキュメントは OpenAI でやってるのでこちらは AzureOpenAI でやっています。 (Azure でも OpenAI を使って接続…
2025年8月7日に GPT-5 が公開されたので、その system card をざっくりまとめてみました。 この system card は、GPT-5 に関する公式文書の要約で、主にgpt-5-thinkingとgpt-5-mainに焦点を当て、GPT-5の全体像、その能力、安全性、そして将来のリスクへの備…
ここでは、2025年5月に開催の Microsoft Build 2025 で発表された Cosmos DB 関連の情報のうち、NoSQL で AI に関連する情報のまとめです。 Mongo DB (vCore) 関連や、サブスクリプションを跨いで複数の Cosmos DB を管理・分析が可能な Fleets、DB で RU を…
Microsoft Build 2025 で"Azure AI Agent Service" から Azure AI Foundry Agent Service へ微妙に名前が変わって GA したこのサービスについての自分用メモです。 ここでは Azure AI services Blog から4記事、AI Platform Blog から1記事から、個人的にメ…
Microsoft Build 2025 が始まり新しい情報がでてきましたので自分用にざっくりまとめていきます。 このブログでは、AI Foundry blogs で公開された8つの記事と、AI Platform Blog から2つ、Azure AI services Blog から1つの記事を内容をざっくりまとめてま…
結構古い記事ですが、以下のサイトで語られている "Contextual Retrieval" の考え方が好きなのでさっとまとめます。 Introducing Contextual Retrieval 最近で仕事でのワークショップの裏側で使ってる自作の RAG も(?)、 地味のこのアプローチの一部を簡易に…
2025年4月は OpenAI のモデルリリースラッシュがきましたが、すでに Azure 側でも利用可能な GPT-4.1 ファミリーと o3, o4-mini について自分用ざっくりなメモです。 先週発表されて、GPT-4.1 family と o4-mini は自分の Azure の環境で即日利用可能になっ…
OpenAI で発表された Responses API と Agents SDK は、Microsoft からも2025年3月11日に 「Azure AI Foundry で数週間程度で利用できるようになる」と発表されたので、その2つの概要をメモしておきます。 OpenAI の Responses API とは OpenAI の Agents SD…
昨年ドタバタ劇にあった AutoGen の v0.4.0devXX 系がようやく stable version の v0.4.1 になり、Microsoft Research Blog の以下の記事が出てました。 www.microsoft.com AgentChat の API を一通り試したのですが旧バージョンより感触がよかったので、ま…
Anthropic Research team のブログで "Building effective agents" という素敵なブログがあったので翻訳 (意訳) したメモです。 Building Effective AI Agents \ Anthropic 我々が2024年に取り組んでいた方向性・考え方がほぼ一緒で共感する部分が多かったの…
幅広いデータソースを Markdown に変換してくれる Microsoft の OSS: MarkItDown を試してみます。 github.com 使った感想 MarkItDown の概要 Python で試す準備 PDF を試す 2段組の PDF 図多めの PDF pptx を試す Excel を試す 画像の解析 画像の解析: とり…
今週 (2024-11-18週) に開催中の Microsoft Ignite 2024 で、Cosmos DB for NoSQL の Vector search に関わる機能について以下の発表がありました。 Cosmos DB for NoSQL の Vector Search 機能と DiskANN Vector Index 機能が GA Full Text Search (BM25) …
前回は Prompty から LLM を呼び出す基本的な話をしましたので、今回はもう少し実践的に Python のコードから Prompty を活用する方法を書いていきます。 通常のアプリや FastAPI や Azure Functions などから Prompty を活用する際に、前回書いてないことで…
2024年7月に開催された AOAI DevDay で以外にも注目度が高かった、かつあまり認知されていないように見えた Prompty の入門編をブログにしてみました。 OpenAI のエンドポイントにも対応していますが、ここでは Azure OpenAI の利用を想定して書いています。…
Microsoft Build 2024 の自分用のメモです。 Azure OpenAI 関連の更新情報で気になった内容の一部をさっとまとめました。 ブログに公開するつもりがなかったので雑なメモ程度に書いてたやつです。 まだドキュメントをさらっとみた段階で実際さわってはないの…
Azure OpenAI でストリーミングのレスポンスを使うと、遅すぎて思ってたのと違うんだが...と思うことありませんか? それを解消する手段の一つが Asynchronous Modified Filter (非同期変更フィルター) です。 Asynchronous Modified Filter (非同期変更フィ…
今回は、Azure workbooks を使って Azure OpenAI の Insights を監視する第一歩の踏み出し方って感じの話です。 監視をするには Azure OpenAI Insights の workbook をセットアップ Azure OpenAI Insights を確認する Overview タブ Momitor タブ Insights …
Code Interpreter とは Azure OpenAI での利用 Azure OpenAI Studio でのはじめ方 Code Interpreter を使うための準備 Code Interpreter を試す 数学の問題を試す 他の活用例 余談: Code Interpreter の実行環境はどうなってるのか 参考 Code Interpreter と…
Microsoft Build 2022 に合わせて Form Recognizer にいくつかのアップデートがありました。 この時期のあるあるとして、公式ドキュメント の日本語は翻訳されておらず古い状態になってるので、英語のドキュメントを見る必要がある時期ですね。 ということで…
Microsoft Ignite November 2021 で発表された Azure Cognitive Service for Language について全体像をまとめてみました。 Azure Cognitive Service for Language 誕生までの歴史 機能一覧 Extract information key phrase extraction - キーフレーズ抽出 E…
Form Recognizer は、v2.1 preview 3 のアップデートで実用的に使えるじゃないかってくらいに感じたので、改めて機能や更新内容をメモしてみます。 Form Recognizer とは ざっくり機能を説明すると、請求書やレシートといったドキュメントからデータを読み取…
Azure の Cognitive Services の中のひとつ、Form Recognizer をサクッと試せるツール Form OCR Testing Tool のセットアップ方法のメモです。 実際に使ってどれくらいの精度でるんやろってのがみたいところですが、それは分析した請求書といったフォームへ…
2020 年は1月から9月の間で Cognitive Services の Vision カテゴリーの中の OCR の機能がちょろちょろとアップデートしてました。 OCR の今までのアップデートを振り返りつつ、最新の Read API v3.1 Preview2 を試してみます。 Cogbot #29でもお話しした内…
Cognitive Services のブログはしばらく書いてなかったし仕事でも使ってなかったので、そろそろ一通りのおさらいしようと思っています。 ということでまずは Azure の Cognitive Services の中で Vision 系のサービスのひとつ、Computer Vision API から始め…
前回は ヨガのポーズとその説明のデータを準備しました。 blog.beachside.dev 続編の今回は、QnA Maker を使ってヨガのポーズを質問したらポーズの特性を答えてくれる Knowledge Base (KB、質問投げたら回答してくれるFAQチャットみたいなもの) をノーコーデ…
もし、ヨガのレクチャーを受けたとき、そのポーズがなんの効果があるか知りたいと思うだろうと妄想したので QnA Maker などを使って解決しようと思いました。 (ヨガのレクチャー受けてるときはポーズになんの効果あるかとか説明ありそうですけどね、まだ受…
Microsoft Inspire で HoloLends 使った翻訳デモがあったりして盛り上がりを感じたので久々に触ってみようと思いました。 今回は、話した音声を Speech to Text でテキスト化して表示するコンソールアプリを作ります。 プロジェクト作成と Nuget のインスト…