新着Gemmaでオフライン音声入力が実現新着GeminiにNotebooks機能が追加新着ChatGPT内に動画アプリが初登場速報ChatGPT企業導入が新フェーズへ新着Figmaキャンバスで動画再生が可能に速報Claude最強モデルがサイバー防衛に限定投入新着GeminiがGoogleマップで日程計画を支援新着Claude系AIエージェントの現状と混乱新着GemmaでオフラインAI音声入力アプリ登場速報ChatGPTにFigma・Canva連携が追加新着Gemmaでオフライン音声入力が実現新着GeminiにNotebooks機能が追加新着ChatGPT内に動画アプリが初登場速報ChatGPT企業導入が新フェーズへ新着Figmaキャンバスで動画再生が可能に速報Claude最強モデルがサイバー防衛に限定投入新着GeminiがGoogleマップで日程計画を支援新着Claude系AIエージェントの現状と混乱新着GemmaでオフラインAI音声入力アプリ登場速報ChatGPTにFigma・Canva連携が追加
ホーム/アップデート一覧/MicrosoftがAI基盤モデルを3種同時発表
MAJOR新モデル画像生成API

MicrosoftがAI基盤モデルを3種同時発表

|2026年4月4日

SUMMARY

MicrosoftのMAIグループが音声認識・音声生成・画像生成の基盤モデルを発表。Webプロジェクトへの組み込みが期待される。

背景

OpenAI・Google・Anthropicが次々とモデルを投入する中、MicrosoftのMAIグループが自社開発の基盤モデル群を同時発表した。Azure経由での提供が前提で、Microsoftサービスとの連携が強みになる。

変更点

発表されたのは音声認識・音声生成・画像生成の3モデル。音声認識はWhisper、画像生成はDALL-Eの代替候補として開発されたとみられ、いずれもAzure AIプラットフォームからAPI経由で利用できるようになる予定だ。

Web制作への影響

Webサイトへの音声インターフェース組み込みや、バナー・OGP画像の自動生成ワークフローに応用できる可能性がある。Microsoft 365との統合が進めば、クライアントのワークフロー提案の幅が広がる局面が来るかもしれない。

注意点

現時点では日本語の音声認識・生成の品質が英語と同水準かは不明。Azure利用が前提のため、既存インフラがAWSやGCPのプロジェクトでは移行コストも含めた判断が必要になる。

2026年4月4日
元記事を読む →