マイクロソフトは、MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2の3つの新しいプラットフォーム人工知能モデルを発表しました。これは、独自のマルチメソッドAIエコシステムを構築するという野心において重要な進歩を示しています。
これは、2025年末に設立された、CEOのムスタファ・スレイマンが率いる人工知能研究部門であるマイクロソフトAIの製品です。
これらのモデルの発売は、マイクロソフトがパートナーへの依存を徐々に減らし、OpenAIやGoogleなどの大手企業と直接競争していることを示しています。
その中で、MAI-Transcribe-1は音声をテキストに変換するモデルであり、最大25言語をサポートし、現在のAzure Fastサービスよりも2.5倍高速であると言われています。
MAI-Voice-1は音声生成に焦点を当てており、1秒間に60秒の音声を作成でき、ユーザーのニーズに応じて音声をカスタマイズできます。
特筆すべきは、MAI-Image-2は画像にとどまらず、ビデオ作成をサポートし、コンテンツ作成におけるAIの応用可能性を拡大していることです。
このモデルは、マイクロソフトの新しいモデルテストプラットフォームであるMAI Playgroundで3月19日からテストされており、その後Microsoft Foundryエコシステムに導入されました。
現在、3つのモデルすべてがMicrosoft Foundryに搭載されており、音声関連のモデルもテストと開発のためにMAI Playgroundに統合されています。
マイクロソフトAIのCEOであるムスタファ・スレイマン氏によると、マイクロソフトAIの開発哲学は、人間を中心に据えることです。
モデルは、技術的なパフォーマンスにのみ焦点を当てるのではなく、人間の実際のコミュニケーション方法に合わせて最適化するように設計されています。彼はまた、多くの新しいモデルが間もなく発表され、マイクロソフトの製品に直接統合されると付け加えました。
もう1つの注目すべき点は価格戦略です。マイクロソフトは、MAIモデルは多くの競合他社よりも低価格であると述べています。具体的には、MAI-Transcribe-1は1時間あたり0.36米ドル、MAI-Voice-1は100万文字あたり22米ドル、MAI-Image-2は100万文字のテキスト入力トークンあたり5米ドル、画像出力あたり33米ドルです。
大規模な言語モデル市場がますます競争的になる状況において、コスト要素は企業や開発者を引き付けるための重要な利点と見なされています。
独自のモデルの開発を推進しているにもかかわらず、マイクロソフトはOpenAIとの緊密な協力を継続することを改めて表明しました。同社は、このパートナーに130億米ドル以上を投資し、多くのAIテクノロジーを製品エコシステムに統合しました。
しかし、最近の協力協定の調整により、マイクロソフトが「スーパーインテリジェンス」に関する研究を追求するためのより大きなスペースが開かれました。これは、同社が協力と技術の自主性を両立させる並行戦略を追求していることを示しています。