
The Informationによると、過去2ヶ月間で、OpenAIは多くの技術グループ、製品、研究を統合して、音声モデルを包括的に再構築し、約1年後に発売される予定の音声コミュニケーションを優先するパーソナルデバイスの準備をしました。
この動きは、音声が徐々に中央インターフェースになりつつあり、画面の支配的な役割に取って代わっているテクノロジー業界の一般的な傾向を反映しています。音声アシスタントは、スマートスピーカーを通じて米国の3分の1以上の家庭に登場しています。多くの大手テクノロジー企業もこの方向に進んでいます。
Metaは最近、スマートグラスRay-Banにオーディオナビゲーション機能を追加し、ユーザーが騒がしい環境でより明確に聞くことができるように、複数のマイクシステムを使用しています。Googleは、検索結果を音声通話形式の要約に変換する機能をテストしています。一方、テスラはxAIのチャットボットGrokを電気自動車に統合し、ユーザーが自然な音声で多くの機能を制御できるようにしています。
テクノロジーの「大手企業」だけでなく、多くのスタートアップ企業も非ディスプレイAIデバイスの構築という野心を追求しています。しかし、この道は決して容易ではありません。Humane AI PinやFriend AIの首輪など、かつて注目を集めた一部の製品は、プライバシーに関連する失敗や論争に直面しており、音響AIを私生活に導入する際の大きなリスクを示しています。
それにもかかわらず、この傾向は引き続き推進されています。サンドバーやエリック・ミギコフスキーが設立した会社を含む一部のスタートアップは、ユーザーがウェアラブルデバイスを介して直接チャットできるAIリングを開発しており、2026年に発売される予定です。
The Informationによると、OpenAIの新しいオーディオモデルは、2026年初頭に発表される予定で、より自然な声を持ち、スピーチを柔軟に処理し、ユーザーと「並行して」話すことさえでき、実際の会話のような感覚を生み出します。OpenAIはまた、ガラスまたはスクリーンレススピーカーを含む可能性のある新しいデバイスエコシステムを視覚化しており、ツールではなく、パートナーとして機能すると言われています。
この戦略は、Appleの元デザインディレクターであるジョニー・アイブ氏のオーディオを優先するデザインの方向性と密接に関連しており、彼は65億米ドルのIO社買収後、OpenAIのハードウェア部門に入社しました。彼は画面への依存を減らし、オーディオインターフェースを将来の消費者のテクノロジーとの相互作用を再構築する機会と見なしたいと考えられています。
そのような状況下で、音声AIはもはや補助機能ではなく、音声が人間の新しい「制御面」になる次世代のパーソナルデバイスの基盤と見なされています。