OpenAIは音響AIに賭け、非画面のパーソナルデバイスに備える

HẠO THIÊN (THEO techcrunch) |

OpenAIは、ChatGPTの会話能力の向上にとどまらず、音響人工知能の開発戦略を推進しています。

OpenAI dat cuoc lon vao AI am thanh va chuan bi cho thiet bi ca nhan khong man hinh. Do hoa: AI
OpenAIは音響AIに大きな賭けをし、非画面のパーソナルデバイスの準備をしています。グラフィック:AI

The Informationによると、過去2ヶ月間で、OpenAIは多くの技術グループ、製品、研究を統合して、音声モデルを包括的に再構築し、約1年後に発売される予定の音声コミュニケーションを優先するパーソナルデバイスの準備をしました。

この動きは、音声が徐々に中央インターフェースになりつつあり、画面の支配的な役割に取って代わっているテクノロジー業界の一般的な傾向を反映しています。音声アシスタントは、スマートスピーカーを通じて米国の3分の1以上の家庭に登場しています。多くの大手テクノロジー企業もこの方向に進んでいます。

Metaは最近、スマートグラスRay-Banにオーディオナビゲーション機能を追加し、ユーザーが騒がしい環境でより明確に聞くことができるように、複数のマイクシステムを使用しています。Googleは、検索結果を音声通話形式の要約に変換する機能をテストしています。一方、テスラはxAIのチャットボットGrokを電気自動車に統合し、ユーザーが自然な音声で多くの機能を制御できるようにしています。

テクノロジーの「大手企業」だけでなく、多くのスタートアップ企業も非ディスプレイAIデバイスの構築という野心を追求しています。しかし、この道は決して容易ではありません。Humane AI PinやFriend AIの首輪など、かつて注目を集めた一部の製品は、プライバシーに関連する失敗や論争に直面しており、音響AIを私生活に導入する際の大きなリスクを示しています。

それにもかかわらず、この傾向は引き続き推進されています。サンドバーやエリック・ミギコフスキーが設立した会社を含む一部のスタートアップは、ユーザーがウェアラブルデバイスを介して直接チャットできるAIリングを開発しており、2026年に発売される予定です。

The Informationによると、OpenAIの新しいオーディオモデルは、2026年初頭に発表される予定で、より自然な声を持ち、スピーチを柔軟に処理し、ユーザーと「並行して」話すことさえでき、実際の会話のような感覚を生み出します。OpenAIはまた、ガラスまたはスクリーンレススピーカーを含む可能性のある新しいデバイスエコシステムを視覚化しており、ツールではなく、パートナーとして機能すると言われています。

この戦略は、Appleの元デザインディレクターであるジョニー・アイブ氏のオーディオを優先するデザインの方向性と密接に関連しており、彼は65億米ドルのIO社買収後、OpenAIのハードウェア部門に入社しました。彼は画面への依存を減らし、オーディオインターフェースを将来の消費者のテクノロジーとの相互作用を再構築する機会と見なしたいと考えられています。

そのような状況下で、音声AIはもはや補助機能ではなく、音声が人間の新しい「制御面」になる次世代のパーソナルデバイスの基盤と見なされています。

HẠO THIÊN (THEO techcrunch)
関連ニュース

Googleノートブックが音声学習機能を拡張

|

Googleノートブックには、最大30分の音声講義モードが追加され、ユーザーはシームレスな音声と明確な構造で受動的に学習できます。

異常音を検出するFPTのAIモデルが米国で保護される

|

異音を検出するためのFPTのAI(人工知能)モデルは、その斬新さと応用性の高さから米国で保護されている。

「ここに四羽の空の鳥」と金銭的な崩壊

|

ライブショー「Ve day bon canh chim troi」が公演直前に延期されたという事実は、ベトナムでの公演組織における深刻な抜け穴を露呈しました。

クアンニン省、2026年元旦に38万人の観光客を迎える

|

クアンニン - 2026年の旧正月期間中、2025年12月31日から2026年1月1日まで、クアンニンは38万人の観光客を迎えました。

北朝鮮が金正恩委員長の娘の貴重な写真を公開

|

北朝鮮のメディアは、金山太陽宮殿訪問中の指導者の娘の珍しい姿を公開し、新たな登場を記念しました。

バーでの大晦日の夜の火災、スイスで100人以上が死傷

|

スイスの混雑したバーで大晦日の夜に発生した火災で、少なくとも40人が死亡、100人以上が負傷しました。

Googleノートブックが音声学習機能を拡張

Cát Tiên |

Googleノートブックには、最大30分の音声講義モードが追加され、ユーザーはシームレスな音声と明確な構造で受動的に学習できます。

異常音を検出するFPTのAIモデルが米国で保護される

NGUYỄN ĐĂNG |

異音を検出するためのFPTのAI(人工知能)モデルは、その斬新さと応用性の高さから米国で保護されている。