OpenAIは、ChatGPTの大規模なアップデートを発表しました。音声とテキストを単一のインターフェースで統合し、インタラクションエクスペリエンスをより自然でシームレスな方向に拡大します。
新しい設計により、ユーザーは音声で会話を始めたり、テキストをすぐに入力したりできます。一方、システムは状況に応じて音声、文字、または画像で応答します。
最も注目すべき点は、ChatGPT Voiceが現在、リアルタイムで地図を表示できる機能を備えていることです。これは、以前は音声のみのバージョンに登場したことがありませんでした。
地図、画像、および視覚的なデータは、音声応答のすぐ隣に表示され、マルチメディアチャットをよりスムーズにし、道案内、情報検索から業務処理まで、多くの使用状況に適しています。
OpenAIは、チャットウィンドウにスライド録音も追加しました。これにより、音声でのすべてのやり取りがテキスト形式で表示され、ユーザーはコンテンツを再確認したり、会話の流れを追跡したり、必要に応じてリスニングモードとリスニングモードの切り替えを切り替えたりできます。
これは、音声で複雑なタスクを頻繁に実行するが、依然としてテキスト形式で情報を把握したい人にとって重要な改善点です。
さらに、統一された設計は、モード間の選択を不要にします。ユーザーはチャットウィンドウを開き、好きなように会話を開始するだけで、システムは適切なフィードバック形式を自動的に調整します。
以前のように音声のみのインターフェースを好む人にとって、OpenAIはインストールセクションで変換オプションを維持しますが、統合モードは将来デフォルトになります。
アップデートは、ウェブとモバイルアプリケーションの両方で徐々に展開されています。ユーザーは、メインチャットインターフェイスでチャットGPT Voiceに直接アクセスでき、入力形式間を中断することなく継続的なインタラクション機能を活用できます。
これは、ChatGPTをより完全なマルチメディアアシスタントに変え、AIと人間のコミュニケーション方法を統一する上で重要な進歩と見なされています。