Googleは、音声をテキストに変換する技術競争における注目すべき進歩を示す、Google AI Edge Eloquentという名前の新しいスペルリーダーアプリケーションをひそかにリリースしました。
このアプリケーションの最大の違いは、オフライン機能であり、ユーザーはインターネット接続なしでもコア機能を使用できます。
アプリケーションは現在、iOSで無料でリリースされています。Gemmaベースの音声認識(ASR)モデルをダウンロードしてインストールすると、ユーザーは電話で直接スペルチェックを開始できます。
使用中に、Eloquentは記録をリアルタイムで表示します。ユーザーが一時停止すると、システムはコンテンツを自動的に処理し、「うん」、「あ」などのバッファワードを削除し、文をより明確にするために編集します。
これは、言葉をそのまま書き留めるだけの多くの従来のツールとは異なる点です。
アプリケーションはまた、「主な要点」、「フォーマル」、「短い」または「長い」などのオプションを提供し、ユーザーはニーズに応じてテキストをすばやく変換できます。簡単なメモからプロフェッショナルなコンテンツまで。
注目すべき点の1つは、Eloquentを使用すると、ユーザーはクラウドモードを完全にオフにできることです。これにより、すべてのデータがデバイス上で直接処理され、プライバシーとセキュリティが向上します。
オンラインモードをオンにすると、アプリケーションはクラウドプラットフォーム上のGeminiモデルを活用して、テキストをより適切に最適化します。
ユーザーは、アプリがGmailアカウントからキーワード、固有名詞、または専門用語を学習したり、精度を向上させるためにカスタマイズされた単語を自動的に追加したりできます。
アプリはまた、スペル読み取りセッションの履歴を保存し、コンテンツを検索できるようにします。単語数、読み取り速度(単語/分)、または話した単語の総量などの統計も表示され、詳細な追跡体験を提供します。
Eloquentの登場は、GoogleがWispr Flow、SuperWhisper、WillowなどのAIスペルリーダーアプリケーションと直接競合していることを示しています。
音声認識モデルがますます正確になる状況において、この市場は急速に成長しています。
現在iOSでのみ利用可能ですが、アプリケーションの説明は、GoogleがAndroidバージョンの準備をしていることを示しています。
さらに、このバージョンはオペレーティングシステムに深く統合され、デフォルトのキーボードとして使用したり、すべてのアプリケーションで浮遊ボタンを介してすばやくアクセスしたりすることが期待されています。
Googleがオフライン処理に焦点を当てていることは、クラウドからAIをユーザーデバイスに直接導入する新しいトレンドを反映しています。
これは、処理速度を向上させるだけでなく、個人データに関連するリスクも軽減します。
テストが成功すれば、スマートスペルリーダー機能はすぐにAndroidの標準となり、ユーザーがモバイルデバイスと対話する方法を、キーボード入力から自然な会話に変える可能性があります。