Googleは、Geminiアプリケーションの大規模なアップデートをリリースしました。これにより、ユーザーが最も求めている機能は、オーディオファイルのアップロードをサポートすることです。
これは、このAIツールがマルチメディアデータ処理においてより包括的になるのに役立つ進歩と見なされています。
以前は、Geminiは画像、テキスト、および他の多くの種類のファイルのアップロードを許可していましたが、音声をサポートしていませんでした。これは、多くのユーザーが不便に感じる制限です。
新しいアップデートにより、Android、iOS、Webプラットフォームのユーザーはすべて、AIが分析するためのオーディオファイルを直接ダウンロードできます。
Google LabsとGeminiのジョシュ・ウッドワード副社長によると、この機能はユーザーコミュニティからのナンバーワンの要件です。
Googleは、ユーザーが1日5回のリマインダーで最大10分の音声を無料でダウンロードできるようにすることで対応しました。
一方、Google AI ProまたはAI Ultraパッケージを使用している人は、専門的な分析ニーズに対応するために、最大3時間のファイルをダウンロードできます。
Geminiは音声にとどまらず、リマインダーごとにアップロードされるファイル数を、形式に関係なく最大10ファイルに増やしています。これにより、ユーザーはAIにより多くの文脈とデータを提供でき、それによって実際のニーズに沿ったフィードバックを作成できます。
Googleはまた、AIモードに5つの新しい言語を追加することで、検索エンジンをアップグレードしました。
ユーザーは現在、ヒンディー語、インドネシア語、日本語、韓国語、ポルトガル語、ブラジル語で複雑なクエリを設定できます。これらの機能は、Gemini 2.5モデルによって実行され、マルチ言語検索体験を向上させ、AIアプリケーションの範囲をより多くの市場に拡大するのに役立ちます。
「この拡張機能により、多くの人が好きな言語で質問し、より深くウェブを探索できます」とGoogleは発表で強調しました。
今回のアップデートは、Googleがコア製品へのAI応用を推進する戦略を示しています。
Geminiは単なる会話ツールではなく、包括的なAIプラットフォームになりつつあり、マルチメディアおよびマルチ言語をサポートし、人工知能分野の主要な競合他社と直接競合しています。