Googleは、Google DeepMindが開発したウェブプラットフォームに基づく実験であるProject Genieで、人工知能分野で大きな一歩を踏み出しました。これにより、ユーザーはAIによって構築された世界をリアルタイムで作成および探索できます。
このプロジェクトは、Googleが環境をシミュレートし、現実世界のように反応できる「多機能世界」モデルであるGenie 3を発表してから約5ヶ月後に開始されました。
以前はGenieは限定的な範囲でのみテストされていましたが、Project Genieは、有料ユーザーグループがAIによって作成された世界に直接足を踏み入れる機会を開きました。
Project Genieの動作方法はシンプルでユーザーフレンドリーに設計されています。ユーザーは、背景、キャラクター、および望ましい世界のスタイルを説明するためにテキスト提案を入力することから始めます。
彼らはまた、アップロードしたり、画像を作成して空間の外観を定義したりすることもできます。体験に参加する前に、ユーザーはNano Banana Pro">Banana ProやGeminiなどのGoogleのAIツールを使用して、シーンをプレビューして微調整できます。
環境に入ると、ユーザーはファーストまたはサードパーティの視点から世界を探索できます。この空間では、キャラクターは静止しているのではなく常に動き、探索者の旅に沿って絶えず広がる風景を歩いたり、飛行したり、運転したりできます。
静的3D環境とは異なり、Project Genieはリアルタイムで新しい地形を作成し、ユーザーが戻ってきたときに一貫性を維持するために作成された領域を記憶します。
大きな計算能力の要件により、各体験セッションは現在60秒に制限されています。この期間中、ユーザーは専用の処理「チップ」が付与され、プライベートで安定した体験が保証されます。
Project Genieへのアクセス権は現在、月額250米ドルのGoogleのAI Ultraパッケージのサブスクリプションユーザーのみが利用でき、米国では18歳以上のユーザーにのみ適用されます。Googleは、今後展開範囲を拡大すると述べています。
Project Genieの背後には、世界のモデルを構築するというより大きな野心、つまり環境がどのように機能し、人間の行動にどのように反応するかをシミュレートできるAIシステムがあります。
チェスをしたり、画像を作成したりするなどの狭いタスクを解決するだけでなく、これらのモデルは、現実世界の多様性、予測不可能性、柔軟性を再現することを目的としています。
この技術は、ロボットトレーニング、建築設計、ゲーム開発、映画制作、歴史シミュレーション、仮想環境でのスキル訓練など、多くの分野で応用できると期待されています。
Project Genieを使用すると、ユーザーは他の人の提案に基づいて既存の世界を編集またはリミックスし、コミュニティ志向の創造的なエコシステムを作成することもできます。
さらに、プラットフォームは、インスピレーションを与えるための厳選された体験とランダムな世界のコレクションも提供しています。ユーザーは、自分の探求の旅のビデオを記録し、コミュニティと共有できます。
それにもかかわらず、GoogleはProject Genieを実験的なプロトタイプと呼ぶ際に依然として慎重です。同社は、ゲーム内の世界が時々高いリアリズムに達しておらず、物理学が異常に動作し、キャラクターの制御が時々スラッシュしたり、ラグが発生したりする可能性があることを認めています。以前に紹介されたいくつかの高度な機能も統合されていません。
しかし、ランウェイやワールドラボのような多くの競合他社が同様の目標を追求している状況において、プロジェクト・ジーニーはAIによって作成された世界がもはやSFのアイデアではないことを示しています。