Google が Gemini Nano Banana イメージング モデルを発売したとき、技術コミュニティはそのパフォーマンスに注目しただけでなく、Nano Banana という奇妙な名前にも興味を持ちました。
最近、Gemini チームの最高製品責任者である David Sharon が Made by Google ポッドキャストで一部始終を語りましたが、これは驚くほど興味深い内容でした。
シャロン氏によると、ナノ・バナナという名前は元々は単なる一時的な識別子であり、ニーナという名前のグーグル社員が急遽作ったものだという。
彼女は、ユーザーが開発者を知らなくても AI モデルを匿名で体験できるプラットフォームである LM Arena にテスト モデルを提出しました。
「秘密にするために、ニーナはランダムな偽名を入力する必要がありました。彼女がその名前を思いついたのは午前2時30分ごろでした。意図はなく、ただ楽しい選択でした」とシャロンさんは語った。
しかし、LMアリーナのユーザーがこのモデル、特にNano Bananaという名前を愛し始めたとき、予期せぬことが起こりました。
「みんながそう呼んでいることに気づきました。そこで、名前を変える代わりに、同じ名前を維持することにしました」とシャロンさんは語った。
この面白い名前の背後には、Google の画像作成テクノロジーの画期的な進歩があります。 Gemini Nano Banana は、多くの AI モデルのこれまでの弱点であった、顔の一貫性とキャラクターの同一性を維持することができます。
「初めて試したとき、私は自分の写真をアップロードし、AIに私を宇宙に配置するよう依頼しました。その結果は素晴らしかったです。なぜなら、それはAIによって作成された歪んだコピーではなく、依然として私であったからです」とシャロンは語った。
顔の特徴を保存し、同時に柔軟に作成できる機能により、Nano Banana は Google の画像 AI ラインにおいて大きな前進となり、DALL·E 3、Midjourney、Adobe の Firefly などのツールと直接競合します。
Google の Greenfield と呼ばれる社内チームは、Nano Banana をさまざまなクリエイティブな課題に取り組みました。 「ソファとポテトの組み合わせ」と尋ねられると、モデルはすぐに「カウチポテト」のイメージを作成しました。これは、怠惰だが機知に富んだ方法でソファの上のポテトを意味します。これは、AI がコンテキストを理解し、概念を柔軟に組み合わせる能力があることの証拠です。
これらのテストは、Nano Banana が美しい画像を作成するだけでなく、アイデアを理解し、デジタル アート、広告、デザインにおける新しい応用の可能性を開くことを示しています。
このモデルの成功は、Google が、真夜中の単なる冗談に見えた「ナノ バナナ」から始まり、創造性、認識、パーソナライゼーションが調和して組み合わされた新世代のビジュアル AI に強く賭けていることを示しています。