ヒューマノイドロボット分野への巨額投資の波のさなか、2018年チューリング賞受賞者で現在メタ社の主要AI科学者であるヤン・ルカン教授は、業界が生成型AI熱と同様の期待バブルに陥っていると警告した。
MITが主催するGenerative AI Impact Symposium(MGAIC)で講演したルカン氏は、スタートアップ企業の大半がロボットの真の知能という中核問題を解決するのではなく、ハードウェア設計に重点を置いていると述べた。
LeCun 氏は、今日、日常生活に役立つほど賢いロボットを作成する方法を知っている企業は存在しないと強調しました。
「ロボットは製造や物流などの特定のタスクに合わせて訓練することができますが、インテリジェントな家庭用ロボットになるには、AI アーキテクチャの根本的なブレークスルーが必要です」とルカン氏は述べています。
同氏はまた、このステップは世界モデル、つまり機械が人間と同じように物理世界を理解し、予測し、対話できるようにするシステムの開発にかかっていると述べた。
ワールド モデルの概念は、高帯域幅のビデオとセンサー データから学習してアクションの結果を予測する AI の機能を指します。
同氏は、V-JEPA (Video Joint Embedding Predictive Architecture) アーキテクチャの取り組みについて言及しました。これは、ビデオ内で不可能なことが起こったときに AI が検出できるようにする自己教師あり学習の形式です。
LeCun 氏によると、これは機械認識の始まりであり、ロボットが手動トレーニングなしで学習できるようになる道が開かれます。
LeCun 氏のコメントは多くの専門家によって支持されています。 OpenAIの共同創設者であるアンドレイ・カルパシー氏も、現在のロボットは継続的に学習することができず、生命活動に十分な汎用人工知能(AGI)を実現するには少なくとも10年かかるだろうと考えている。
LeCun 氏は、現在の大規模言語モデル (LLM) はテキストからのみ学習し、実際の感覚データが不足しているため、人型ロボットを操作することはできないと主張しています。
「4 歳児は、LLM トレーニング データベース全体と同じくらい多くの視覚データを見てきました」と LeCun 氏は言いました。
40 年以上の研究実績を持つルカン氏は、ジェフリー・ヒントン氏、ヨシュア・ベンジオ氏とともに深層学習の 3 人の父の 1 人とみなされています。
彼は、AI が単にテキストを読んで理解するのではなく、物理世界から学習して初めて、真にインテリジェントなロボットの夢が現実になると信じています。