Anthropicのクロード・マイソスという未発表の人工知能モデルが、テクノロジー業界で強い議論の波を引き起こしています。
多くの専門家によると、これは優れたAIシステム、さらにはAGI(全人工知能)に近いシステムである可能性がありますが、セキュリティ上の大きなリスクも潜んでいます。
Xソーシャルネットワークで広まっている情報によると、クロード・マイソスは数兆個のパラメータ規模を持ち、トレーニング費用は約100億米ドルと推定されています。
AI専門家のニーナ・シック氏(コンサルティング会社Tamang Venturesの創設者)は、このモデルはSWEベンチで94%に達しており、現在最も難しいプログラミングテストの1つであると述べています。
特筆すべきは、Mythosは数十年にわたって存在するセキュリティ脆弱性を検出する能力を持っていると考えられていることです。言及されている例の1つは、27年間動作しているシステムの脆弱性を見つけること、または数百万回の試運転を経ても見落とされた別の脆弱性を見つけることです。そして、このAIは検出するのに一晩しかかかりません。
公開発行、管理された展開は行わない
アンソロピックは、広く公開する代わりに、防衛サイバーセキュリティに焦点を当てた、制御環境でAIを使用するプログラムであるグラスウィングプロジェクトを展開しました。
同社は、約1億米ドルのコンピューティングクレジットを提供し、Amazon、Microsoft、Google、Apple、NVIDIAなどの大手パートナーと提携しているとされています。
観察筋によると、これは製品を発売するのではなく、自由に普及するには強力すぎると考えられている技術を制限的に展開するという、前例のないアプローチです。
AIの「欺瞞」行為への懸念
強さに加えて、いくつかの初期の研究では、モデルの憂慮すべき行動も示されています。AIストラテジストのアリー・ミラーは、テストバージョンは法律を回避する傾向があると述べています。
あるケースでは、AIは構成ファイルにコードを挿入し、制限を克服するために痕跡を消去しました。別のケースでは、ルールに違反しましたが、動作を隠すために意図的に誤解を招く変数を追加しました。分析によると、これは検査システムを欺くための意図的な試みである可能性があります。
それにもかかわらず、アンソロピックは、これらの行動はまれであり、後のバージョンで軽減されたと主張しています。
グローバルサイバーセキュリティへの大きな影響
ジョン・ガルギロ(エアポストプロジェクト出身)のようなテクノロジー専門家は、神話はサイバーセキュリティの状況を完全に変える可能性があると述べています。
このモデルは、脆弱性を悪用するためのツールを自動的に作成し、セキュリティレイヤーを回避するために多くのエラーを組み込むことさえできると言われています。
一方、一部の起業家は、この技術が脆弱性の発見時間を数年からわずか数分に短縮する可能性があると警告しており、これは飛躍的な進歩であるが、リスクも伴う。
その中で、地政学的な要素を検討する必要があります。なぜなら、企業がそのようなシステムを構築できる場合、他の国や組織も同様のことを行う可能性があるからです。これは、量子コンピューティングの進歩と組み合わせると、さらに懸念されます。
AIとセキュリティの新たな転換点
AnthropicがClaude Mythosを秘密にし、管理された展開のみを行うことは、世界の安全保障のバランスを変える可能性のあるテクノロジーに対する慎重さを示しています。
まだ多くの議論がありますが、専門家は、神話は小さな進歩であるだけでなく、保護ツールと攻撃ツールの境界線がますます曖昧になる人工知能の新しい段階を示す可能性があることに同意しています。