長年にわたり、人工知能モデルは言語処理能力で強い印象を与えてきましたが、厳格な財務検査に直面すると弱々しくなっています。
しかし、状況は急速に変化しています。新しい研究によると、現在のトップ6のAIモデルは、投資分野で最も難しい資格の1つである財務アナリスト(CFA)試験の3つのレベルすべてを上回っています。
CFAは、金融専門家にとって「黄金のチケット」と見なされており、グローバルなキャリアの機会と高収入を開きます。
試験は3つのレベルで構成されており、難易度が徐々に高まります。知識だけでなく、応用、分析、推測能力も必要です。AIがこのプログラム全体を突破したことは、議論能力において大きな進歩を示しています。
調査によると、GoogleのGemini 3.0 Proモデルは、レベルIで97.6%という記録的なスコアを達成しました。GPT-5はレベルIIで94.3%で首位を走りました。一方、GeminiはレベルIIIで引き続き優位性を示しており、92%の確率で最も難しい試験です。
Claude Opus 4.1、Grok 4、DeepSeek-V3.1などの他のモデルも合格基準を超える結果を達成しました。合計で、これらのシステムは、CFA研究所の公式資料と評判の高い試験問題に基づいて980のシミュレーション質問でテストされました。
この結果の意味は、CFA試験の構造そのものにあります。レベルIは、経済学、財務報告書、倫理、定量的方法などの基礎知識をテストします。レベルIIは、特定の状況研究に知識を適用することを要求します。
第IIIレベルでは、受験生は情報を集約し、投資戦略を策定し、文書で説明し、議論する必要があります。これらは、以前AIが困難に直面していたスキルです。
研究者らは、違いは新しいモデルのアーキテクチャにあると考えています。新しい世代のAIは、情報を記憶して追跡するだけでなく、多段階推論、長い文脈の追跡、および条件に応じて柔軟なルールの適用能力を備えています。
特に、定量推論能力は著しく向上しました。数学部分の誤り率がほぼゼロであったためです。
それにもかかわらず、AIはまだ完璧ではありません。職業倫理は引き続き弱点であり、モデルは時々規則を繊細に適用しすぎます。
自論の回答部分も物議を醸しています。なぜなら、別のAIによる採点は、人間の審査員の厳格な評価方法と比較して偏りを生み出す可能性があるからです。
さらに重要なことに、試験を突破することは、CFAの専門家に取って代わることができるという意味ではありません。投資ポートフォリオの管理、顧客とのコミュニケーション、市場変動の処理、および法的責任は、依然として経験と人間の判断を必要とする分野です。
しかし、この成果は、AIが新たな閾値を超え、多くの複雑な分析タスクを実行するのに十分な能力を持っていることを示しています。
金融業界にとって、AIは強力なアシスタントであると同時に大きな課題も提起しています。機械が専門試験を突破できるようになると、これらの資格の価値は、知識のテストから意思決定能力、倫理、および現実世界における責任の評価へと移行する可能性があります。