中国のAIスタートアップ企業DeepSeekは、DeepSeek V4 FlashとDeepSeek V4 Proという2つの新しい大規模な言語モデル(LLM)を発表し、高性能で低コストの競争戦略を継続しています。
この動きは、V3.2やR1などの以前のバージョンが世界的に注目を集め、人工知能業界の多くの大手企業の地位に挑戦してから1年以上後に行われました。
2つの新しいV4モデルはどちらもオープンソースコードとしてリリースされ、100万トークンを超えるコンテキストウィンドウを備えており、1回の入力でドキュメント全体またはソースコードなどの非常に大量のデータを処理できます。
その中で、Proバージョンは1兆6000億個のパラメータ(490億個のアクティブパラメータ)の規模を持ち、現在最大のオープンソースモデルの1つと見なされています。この数字は、Kimi K2. 6のMoonshot AIやM1のMiniMaxなどの競合他社を上回っています。
より小型のフラッシュバージョンは、約2840億個のパラメーターを備えており、コストと処理速度を最適化するように設計されています。
どちらのモデルもテキスト出力をサポートするだけであり、画像やビデオなどのマルチメディアコンテンツを作成せず、現在のいくつかのクローズドAIシステムとは異なります。
テクノロジーに関しては、DeepSeekはタスクを細分化し、特殊なモジュールに処理を委託しています。同時に、同社はモデル蒸留やマルチヘッド注意メカニズムなどの多くの高度なテクノロジーを組み合わせ、高度なハードウェアを使用している場合でもパフォーマンスを最適化するのに役立ちます。
以前、DeepSeekはNvidiaのGPU H20を活用していました。新しい世代では、Huaweiが開発したチップに切り替えました。
発表によると、DeepSeek V4 Proは推論テストで高いパフォーマンスを発揮し、特定のタスクでOpenAIやGoogleのトップモデルと競合できます。
ただし、同社はまた、自社のモデルが、一般的な知識の点で最も高度なシステムよりも約3〜6か月遅れていることを認めています。
最も注目すべき点は価格戦略にあります。DeepSeekは、V4 Flashの価格が入力トークン100万枚あたりわずか0.14米ドル、出力が0.28米ドルであるため、低コストの利点を維持し続けています。これは、市場に出回っている同等の製品よりもはるかに低い数字と見なされています。
一方、V4 Proは、GeminiやGPTなどのハイエンドモデルよりも競争力のある価格帯です。
V4シリーズの登場は、DeepSeekが規模と計算能力を競うだけでなく、コスト効率を最適化するという独自の道を追求していることを示しています。これは、AI開発コストに関する見方を変え、業界全体の競争圧力を高めるのに役立ちます。
大手テクノロジー企業がAIに継続的に多額の投資を行っている状況において、DeepSeekがオープンソースで安価でありながら高効率なモデルを提供することは、より広範なアプリケーションの波を促進する可能性があります。
この優位性を維持できれば、中国企業は今後数年間でグローバルAI競争を再構築し続ける可能性があります。