DeepSeekがAPIコストを半減させる新しいモデルを発表

Cát Tiên (THEO techcrunch) |

DeepSeekのSpare Attentionテクノロジーは変圧器を最適化し、サーバーの負荷を軽減しながら処理効率を維持し、低コストでAIに新たな方向性を開きます。

9月29日(米国時間)、DeepSeekの研究チームは、V3.2-expという名前の新しいテストモデルを発表しました。このモデルは、長期的な文脈タスクでの推論コストを大幅に削減するように設計されています。このモデルは、GitHubで公開された学術論文とともにHugging Faceプラットフォームで紹介されました。

V3.2-expのハイライトは、DeepSeek Sparse Attentionメカニズム(曖昧な注意システム)にあります。データ全体を処理する代わりに、このシステムは、文脈ウィンドウの重要なテキストセクションの抽出を優先するために、「セーフセクション設定」と呼ばれるモジュールを使用しています。

その後、別のモジュールである「詳細通知コード選択システム」は、重要なトークンを絞り込み、制限された注意ウィンドウに挿入します。このアプローチは、サーバーの負荷を軽減しながら、長いスローモーションを処理する能力を維持するのに役立ちます。

初期テストによると、DeepSeekは、APIコマンドの実行コストが、大きな文脈を必要とする状況で最大50%削減できる可能性があると述べています。

認証にはさらに多くの独立した評価が必要であるが、Hugging Faceのモデルを公開することで、サードパーティがテストおよび検証に道を開くだろう。

V3.2-expの発売は、推論コストの問題を解決するための一連の取り組みに続くものであり、AIモデルの運用における最大の課題の1つです。

初期のトレーニング費用とは異なり、推論費用はユーザーにサービスを提供するためのサーバーインフラストラクチャに直接関係しており、常にAIを展開する企業にとって大きな負担となっています。

中国に拠点を置くDeepSeekは、年初にR1モデルで注目を集めましたが、主に低コストの強化学習で訓練されました。しかし、R1は期待どおりの革命を起こしておらず、DeepSeekへの関心はここ数ヶ月で徐々に低下しています。

それにもかかわらず、この新しいメカニズムにより、DeepSeekは変圧アーキテクチャを最適化するための新しいアプローチを示しています。このソリューションはR1ほど騒がしいものではありませんが、推論コスト削減の必要性がますます高まっている米国のAIサービスプロバイダーにとって、実際的な教訓をもたらすと評価されています。

Cát Tiên (THEO techcrunch)
関連ニュース

ますます多くの国がDeepSeekを禁止

|

チェコ共和国は、サイバーセキュリティへの懸念を理由に、すべての政府機関および組織でDeepSeekを禁止している最新の国です。

ピープルズアーティストザヒエン - 歌「ランフォレストブランチ」の著者が死んだ

|

音楽家、NSND The Hienは、肺がんと闘った後、10月1日に亡くなりました。

今週、事業単位、国営企業の整理案がある

|

内務大臣は、事業単位の再編、国営企業の再編、および省庁の組織構造における再編計画を完了していると述べました。

ベトナムとロシア連邦の両国民の友好関係はますます良好に発展するでしょう。

|

ベトナム祖国解放党中央委員会のドー・ヴァン・チエン委員長は、ベトナムとロシア連邦間の包括的戦略的パートナーシップ、および両国民の友好関係がますます良好に発展し、信頼し、互いに支援し合うようになると確信しています。

ラオカイの魚池の破損事故で残骸を発見

|

Lao Cai - バオタン村での魚池の破損により、4人の労働者が流され、そのうち2人が死亡しました。

ラオカイの街路は、水が引いた後、泥、土、ゴミで覆われています。

|

ラオカイ - 水位が下がった後、地元住民と関係当局は、交通や生活を回復するために、泥、土、ゴミを迅速に片付けました。

首相は、Quang Ngai Povincial People's Committeeの2つの副議長を承認しました

|

首相は、2人のコミューン秘書の選挙の結果を承認しました。ドタム・ヒエン氏とヌグエン・コング・ホアン氏はクアン・ナガイ人民委員会の副会長として承認しました。

各時点での各地域の降水量を正確に予測できますか?

|

気象機関の代表者によると、雨量の正確な予測は、世界の主要な予報センターでさえ、依然として「難しい課題」です。

ますます多くの国がDeepSeekを禁止

NGUYỄN ĐĂNG |

チェコ共和国は、サイバーセキュリティへの懸念を理由に、すべての政府機関および組織でDeepSeekを禁止している最新の国です。

Đức yêu cầu Apple và Google chặn ứng dụng AI DeepSeek

HẠO THIÊN (THEO CNBC) |

Cơ quan bảo vệ dữ liệu Berlin (Đức) vừa yêu cầu Apple và Google xem xét việc chặn ứng dụng trí tuệ nhân tạo DeepSeek do lo ngại vi phạm dữ liệu người dùng.

Nhân viên Microsoft bị cấm sử dụng ứng dụng DeepSeek

Anh Vũ |

Microsoft chính thức cấm nhân viên sử dụng ứng dụng DeepSeek vì lo ngại về an ninh dữ liệu và nguy cơ tuyên truyền.