DeepSeek:「V3.2-Exp」をリリース2025年10月04日 15:32

Geminiで作成
【概要】

 中国の人工知能(AI)スタートアップであるDeepSeekは、同国のNational Day holiday(国慶節)の直前に、基盤モデルV3の実験的バージョンである「V3.2-Exp」をリリースした。

 このモデルは、トレーニングと推論の効率を向上させるとともに、アプリケーション・プログラミング・インターフェース(API)コストを大幅に削減したモデルである。同社が中国製の次世代AIチップ向けにモデルを調整する方針を表明したことから、業界はその新製品の動向に高い関心を払っている状況である。  

【詳細】 

 DeepSeekは月曜日にV3.2-Expをリリースし、開発者プラットフォームであるHugging FaceとAlibaba Group Holding傘下のModelScopeでオープンソース化した。

 同社によると、このモデルは以前のバージョンと比較してトレーニングと推論の効率を強化し、APIコストを50パーセント以上削減している。V3.2-Expは現在、DeepSeekのウェブサイトおよびアプリで利用可能である。

 今回のリリースは、わずか1週間前のDeepSeek-V3.1-Terminusのデビュー、およびその2ヶ月前のV3.1の導入に続くものであり、製品リリースを加速させている。同モデルには、次世代モデルアーキテクチャへの「中間ステップ」として、新しい「DeepSeek Sparse Attention」メカニズムが組み込まれており、これにより長い入力の処理効率が改善されている。

 DeepSeekは、V3.2-ExpがV3.1-Terminusと「同等の」性能を達成しながら、使用コストが大幅に安価であると述べている。主要なAIベンチマーク企業Artificial Analysisによれば、V3.1-Terminusは8月にリリースされたOpenAIのgpt-oss-120bと並び、世界最強のオープンソースモデルであり、中国のAIモデルとしては最強であると評価されている。

 同社は昨年12月にオリジナルのV3モデルを、そして今年1月には国内外で大きな話題を呼んだR1推論モデルをリリースしており、国内の競合他社はR1のリリースを受けて重要な旧正月の休暇中も従業員を勤務させることになった経緯がある。

 今回の国慶節休暇前にはV4またはR2といった主力モデルの主要アップデートが予想されていたが、実際にはV3.2-Expという中間的な技術革新が導入された。オランダのユトレヒト大学の研究者によると、V4は来年、R2は旧正月頃にリリースされる可能性が高いと予測されている。

 DeepSeekはまた、AIエージェント時代への「第一歩」として、基本モデルのエージェント能力の強化を計画している。

【要点】

 ・DeepSeekは国慶節休暇を前に、基盤モデルV3の実験的バージョン「V3.2-Exp」をリリースし、オープンソース化した。

 ・V3.2-Expは、トレーニング・推論効率の向上と、APIコストを50パーセント以上削減した点が主な特徴である。

 ・次世代モデルアーキテクチャへの中間ステップとして、新しい「DeepSeek Sparse Attention」メカニズムを導入した。  

 ・同社が中国製のAIチップ向けにモデルを調整する計画を表明しており、業界から注目されている。

 ・先行モデルV3.1-Terminusは、世界最強クラスのオープンソースAIモデルの一つとして評価されている。  

 ・主要な次世代モデルであるV4は来年、R2は旧正月頃のリリースが予測されている。

【引用・参照・底本】

China’s DeepSeek unveils experimental version of its V3 AI model before National Day holiday SCMP 2025.10.04
https://www.scmp.com/tech/big-tech/article/3327255/chinas-deepseek-unveils-experimental-version-its-v3-ai-model-national-day-holiday?utm_medium=email&utm_source=cm&utm_campaign=enlz-insidechinatech&utm_content=20251003&tpcc=enlz-insidechinatech&UUID=5147fda4-c483-4061-b936-ccd0eb7929aa&tc=1

コメント

トラックバック