1086 字
5 分钟
DeepSeek-V4 Pro/Flash 正式发布:参数、性能与竞品全面对比

一、概览#

2026年4月24日,DeepSeek 通过官方微信公众号「深度求索」正式发布 DeepSeek-V4 预览版,同步开源权重与技术报告。V4 系列包含两个版本:

规格V4-ProV4-Flash
总参数量1.6T (1600B)284B
激活参数量49B13B
预训练 Token 数>33T>32T
上下文窗口1M (100万)1M (100万)
最大输出384K384K
架构MoE (CSA + HCA Attention)MoE (CSA + HCA Attention)
精度FP4 + FP8 混合FP4 + FP8 混合
许可证MIT(完全开源)MIT(完全开源)

数据来源:DeepSeek 官方微信公众号、API 文档、HuggingFace 模型卡


二、架构创新:DSA 稀疏注意力#

DeepSeek-V4 的核心创新在于全新的注意力机制:

  • Token 维度压缩 + DSA(DeepSeek Sparse Attention)稀疏注意力
  • 在 1M 上下文长度下,V4-Pro 的 FLOPs 仅为 V3.2 的 27%,KV Cache 仅为 10%
  • V4-Flash 更极致:FLOPs 仅为 V3.2 的 10%,KV Cache 仅为 7%

这意味着百万级上下文不再是”奢侈品”,而是成为 DeepSeek 所有官方服务的标配。


三、V4-Pro 基准测试成绩#

以下数据来自 DeepSeek 官方技术报告与 API 文档,按能力维度分类整理。

知识能力#

评测集V4-Pro说明
MMLU90.1多学科知识
MMLU-Pro87.5专业级推理
GPQA Diamond90.1研究生级科学推理
C-Eval93.1中文综合评测
SimpleQA (Verified)57.9%世界知识问答
Chinese-SimpleQA84.4%中文知识问答

推理与数学#

评测集V4-Pro
GSM8K92.6
MATH64.5
HMMT 2026 Feb95.2%
IMOAnswerBench89.8%
Apex Shortlist90.2%

代码能力#

评测集V4-Pro
HumanEval76.8
LiveCodeBench93.5
Codeforces Rating3206(开源最高,人类排名 #23)

Agent / 软件工程#

评测集V4-Pro
SWE Verified80.6%
SWE Pro55.4%
Terminal Bench67.9
SWE Multilingual76.2%
MCPAtlas Public73.6%
Toolathlon51.8%

长上下文(1M)#

评测集V4-Pro
MRCR 1M83.5
CorpusQA 1M62.0

四、与闭源模型对比#

vs Claude Opus 4.6#

评测集V4-ProOpus 4.6胜出
SWE Verified80.6%80.8%≈ 几乎持平
Terminal Bench67.965.4V4-Pro
MRCR 1M83.592.9Opus
Apex Shortlist90.2%85.9%V4-Pro
SimpleQA57.946.2V4-Pro

内部评测反馈:优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在差距。

vs GPT-5.4#

评测集V4-ProGPT-5.4胜出
Codeforces Rating32063168V4-Pro
MMLU-Pro87.5~87-89≈ 持平
GPQA Diamond90.1~90≈ 持平
Apex Shortlist90.2%78.1%V4-Pro
HMMT 2026 Feb95.2%~95%≈ 持平

vs Gemini-Pro-3.1#

评测集V4-ProGemini-3.1-Pro胜出
SimpleQA57.9%75.6%Gemini(知识领先)
MRCR 1M83.576.3V4-Pro(长上下文领先)
CorpusQA 1M62.053.8V4-Pro
MMLU-Pro87.5~89-90Gemini 略优

五、与开源模型对比#

vs Kimi K2.6#

评测集V4-ProK2.6胜出
MMLU-Pro87.587.1V4-Pro
SimpleQA57.936.9V4-Pro(+21分)
Chinese-SimpleQA84.475.9V4-Pro
SWE Verified80.680.2V4-Pro
Terminal Bench67.966.7V4-Pro

vs GLM-5.1#

评测集V4-ProGLM-5.1胜出
Chinese-SimpleQA84.475.0V4-Pro
Terminal Bench67.963.5V4-Pro

开源定位总结#

  • Codeforces Rating 3206 为所有开源模型最高
  • 数学 / STEM / 竞赛代码:超越所有已评测开源模型
  • 世界知识:大幅领先其他开源模型

六、API 定价对比#

DeepSeek 官方以人民币计价,竞品原价为美元,按汇率 1 USD ≈ 7.2 CNY 折算。

模型输入(缓存命中)输入(缓存未命中)输出
V4-Flash¥0.2¥1¥2
V4-Pro¥1¥12¥24
GPT-5.4~¥18~¥36~¥108
GPT-5.5(4月23日发布)N/AN/A~¥216
Claude Opus 4.6~¥36~¥108~¥180
Kimi K2.6~¥14~¥58~¥58
Gemini-3.1-Pro~¥9~¥18~¥72

V4-Pro 输出价格(¥24/百万tokens)为闭源竞品的 1/4 ~ 1/7。V4-Flash 输出仅 ¥2/百万tokens,约为 V4-Pro 的 1/12,性价比极高。


七、API 升级说明#

  • 新模型名:deepseek-v4-pro / deepseek-v4-flash
  • API 地址与接口不变,支持 OpenAI 与 Anthropic 两种格式
  • 均支持思考模式非思考模式,思考模式支持 reasoning_effort 参数(high / max)
  • 旧模型名 deepseek-chat / deepseek-reasoner 将于 2026-07-24 停用

八、开源信息#


九、信息来源与验证#

本文数据来源全部为官方渠道或经交叉验证的第三方报道:

来源类型用途
DeepSeek 微信公众号「深度求索」官方主公告
DeepSeek 官网(deepseek.com)官方横幅确认
API 文档(api-docs.deepseek.com)官方定价与新闻页
HuggingFace 模型卡官方基准数据与技术报告
AI-Insight.org第三方详细评测分析
IT之家 / 36氪 / 量子位第三方媒体报道交叉验证

注意:部分基准测试(如 SWE Verified 80.6%)为 DeepSeek 官方自测,与第三方独立评测(如 Claude Opus 4.7 的 87.6%)使用不同方法,不宜直接对比。


十、写在最后#

DeepSeek-V4 的发布标志着百万上下文进入普惠阶段。V4-Pro 在多维度比肩甚至超越 GPT-5.4 和 Claude Opus 4.6,而 V4-Flash 以极具竞争力的价格($0.28/M 输出)将高性能 AI 的门槛拉到新低。

更值得关注的是:两个版本均以 MIT 协议完全开源,这在顶级模型中是前所未有的。加上 DSA 架构在长上下文场景下的效率飞跃,V4 系列很可能会像当年的 V2 和 R1 一样,再次推动整个开源 AI 生态的进步。

DeepSeek-V4 Pro/Flash 正式发布:参数、性能与竞品全面对比
https://fuwari.vercel.app/posts/deepseek-v4-pro-flash/
作者
San Ring
发布于
2026-04-24
许可协议
CC BY-NC-SA 4.0