DeepSeek V4-Pro
DeepSeek V4-Pro 是一个 1.6 万亿参数的 MoE 模型,每个 token 49B 活跃参数,采用混合注意力机制,推理 FLOPs 比 V3.2 降低 73%。
DeepSeek V4-Pro 是一个 1.6 万亿参数的 MoE 模型,每个 token 49B 活跃参数,采用混合注意力机制,推理 FLOPs 比 V3.2 降低 73%。
选择 DeepSeek V4-Pro 用于对推理质量要求最高的场景——复杂推理、超大上下文负载和企业自部署推理。
DeepSeek V4 取代了 V3。V3 和 V3.2 将在 2026 年 7 月 24 日后停用。
DeepSeek V4-Pro 是一个 1.6 万亿参数的 MoE 模型,每个 token 49B 活跃参数,采用混合注意力机制,推理 FLOPs 比 V3.2 降低 73%。