DeepSeek-V4-Pro 永久降价,折后价成常态
DeepSeek 宣布 DeepSeek-V4-Pro 永久降价:2026 年 5 月 31 日结束 2.5 折优惠后,永久执行当前折后定价。调整后百万 token 输入(缓存未命中)3 元、输出 6 元,相当于原价的 25%。DeepSeek-V4-Flash 也于同期登顶 OpenRouter 周榜。

DeepSeek-V4-Pro 永久降价详情
据 DeepSeek 官方定价页面,DeepSeek-V4-Pro 当前 2.5 折优惠活动将于 2026 年 5 月 31 日 结束。优惠期结束后,价格将永久调整为原定价的 1/4,即维持当前折后价不变。DeepSeek 官方在社交平台确认:“We are making our discount permanent!”
调整后 DeepSeek-V4-Pro API 永久定价如下:
- 百万 token 输入(缓存命中):0.025 元(原价 0.1 元)
- 百万 token 输入(缓存未命中):3 元(原价 12 元)
- 百万 token 输出:6 元(原价 24 元)
作为对比,DeepSeek-V4-Flash 定价维持不变:缓存命中 0.02 元/百万 token、缓存未命中 1 元/百万 token、输出 2 元/百万 token。
模型规格与并发限制
DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 均支持 1M 上下文窗口与最大 384K 输出长度,兼容 JSON Output、Tool Calls 等功能。两款模型支持思考与非思考两种模式(默认思考模式)。Flash 版本并发限制 2500,Pro 版本并发限制 500。API 兼容 OpenAI 与 Anthropic 两种格式,BASE URL 分别为 https://api.deepseek.com 和 https://api.deepseek.com/anthropic。
此外,两款模型均支持对话前缀续写(Beta)功能。FIM 补全(Beta)仅在非思考模式下可用。
DeepSeek-V4-Flash 登顶 OpenRouter 周榜

据 OpenRouter 数据,DeepSeek-V4-Flash 已登顶其周排行榜。结合 Flash 版本的低定价(输出仅 2 元/百万 token),该模型在性价比方面具备较强竞争力。DeepSeek-V4-Pro 此番永久降价后,Pro 版本输出定价(6 元/百万 token)仍为 Flash 的 3 倍,但较原价下降 75%,对需要更高并发与更强性能的生产场景具有吸引力。
DeepSeek-V4-Pro 永久降价后,输入 3 元/百万 token、输出 6 元/百万 token 的定价在同类 Pro 级模型中具备价格优势。
评论 ···