站长之家(ChinaZ.com)6月30日 消息:DeepSeek团队正式宣布,DeepSeek V4的正式版本计划于7月中旬上线,届时将带来一系列功能优化与性能提升。伴随新版本发布,官方也将同步调整API的定价策略,首次引入峰谷定价机制,以更合理地分配算力资源并保障服务稳定性。
根据公布的定价方案,API在每日高峰时段的价格将是平时的两倍。具体高峰时段定为上午9点至12点以及下午2点至6点,其余时间则按平时价格计费,与现行的V4API定价保持一致。以高峰时段为例,V4-Flash的API输入价格为每百万token2元,缓存命中可低至0.02元,输出价格为每百万token4元。V4-Pro因算力成本较高,输入价格为每百万token6元,缓存命中为1元,输出价格为每百万token12元。
DeepSeek V4的预览版已于今年4月24日上线并开源,主打百万字超长上下文,在智能体能力、世界知识与推理性能等方面均处于国内及开源领域的领先水平。该系列模型采用MoE混合专家架构,分为两个版本。旗舰版V4-Pro总参数达1.6万亿,激活参数490亿,定位高性能,适用于处理复杂任务。轻量版V4-Flash总参数2840亿,激活参数130亿,推理开销与显存占用大幅降低,主打快捷与经济。两个版本均原生支持100万token的超长上下文,并采用MIT开源协议,允许开发者免费商用与二次开发。
技术上,V4系列的核心亮点在于全新的注意力机制,它在token维度进行压缩,并结合DSA稀疏注意力方案,大幅削减了计算与显存开销。这使得V4在百万token场景下的推理计算量仅为前代V3.2的约27%,显存占用低至10%,显著提升了长上下文处理效率,并能更好地支撑智能体与代码生成等场景。官方此前曾表示,待下半年昇腾950批量上市后,Pro版本的价格还将进一步大幅下调。目前,DeepSeek V4预览版已可通过官网、App、API及本地部署等多种方式使用。
(举报)
