2026年5月27日消息:

小米MiMo-V2.5系列API永久降价:最高降幅达99%

最新高纬度讯息,请点击下图围观:

站长之家(ChinaZ.com)5月27日 消息:小米今日宣布了一项力度极大的价格调整,旗下自研大模型MiMo-V2.5系列的API定价迎来永久性下调。官方公布的数据显示,相比原始API定价,新价格最高降幅可达99%,并且彻底取消了按上下文窗口长度区分的计费方式,已于今日凌晨正式生效。

具体到两个核心版本,降幅数字相当惊人。MiMo-V2.5Pro的输入缓存命中价格降至每百万tokens仅0.025元,最高降幅达99%;其输出价格降至每百万tokens6元,最高降幅为86%。MiMo-V2.5标准版的输入缓存命中价格则降至0.02元,输出价格降至2元,对应的最高降幅分别为98%和93%。

除了API单价本身,小米也同步优化了Token Plan计费体系。在维持原价的前提下,新版Token Plan的可用用量提升至原来的5到8倍,并引入“Credits”概念,试图让整体计费规则变得更透明直观。

支撑这轮大幅降价的,是技术团队在推理系统层面的持续优化。小米基于SGLang HiCache,完整支持了滑动窗口注意力机制,成功将KV缓存数据在多级存储之间的搬运量降至优化前的近七分之一,同时将可缓存的token数量提升至原来的近5倍。这直接拉高了缓存命中率与推理效率。

此外,通过优化专家并行方案和输入长度分桶策略,集群的输入吞吐能力得到进一步提升,在保障服务质量的同时压低了单位token的服务成本。这轮降价,既是市场策略,也是底层工程优化能力的一次对外展示。

(举报)

返回顶部