【CNMO科技】12月17日,在2025小米人车家全生态合作伙伴大会上,小米MiMo大模型负责人罗福莉首次公开亮相。在演讲中,罗福莉正式发布并开源了最新的混合专家(MoE)大模型MiMo-V2-Flash。
这一全新模型是小米自2025年4月开源首个专注于推理能力的大模型Xiaomi MiMo后的又一次重要突破。当时这个仅有70亿参数的模型在数学推理测评中击败了OpenAI的o1-mini,首次展现小米在推理优化领域的潜力。
罗福莉表示,小米开源模型在代码能力和智能体(Agent)能力上,凭借“世界级非常公开公正的评估榜单”成绩,已经进入了全球前两名。那么,小米MiMo是如何比肩OpenAI等AI“豪强”的呢?
MiMo用“极致性价比”破局
据CNMO了解,小米最新开源的MiMo-V2-Flash大模型,其核心优势并非追求参数的绝对领先,而是在性能、成本与速度之间实现了独特的平衡,精准地切入了当前全球AI竞争的一个关键痛点。具体来看,其优势体现在三个层面。
首先,MiMo-V2-Flash在核心能力上达到第一梯队,尤其在代码和智能体(Agent)领域表现卓越。根据基准测试,MiMo-V2-Flash在多个关键指标上已跻身全球顶尖开源模型之列。在评估真实世界软件工程修复能力的SWE-bench Verified测试中,其解决率达到73.4%,超越了所有开源模型,甚至接近GPT-5-High等顶级闭源模型的水平。在数学(AIME 2025)和科学知识(GPQA-Diamond)推理测试中,它也位列开源模型前两名。这意味着,MiMo-V2-Flash不仅是一个通用的对话模型,更是一个在开发者群体最为看重的高价值场景——编程与复杂任务自动化中,具备了强大的实战能力。
其次,也是其最突出的竞争优势,在于革命性的成本与效率。 相较于OpenAI、Anthropic等公司的闭源模型,小米采取了极具侵略性的定价策略。MiMo-V2-Flash的API调用成本仅为每百万输入Token 0.1美元,输出0.3美元。作为对比,专注于编程赛道的Anthropic Claude Opus 4.1模型的定价为输入15美元/百万Token,输出75美元/百万Token。小米模型的推理成本号称仅为标杆闭源模型Claude 4.5 Sonnet的2.5%。同时,其推理速度最高可达每秒150个Token。这种“低成本、高速度”的组合,能为大规模商业化应用扫清障碍。
最后,支撑上述表现的是其底层工程技术的激进创新。为了在控制成本的同时不牺牲性能,小米研发了两项关键技术:一是混合滑动窗口注意力机制,以5层滑动窗口搭配1层全局注意力的设计,将处理长文本所需的存储(KV缓存)降低了近6倍,从而能以较低资源支持256K的超长上下文;二是轻量级多Token预测(MTP)模块,让模型能并行预测后续多个Token,将推理速度提升了2到2.6倍。此外,其采用的多教师在线策略蒸馏(MOPD)训练方法,声称仅用传统方法1/50的算力,就能让模型达到教师模型的峰值性能。这些创新共同构成了小米以“工程效率”对抗“算力规模”的技术底座。
为何全面开源?
一般来说,“好东西”都要“藏起来”,而小米却在OpenAI、谷歌等巨头已建立庞大闭源生态的背景下,选择将MiMo-V2-Flash全面开源(采用MIT协议,权重和推理代码全部开放)。不过这并非简单的技术分享,而是一项深思熟虑的生态竞争战略。
从用户与开发者维度看,开源是获取信任、快速切入市场的“加速器”。 对于广大的开发者和企业用户而言,闭源API意味着“黑箱”风险、数据隐私担忧和潜在的供应商锁定。小米的全面开源彻底打消了这些顾虑,允许开发者自由下载、审查、修改甚至在本地部署模型。这极大地降低了企业和开发者的试用与集成门槛,能快速吸引一批对成本敏感、需要定制化或关注数据安全的技术社群。小米在发布当日就将模型上线Hugging Face、贡献推理代码给SGLang社区,正是为了最大化地拥抱开发者。
从生态竞争维度看,开源是在巨头林立的战场中构建差异化护城河的明智之举。 当前全球AI竞争已从单纯的模型能力比拼,转向“模型+生态+应用” 的立体战争。对于小米这样的后来者,直接与OpenAI在通用闭源模型市场上进行“烧钱”竞赛极为困难。通过开源,小米可以效仿当年Android在移动操作系统领域的策略:联合广大开发者与合作伙伴,共同构建一个围绕MiMo的技术与应用生态。这不仅能快速丰富模型的应用场景,还能通过社区反馈反哺模型迭代,形成良性循环。
更重要的是,小米的开源策略比某些巨头的“有限开源”更具诚意和吸引力。 例如,OpenAI在2025年8月虽然重返开源,发布了gpt-oss系列模型,但其自定义许可协议中包含“毒丸条款”,禁止大型商业实体使用其开源模型开发与OpenAI竞争的产品。相比之下,小米采用的MIT协议是业界最宽松的许可之一,没有任何商业限制,这更能赢得开发者社区的真心支持,旨在成为真正的公共基础资产。
未来展望
尽管小米已经尽力为MiMo铺路,但它仍然面临着不小的考验。在国内,字节跳动、阿里巴巴、智谱AI和DeepSeek等已构成国内基础大模型综合实力的第一阵营。小米需要直接与这些已经建立起技术、数据、生态或商业化优势的玩家竞争。
在全球,面对OpenAI、谷歌等巨头的持续进化,技术追赶压力巨大。 巨头们并未停滞不前,竞争焦点正从“生成”转向“行动”,即从单纯回答问题,升级为能调用工具、执行复杂任务的智能体(Agent)。小米在代码和智能体能力上的优势,将直接受到这些巨头最精锐火力的冲击。能否持续保持技术创新的节奏,是巨大考验。
对小米自身而言,其核心挑战在于如何将模型能力与“人车家全生态”进行深度、有效的整合。 这是小米区别于纯软件公司的最大优势,也是其成败关键。大模型的价值最终取决于落地应用。小米需要证明,MiMo不仅能作为独立的API服务,更能深度赋能其智能手机、智能家居、智能汽车等海量硬件设备,创造出颠覆性的融合体验。
结语
小米通过MiMo-V2-Flash以“开源+极致性价比”的组合拳,成功地在拥挤的AI赛道上发出了清晰而有力的声音。它避开与巨头在通用闭源模型上的正面消耗战,转而选择以工程师思维优化效率,并以开放姿态拥抱生态。它未来的道路,将取决于能否将这种技术上的敏捷性,成功转化为其庞大硬件生态的智能化动力,守住并扩大自己在代码与智能体这一优势战场上的阵地。
回帖(0):
