小米公布开源AI推理大模型MiMo!

小米公布开源AI推理大模型MiMo!
小米今天突然公布了自己的 AI 推理大模型!
这家全球领先的智能科技公司今日正式公布其自主研发的AI推理模型——MiMo,并宣布全面开源,向全球开发者和研究机构开放该模型的核心代码与训练数据。
此举标志着小米在人工智能领域的战略布局迈出关键一步,也展现了其构建开放、协同、高效AI生态系统的愿景。
MiMo(全称 Xiaomi Modular Inference-only Model)是一款专注于推理任务的轻量级人工智能模型,具备高度模块化设计,适用于多场景部署,包括边缘计算、移动终端以及嵌入式设备。
相比现有解决方案,MiMo在保持高性能的同时显著降低了计算资源消耗,提升了推理效率,尤其适合对响应速度和能效比有较高要求的应用场景。
在数学推理和编程竞赛等关键测试中展现出了惊人的性能表现。
据官方介绍,Xiaomi MiMo 在 AIME 24-25 数学推理数据集与 LiveCodeBench v5 编程竞赛测试集上的表现,超越了 OpenAI 的闭源推理模型 o1-mini,以及阿里巴巴旗下开源模型 QwQ-32B-Preview。值得一提的是,MiMo 仅使用了 70 亿参数的模型规模,就在这些高难度任务中实现了领先。
为了实现这一突破,MiMo 的能力提升主要来源于预训练和后训练阶段的一系列创新,涵盖数据构建、训练策略、算法优化和系统框架等多个方面。
在预训练阶段,核心目标是让模型接触到更丰富的推理模式。为此,研究人员特别注重挖掘具有高度推理价值的数据,并通过合成的方式生成了大约 2000 亿 token 的推理相关语料。此外,在训练过程中采用了三阶段逐步递增强度的课程学习策略,帮助模型由浅入深地掌握复杂的推理逻辑。整个预训练过程累计处理了高达 25T tokens 的数据量。
而在后训练阶段,则重点在于开发高效且稳定的强化学习方法和配套系统框架。为了解决复杂问题中奖励信号稀疏的问题,小米提出了一种名为 “Test Difficulty Driven Reward” 的新算法,从而更好地引导模型学习解决困难任务的能力。同时引入了 “Easy Data Re-Sampling” 策略,以提高训练过程的稳定性。
在系统层面,研究团队还专门设计了一个高效的强化学习训练系统 —— Seamless Rollout,该系统显著提升了训练和验证的效率,使得 RL 训练速度提升了 2.29 倍,验证阶段也加快了 1.96 倍。
小米集团技术负责人表示:“MiMo的发布不仅是小米技术创新实力的体现,更是我们推动人工智能普及与落地的重要举措。通过开源,我们希望与全球开发者共同探索AI应用的边界,加速产业智能化进程。”
此次开源计划在GitHub等平台上同步上线,并配套提供详细的文档、示例代码及社区支持,助力开发者快速上手并进行个性化定制。
此外,小米还计划在未来几个月内推出基于MiMo的开发竞赛和技术沙龙,进一步激发创新活力。
小米是一家巨型消费者科技企业,旗下业务非常多, 以后 MiMo 如果成功,将可让它旗下产品不再依赖其他大模型,达到省钱,省资源以及更加高度统合的生态。
更多消息请守住 Mdroid。
来源:GitHub , Tech in Asia