【小米发布首个推理大模型MiMo-7B并宣布全面开源】4月30日消息,据小米公司公众号“Xiaomi MiMo”,小米今日开源首个专为“Reasoning(推理)”打造的大模型MiMo-7B,在AIME数学推理和LiveCodeBench编程测评中超越OpenAI o1-mini及阿里Qwen-32B。
MiMo通过大规模推理数据预训练与强化学习后训练联动提升推理能力,提出Test Difficulty Driven Reward等创新算法,并在同类7B模型中强化学习潜力领先。全系列已开源至Hugging Face,相关技术报告同步发布。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

