LFM2-2.6B-Exp 是一个基于 LFM2-2.6B 的实验性检查点,采用纯强化学习技术构建。
在教学理解、知识掌握和数学基准方面不断取得进步

在这些领域优于其他 3B 模型
其 IFBench 得分超过了 DeepSeek R1-0528,后者是一款体积比它大 263 倍的型号。



感觉未来本地端都是小模型的天下喵,未来可期喵



📌 转载信息
原作者:
artorius
转载时间:
2025/12/26 11:00:19