标签 Mamba 下的文章

TII 刚刚发布了 Falcon H1R-7B 模型

一种新型推理模型,仅凭 70 亿参数和 25.6 万字节上下文窗口,便在数学和编程领域超越其他模型

该模型融合了 Mamba 与 Transformers 架构,因此在吞吐量和内存效率方面更具优势


官方介绍:Introducing Falcon H1R 7B
Hugging Face:Falcon-H1R - a tiiuae Collection


热乎的喵,最新小模型好多哇


📌 转载信息
原作者:
artorius
转载时间:
2026/1/6 17:03:08