九坤投资创始团队成立至知创新研究院,发布开源国产代码大模型 IQuest-Coder-V1,声称开源模型 SOTA,只需 40B 就能秒杀所有闭源模型
1 月 1 日消息,至知创新研究院(IQuest Research)发布全新一代开源代码大模型 IQuest-Coder-V1 系列。据介绍,模型在自主性软件工程、竞赛编程等关键维度上,成为了当下开源模型 SOTA。据悉,至知研究院当前在医疗、LLM、数学、生物、电力等多个方向展开研究和布局,未来还将携手业界开展面向实际场景的技术研发与投资合作,加快技术成果的产业化进程。
据了解,至知创新研究院由九坤投资创始团队发起设立,是独立于量化投研体系的全新平台。至知研究院网页显示,其定位为一个加速 AI 应用落地的研究型组织,致力于为前沿 AI 技术研究做出原创性贡献,加速 AI 在更多垂直领域的应用。
- 最先进的性能:在 SWE-Bench Verified(81.4%)、BigCodeBench(49.9%)、LiveCodeBench v6(81.1%)及其他主要编程基准测试中取得领先成绩,在代理式软件工程、竞技编程以及复杂工具使用方面均超越同类模型。
- Code-Flow 训练范式:超越静态代码表示,我们的模型从代码库的演化模式、提交变更和动态代码转换中学习,以理解真实世界的软件开发流程。
- 双重专业化路径:后训练被分为两条专门化路径 ——Thinking 型(采用以推理为驱动的强化学习,擅长复杂问题求解)和 Instruct 型(为通用编码助手与指令遵循优化)。
- 高效架构:IQuest-Coder-V1-Loop 变体引入循环机制,优化模型容量与部署开销之间的权衡。
- 原生长上下文:所有模型原生支持最多 128K Token 的上下文,无需额外的扩展技术。
限制
- 推理与效率的权衡:Thinking 型模型具备更强的推理能力,但通常生成较长的响应;Instruct 型模型在处理简单任务时更加高效。
- 代码执行:模型可以生成代码,但不会执行代码;务必在沙箱环境中验证输出。
- 领域特异性:尽管模型在多样化代码库上训练,但在高度专业化或专有框架上的表现可能有所不同。
- 事实性:模型可能生成看似合理但不正确的代码;对关键实现进行彻底验证。
Source: 九坤创始团队成立至知创新研究院 开源模型发布_网易科技


评论区(暂无评论)