标签 开源模型 下的文章

1 月 1 日消息,至知创新研究院(IQuest Research)发布全新一代开源代码大模型 IQuest-Coder-V1 系列。据介绍,模型在自主性软件工程、竞赛编程等关键维度上,成为了当下开源模型 SOTA。据悉,至知研究院当前在医疗、LLM、数学、生物、电力等多个方向展开研究和布局,未来还将携手业界开展面向实际场景的技术研发与投资合作,加快技术成果的产业化进程。

据了解,至知创新研究院由九坤投资创始团队发起设立,是独立于量化投研体系的全新平台。至知研究院网页显示,其定位为一个加速 AI 应用落地的研究型组织,致力于为前沿 AI 技术研究做出原创性贡献,加速 AI 在更多垂直领域的应用。

  • 最先进的性能:在 SWE-Bench Verified(81.4%)、BigCodeBench(49.9%)、LiveCodeBench v6(81.1%)及其他主要编程基准测试中取得领先成绩,在代理式软件工程、竞技编程以及复杂工具使用方面均超越同类模型。
  • Code-Flow 训练范式:超越静态代码表示,我们的模型从代码库的演化模式、提交变更和动态代码转换中学习,以理解真实世界的软件开发流程。
  • 双重专业化路径:后训练被分为两条专门化路径 ——Thinking 型(采用以推理为驱动的强化学习,擅长复杂问题求解)和 Instruct 型(为通用编码助手与指令遵循优化)。
  • 高效架构:IQuest-Coder-V1-Loop 变体引入循环机制,优化模型容量与部署开销之间的权衡。
  • 原生长上下文:所有模型原生支持最多 128K Token 的上下文,无需额外的扩展技术。

限制

  • 推理与效率的权衡:Thinking 型模型具备更强的推理能力,但通常生成较长的响应;Instruct 型模型在处理简单任务时更加高效。
  • 代码执行:模型可以生成代码,但不会执行代码;务必在沙箱环境中验证输出。
  • 领域特异性:尽管模型在多样化代码库上训练,但在高度专业化或专有框架上的表现可能有所不同。
  • 事实性:模型可能生成看似合理但不正确的代码;对关键实现进行彻底验证。

Source: 九坤创始团队成立至知创新研究院 开源模型发布_网易科技


📌 转载信息
原作者:
BunnHack
转载时间:
2026/1/1 15:26:22

号称端侧可部署
混元翻译模型 1.5 版本包含一个 18 亿参数的翻译模型 HY-MT1.5-1.8B 和一个 70 亿参数的翻译模型 HY-MT1.5-7B。两个模型均专注于支持 33 种语言之间的互译,并融合了 5 种民族语言及方言变体。其中,HY-MT1.5-7B 是我们在 WMT25 夺冠模型基础上的升级版本,针对解释性翻译和混合语言场景进行了优化,并新增了术语干预、上下文翻译和格式化翻译功能。HY-MT1.5-1.8B 的参数量不到 HY-MT1.5-7B 的三分之一,却实现了与大模型相当的翻译性能,在速度和质量上达到高度平衡。经过量化后,1.8B 模型可部署于边缘设备,支持实时翻译场景,具备广泛适用性。

核心特性与优势

  • HY-MT1.5-1.8B 在同规模模型中达到业界领先水平,超越大多数商业翻译 API。
  • HY-MT1.5-1.8B 支持在边缘设备部署及实时翻译场景,应用范围广泛。
  • HY-MT1.5-7B 相较于 9 月开源的版本,在带注释和混合语言场景下进行了优化。
  • 两个模型均支持术语干预、上下文翻译和格式化翻译。

📌 转载信息
转载时间:
2025/12/30 16:10:03

报告摘要

2025年11月24日,人工智能领域在开源社区和企业应用层面均展现出强劲活力。小米发布了业界首个开源的自动驾驶与具身智能融合大模型MiMo-Embodied,Sber也开源了包括视频生成在内的一系列新模型。学术界持续探索AI Agent、多模态及模型可信赖性等前沿方向。企业动态方面,三星与英伟达宣布合作共建AI巨型工厂,预示着AI将深度赋能智能制造。同时,AI在网络安全、音乐授权等领域的应用也取得了新进展。

一、模型发布与产品更新 (Model Releases & Product Updates)

  1. 小米发布MiMo-Embodied开源模型
    小米公司发布了业界首个开源的视觉-语言基础模型 MiMo-Embodied。该模型旨在无缝集成自动驾驶和具身智能(Embodied AI)任务,在任务规划、可供性预测和空间理解方面表现出色,为机器人和智能汽车的协同发展提供了新的技术路径。(来自newsbytesapp.com)
  2. Sber开源一系列生成式AI模型
    俄罗斯联邦储蓄银行(Sber)发布并开源了多个AI模型,包括:

    • Kandinsky 5.0系列:包含Video Pro、Video Lite和Image Lite,原生支持俄语提示,并能稳健生成含西里尔字母的图像和视频。
    • K-VAE 1.0:一个高性能的开源图像/视频编解码器模型,对训练视觉生成模型至关重要。
    • GigaChat Ultra Preview / Lightning:基于混合专家(MoE)架构的新模型,专为俄语任务优化。(来自newsbytesapp.com)

二、精选AI论文 (New Papers)

arXiv在过去24小时内更新了多篇值得关注的论文,主要集中在多智能体系统、联邦学习和AI可信赖性等领域:

  • arXiv:2511.16205 - ChemLabs on ChemO: A Multi-Agent System for Multimodal Reasoning on IChO 2025: 介绍了一个用于化学奥林匹克竞赛(IChO)多模态推理的多智能体系统,展示了AI在复杂科学推理任务中的潜力。(来自arxiv.org)
  • arXiv:2511.16423 - TOFA: Training-Free One-Shot Federated Adaptation for Vision-Language Models: 提出了一种名为TOFA的免训练、一次性联邦自适应框架,用于视觉-语言模型,旨在解决联邦学习中的数据异构性和通信效率问题。(来自arxiv.org)
  • arXiv:2511.16402 - Trustworthy AI in the Agentic Lakehouse: from Concurrency to Governance: 探讨了在Agentic Lakehouse架构中实现可信赖AI的挑战,从并发性到治理提出了一个框架,对构建可靠的企业级AI系统具有指导意义。(来自arxiv.org)

三、热门开源项目 (Open-Source Projects)

  1. google / adk-go
    谷歌为Go语言开发者推出的AI Agent开发工具包(ADK)继续在GitHub上保持高热度。它提供了一个代码优先的开源工具集,用于构建、评估和部署复杂的AI智能体,持续吸引着社区的关注。(来自github.com)
  2. microsoft / call-center-ai
    微软开源的AI呼叫中心项目热度不减,该项目允许开发者通过API调用或直接拨打电话号码与AI Agent进行通话,为构建自动化客服、语音助手等应用提供了基础框架。(来自github.com)
  3. yeongpin / cursor-free-vip
    一个旨在免费使用Cursor AI编辑器Pro功能的工具登上趋势榜。该项目通过重置机器ID来绕过付费限制,虽然这反映了社区对强大AI编程工具的渴望,但也引发了关于软件许可和道德使用的讨论。(来自github.com)

四、重大科技新闻与公告 (Major Tech News)

  1. 三星与NVIDIA合作共建AI巨型工厂
    三星电子宣布与NVIDIA深化合作,将通过建设新的“AI巨型工厂”(AI Megafactory)来引领全球智能制造的转型。此举旨在将AI技术深度整合到生产流程中,提升效率和创新能力。(来自samsung.com)
  2. Anthropic挫败首例AI驱动的大规模网络间谍活动
    AI安全公司Anthropic宣布,其协助识别并挫败了首个主要由AI智能体大规模策划的网络间谍攻击。该攻击在很大程度上无需人类干预,凸显了AI在网络攻防两端日益增长的重要性。(来自apnews.com)
  3. OpenAI招募Intel AI高管
    OpenAI招募了Intel公司的首席技术与人工智能官Sachin Katti。他将负责领导设计和构建实现通用人工智能(AGI)所需的庞大计算基础设施,显示出OpenAI在硬件和基础设施层面的战略布局正在加速。(来自technologymagazine.com)
  4. 索尼、华纳等与AI音乐初创公司签署授权协议
    索尼、华纳和环球三大唱片公司与AI音乐初创公司Klay签署了授权协议。这一里程碑事件为AI生成音乐的合法化和商业化铺平了道路,可能将重塑音乐产业的创作和分发模式。(来自technologymagazine.com)

https://track.linso.ai/zh/execution/cmicgehwr03cwl694l1nkc212

《MiniMax M2,1024节日给所有开发者的礼物》
全球Top5,超越Claude Opus 4.1,仅次于Sonnet 4.5,开源模型SOTA。
转为Coding & Agentic 设计,开源SOTA,智能程度高,延迟与成本低。我们认为是agent产品的最佳选择之一,是Claude Code中最适合的平替

很骄傲参与了模型的研发,这是我们给所有开发者的礼物。
MiniMax Agent也即将在国内上线

体验方式:获取API Key, https://platform.minimaxi.com/login

使用模型名称:MiniMax-M2-Preview
填写问卷抢先体验:
https://vrfi1sk8a0.feishu.cn/share/base/form/shrcnGDzwrAbr18zGwh6YA5oI9b?auth_token=U7CK1RF-aafke4bb-13f9-4ff4-b0b4-660db5554b87-NN5W4

API: Anthropic API 兼容 - MiniMax API Docs

Claude Code: https://platform.minimaxi.com/docs/guides/text-ai-coding-tools
[bsmark]

MiniMax M2,1024节日给所有开发者的礼物 全球Top5,… http://xhslink.com/o/5lJIWdLFK9r
复制后打开【小红书】查看笔记!
[/bsmark]

MiniMax M2开启体验,研发负责人称「全球Top5,超越Claude Opus 4.1,仅次于Sonnet 4.5,开源模型SOTA」
MiniMax M2开启体验,研发负责人称「全球Top5,超越Claude Opus 4.1,仅次于Sonnet 4.5,开源模型SOTA」