标签 GLM-4.7-Flash 下的文章

1. 本周概览

本周大模型行业动态频发,美团更新了大规模推理模型LongCat-Flash-Thinking-2601,智谱开源轻量化模型GLM-4.7-Flash,MiniMax发布AI原生工作台。在榜单方面,OpenRouter模型调用量出现显著变化,Claude Opus 4.5调用量大幅下滑,而Claude Sonnet 4.5升至榜首,编程领域竞争激烈,各大公司继续在不同能力维度展开激烈角逐。

2. 重点关注事件

  • 美团于1.15更新大规模推理模型LongCat-Flash-Thinking-2601,该模型拥有5600亿参数,基于创新的MoE架构构建,引入了重思考模式(Heavy Thinking Mode),能够同时启动8路思考并最终总结出更全面、更可靠的结论
  • 智谱于1.20开源30B混合思考模型GLM-4.7-Flash,激活3B参数,提供免费API,性能超越同量级模型,为轻量化部署提供新选择
  • MiniMax于1.20发布Agent 2.0(AI-native Workspace),实现本地云端一体,推出Expert Agents垂直专家系统,具备读文件、写脚本、制作PPT、跑定时任务等功能,定义AI原生工作台概念
  • DeepSeek新模型MODEL1于1.21曝光,代码显示采用全新架构,具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面,在内存优化上有多处创新
  • Anthropic于1.22开源全新「AI宪法」(Claude's Constitution),确立了当不同价值观发生冲突时的权衡顺序:「广泛安全」、「广泛道德」、「遵守Anthropic准则」、「真诚助人」
  • 谷歌DeepMind于1.22发布D4RT(Dynamic 4D Reconstruction and Tracking),用于跨时空4D场景重建和跟踪,采用统一的编码器-解码器Transformer架构,在各类4D重建任务中均优于此前方法

3. 榜单变化

  • OpenRouter整体模型调用量方面,Claude Opus 4.5调用量大幅下滑35%至395B tokens,排名从第一暴跌至第六;Claude Sonnet 4.5升至榜首但增幅仅11%;免费模型MiMo-V2-Flash持续走强,占比增长18%至582B tokens,排名从第三升至第二;Gemini 2.5 Pro异军突起,调用量暴增300%至413B tokens,首次进入前十即位列第五;Grok 4.1 Fast增长13%至282B tokens;Gemini 2.5 Flash Lite调用量陷入停滞,零增长导致排名从第八跌至第十
  • OpenRouter模型市占率方面,Google模型份额跃升至26.0%,增幅达2.8个百分点,持续扩大领先优势;Anthropic份额大幅下滑4.7个百分点至16.7%,虽仍位居第二但与榜首差距明显拉大;OpenAI份额小幅回升0.6个百分点至13.1%;x-ai份额上升1.3个百分点至12.6%,但因增速不及OpenAI导致排名从第3降至第4;Mistral AI份额下降0.3个百分点至3.5%,被Qwen以0.9个百分点的增幅反超,双方排名发生易位
  • OpenRouter编程调用量方面,Claude Opus 4.5占比断崖式下跌,从20.6%骤降至10.6%,降幅达10个百分点,是两周内变化幅度最大的模型,排名从第2位跌至第3位;Grok Code Fast 1持续扩大领先优势,占比从21.6%小幅攀升至22.8%,增幅1.2个百分点,稳居市场第一;免费模型MiMo-V2-Flash异军突起,占比从2.8%飙升至5.5%,增幅2.7个百分点,排名从第8位跃升至第5位;Claude Sonnet 4.5占比显著增加,从7.7%升至14.1%,增幅6.4个百分点,排名从第4位升至第2位
  • 编程能力榜单(Code Arena):gemini-3-flash (thinking-minimal) 上榜,排名第8,超过GPT-5.2
  • 图像编辑能力榜单(Text to Image Arena):flux-2-flex分数追平nano-banana,二者排名易位
  • 文生图能力榜单(Artificial Analysis Text to Image Leaderboard):ImagineArt 1.5 Preview上榜,排名第10
  • GAIA榜单:Shawn Agent更新v3.1,排名第7,得分达89.37%

4. 排行榜

测评类型第一名第二名第三名
模型调用量Claude Sonnet 4.5MiMo-V2-Flash(free)Grok Code Fast 1
公司市占率GoogleAnthropicOpenAI
编程模型调用量Grok Code Fast 1Claude Sonnet 4.5Claude Opus 4.5

各公司按不同能力领域排名汇总

测评类型领先公司
大语言模型 Text ArenaGoogle、xAI、Anthropic、百度、OpenAI、智谱、阿里巴巴、月之暗面
编程能力 Code ArenaAnthropic、OpenAI、Google、智谱、MiniMax
编程能力 LiveCodeBenchOpenAI、Anthropic、Google
代码工程任务能力 SWE-benchLite基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统
图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Black Forest Labs、Reve
文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯
图像编辑和生成能力 Image Editing LeaderboardOpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve
文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节、ImagineArt
GPQAOpenAI、Google、xAI、Anthropic、阿里巴巴
FrontierMathOpenAI、Google、DeepSeek、月之暗面、Anthropic、xAI
Humanity's Last ExamGoogle、OpenAI、Anthropic
GAIAJoinAI、Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org、ShawnAgent、ZTE-AICloud、LR AILab等

关注我,第一时间掌握更多AI前沿资讯!

索尼宣布与 TCL 成立合资公司

1 月 20 日,索尼宣布与 TCL 电子签署意向备忘录,拟设立家庭娱乐合资公司。根据协议,TCL 将持有新公司 51% 股权,索尼持股 49%,该合资公司将全面承接索尼家庭娱乐业务,在全球范围内开展电视机及家庭音响产品的开发、设计、制造、销售、物流及客户服务;产品会继续沿用 Sony 与 BRAVIA 品牌。

索尼与 TCL 双方计划于 2026 年 3 月底前签署最终协议,新公司预计 2027 年 4 月开启正式运营。来源


Ayaneo 发布 Konkr Fit 掌机

1 月 20 日,Ayaneo 子品牌 Konkr 发布其首款 Windows 掌机 Konkr Fit。Konkr Fit 搭载 AMD Ryzen AI 9 HX 470 处理器,采用 Zen 5 架构与 RDNA 3.5 图形核心;屏幕由前代 Android 型号的 6 英寸升级至 7 英寸 OLED 面板;内置 80Wh 电池,容量规模高于 Legion Go 2(74Wh)及 Legion Go S(55.5Wh);操控方案包含霍尔摇杆、可调节触发器及双背键;机身顶部设有双 USB-C 接口,背面采用大面积散热进气口与外露螺丝设计,提供复古灰及黄色两种配色。

目前该设备定价与发售日期尚未公布。来源


红魔发布红魔 11 Air 等多款新品

1 月 20 日,红魔正式发布红魔 11 Air 及其电竞生态新品。红魔 11 Air 搭载高通骁龙 8 至尊版处理器与红芯 R4 自研电竞芯片,配备 LPDDR5X ULTRA 内存及 UFS 4.1 闪存,采用 6.85 英寸 1.5K 屏下摄像头全面屏,支持 144Hz 刷新率、2500Hz 瞬时触控采样率;同时搭载 2592Hz 高频 PWM 调光及 DC 调光方案,内置 7000mAh 电池,支持 120W 快充,散热系统由 24000 转/分的主动风扇和 0.5mm 的 VC 面板组成,机身还集成了 520Hz 游戏肩键与 X 轴线性马达。

红魔 11 Air

同场还发布了多款电竞生态新品,包括采用碳纤维机身、蓝宝石玻璃后盖及流金水冷散热系统的红魔 11 Pro+,搭载英伟达 RTX 5090 显卡、支持裸眼 3D 显示技术的红魔游戏本 16 Pro Golden Saga · 3D 探索版等。红魔 11 Air 售价 3699 元起,红魔 11 Pro+ Golden Saga 24GB+1TB 版售价 9899 元。

红魔 11 Pro+

另有红魔电竞平板 3 Pro Golden Saga 预计 1 月底发售,定价尚未公布。来源


智谱 GLM-4.7-Flash 模型发布并开源

1 月 20 日,智谱正式发布并开源 GLM-4.7-Flash 混合思考模型。该模型总参数量为 30B,激活参数量为 3B,定位为兼顾性能与效率的轻量化部署方案,目前已在智谱开放平台 BigModel.cn 上线并提供免费调用。在 SWE-bench Verified 与 τ²-Bench 等主流基准测试中,该模型的综合表现超过了 gpt-oss-20b 及 Qwen3-30B-A3B-Thinking-2507,在同尺寸级别模型中取得了开源 SOTA 分数。

GLM-4.7-Flash 主要针对编程场景进行优化,涵盖前、后端开发任务,并适用于中文写作、翻译、长文本处理及情感角色扮演等通用领域。随着新版本的发布,上一代免费模型 GLM-4.5-Flash 定于 2026 年 1 月 30 日正式下线,届时所有相关 API 请求将自动路由至 GLM-4.7-Flash。此次迭代通过提升逻辑推理能力与优化参数规模,旨在为开发者提供更高密度的智能服务支持。来源


Netflix 上线直播实时投票功能

1 月 20 日,Netflix 正式上线直播内容实时交互投票功能。该功能随选秀节目 Star Search 首发,订阅用户可通过电视遥控器或移动端 App 参与多选投票或星制评分,支持全球规模的实时票数汇总与限时截止,可实现观众对直播叙事进程的直接干预。

Netflix 表示,该交互架构此前于 2025 年 8 月通过《David Chang 晚餐秀现场》完成技术验证,并于 TechCrunch Disrupt 2025 大会确认全量推广。来源


微软 Copilot 推出 Real Talk 与视频生成功能

1 月 20 日,微软 Copilot 推出 Real Talk 交互模式,该模式旨在提供类人化且更具互动性的对话体验,引入了不同等级的深度思考和写作风格选项,支持查看思考和推理路径,具备长上下文记忆能力,沟通过程中会参考过往对话和用户背景,并适时表现出好奇心或针对逻辑矛盾主动提出反驳。

此外,Copilot 也在 Android 移动端测试视频生成功能,允许用户生成最长 8 秒、包含音频的视频片段。目前该视频生成功能的底层模型未知且处于灰度推送阶段,暂无强制订阅要求。来源


索尼推出《失落星船:马拉松》限定游戏手柄

索尼于 1 月 19 日宣布配合 Bungie 工作室 3 月 5 日发行的《失落星船:马拉松》游戏,同步推出两款限定硬件:售价 84.99 美元的 DualSense 限量版手柄及售价 169.99 美元的 Pulse Elite 限量版耳机。

DualSense 限量版手柄在设计上深度融合了《失落星船:马拉松》的游戏世界观,Bungie 设计团队表示,其目标是打造一款仿佛直接从游戏世界中取出的「真实物件」,为呼应游戏独特的工业美学与环境架构,采用了大胆的图形设计与鲜明的色彩搭配。《失落星船:马拉松》限量版 Pulse Elite 耳机则延续了与手柄相同的设计语言。来源


看看就行的小道消息

  • 消息源 LeicaRumors 于 1 月 19 日发布博文,称徕卡(Leica)计划于 2026 年 1 月 29 日发布首款 35mm 焦段的夜神(Noctilux)系列镜头 Noctilux-M 1.2/35 ASPH.,这也意味着该系列将首次推出 35mm 人文焦段;曝光的谍照显示,Noctilux-M 1.2/35 ASPH. 延续了徕卡经典的工业设计语言,镜身采用相对紧凑的铝制外壳,饰以标志性的黄色刻度读数,值得注意的是该镜头配备了固定式遮光罩,用户需通过旋转动作将其旋出使用。来源
  • 1 月 20 日,三星在官网发布并随后撤回了 Bixby 的升级公告,根据该公告,新版 Bixby 将深度集成 Perplexity AI 以实现基于 Web 的自然语言实时问答与信息检索,同时引入新的设备代理架构,支持识别非特定指令意图并自动触发对应系统设置。新版助手将随 One UI 8.5 Beta 项目开启测试,并计划作为 Galaxy S26 系列手机的核心预装功能发布。来源


少数派的近期动态

我们正在优化并改进新的首页版式,如果你在使用过程中发现了任何问题或者有改进建议,请通过反馈表单告知我们。首页反馈收集


你可能错过的文章


> 下载 少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀

    【开源新王】GLM-4.7-Flash (30B-A3B MoE) 上线

    在 30B 这个 “黄金尺寸” 上,智谱交出了一份离谱的答卷。直接对标 Qwen3-30B-A3B,但在关键指标上实现了反超:

    1. 工程化落地强:SWE-bench 59.2 分。这意味着它不仅是写代码片段,而是真能处理复杂的工程 Issue。

    2. 逻辑推演:AIME 25 跑到 91.6,数学和复杂逻辑不再是小模型的短板。

    3. 长文本 & Agent:在 τ²-Bench 和 BrowseComp 表现优异,依然是构建 Agent 的一把好手。

    总结:如果你在寻找一个既能跑得动、又具备顶尖逻辑 / 代码能力的本地模型,这是目前的首选。

    下载地址https://huggingface.co/zai-org/GLM-4.7-Flash


    📌 转载信息
    转载时间:
    2026/1/20 10:05:37