标签 GLM-4.7-Flash 下的文章

1. 本周概览

本周大模型行业动态频发，美团更新了大规模推理模型LongCat-Flash-Thinking-2601，智谱开源轻量化模型GLM-4.7-Flash，MiniMax发布AI原生工作台。在榜单方面，OpenRouter模型调用量出现显著变化，Claude Opus 4.5调用量大幅下滑，而Claude Sonnet 4.5升至榜首，编程领域竞争激烈，各大公司继续在不同能力维度展开激烈角逐。

2. 重点关注事件

美团于1.15更新大规模推理模型LongCat-Flash-Thinking-2601，该模型拥有5600亿参数，基于创新的MoE架构构建，引入了重思考模式(Heavy Thinking Mode)，能够同时启动8路思考并最终总结出更全面、更可靠的结论
智谱于1.20开源30B混合思考模型GLM-4.7-Flash，激活3B参数，提供免费API，性能超越同量级模型，为轻量化部署提供新选择
MiniMax于1.20发布Agent 2.0（AI-native Workspace），实现本地云端一体，推出Expert Agents垂直专家系统，具备读文件、写脚本、制作PPT、跑定时任务等功能，定义AI原生工作台概念
DeepSeek新模型MODEL1于1.21曝光，代码显示采用全新架构，具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面，在内存优化上有多处创新
Anthropic于1.22开源全新「AI宪法」（Claude's Constitution），确立了当不同价值观发生冲突时的权衡顺序：「广泛安全」、「广泛道德」、「遵守Anthropic准则」、「真诚助人」
谷歌DeepMind于1.22发布D4RT（Dynamic 4D Reconstruction and Tracking），用于跨时空4D场景重建和跟踪，采用统一的编码器-解码器Transformer架构，在各类4D重建任务中均优于此前方法

3. 榜单变化

OpenRouter整体模型调用量方面，Claude Opus 4.5调用量大幅下滑35%至395B tokens，排名从第一暴跌至第六；Claude Sonnet 4.5升至榜首但增幅仅11%；免费模型MiMo-V2-Flash持续走强，占比增长18%至582B tokens，排名从第三升至第二；Gemini 2.5 Pro异军突起，调用量暴增300%至413B tokens，首次进入前十即位列第五；Grok 4.1 Fast增长13%至282B tokens；Gemini 2.5 Flash Lite调用量陷入停滞，零增长导致排名从第八跌至第十
OpenRouter模型市占率方面，Google模型份额跃升至26.0%，增幅达2.8个百分点，持续扩大领先优势；Anthropic份额大幅下滑4.7个百分点至16.7%，虽仍位居第二但与榜首差距明显拉大；OpenAI份额小幅回升0.6个百分点至13.1%；x-ai份额上升1.3个百分点至12.6%，但因增速不及OpenAI导致排名从第3降至第4；Mistral AI份额下降0.3个百分点至3.5%，被Qwen以0.9个百分点的增幅反超，双方排名发生易位
OpenRouter编程调用量方面，Claude Opus 4.5占比断崖式下跌，从20.6%骤降至10.6%，降幅达10个百分点，是两周内变化幅度最大的模型，排名从第2位跌至第3位；Grok Code Fast 1持续扩大领先优势，占比从21.6%小幅攀升至22.8%，增幅1.2个百分点，稳居市场第一；免费模型MiMo-V2-Flash异军突起，占比从2.8%飙升至5.5%，增幅2.7个百分点，排名从第8位跃升至第5位；Claude Sonnet 4.5占比显著增加，从7.7%升至14.1%，增幅6.4个百分点，排名从第4位升至第2位
编程能力榜单（Code Arena）：gemini-3-flash (thinking-minimal) 上榜，排名第8，超过GPT-5.2
图像编辑能力榜单（Text to Image Arena）：flux-2-flex分数追平nano-banana，二者排名易位
文生图能力榜单（Artificial Analysis Text to Image Leaderboard）：ImagineArt 1.5 Preview上榜，排名第10
GAIA榜单：Shawn Agent更新v3.1，排名第7，得分达89.37%

4. 排行榜

测评类型	第一名	第二名	第三名
模型调用量	Claude Sonnet 4.5	MiMo-V2-Flash(free)	Grok Code Fast 1
公司市占率	Google	Anthropic	OpenAI
编程模型调用量	Grok Code Fast 1	Claude Sonnet 4.5	Claude Opus 4.5

各公司按不同能力领域排名汇总

测评类型	领先公司
大语言模型 Text Arena	Google、xAI、Anthropic、百度、OpenAI、智谱、阿里巴巴、月之暗面
编程能力 Code Arena	Anthropic、OpenAI、Google、智谱、MiniMax
编程能力 LiveCodeBench	OpenAI、Anthropic、Google
代码工程任务能力 SWE-benchLite	基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统
图像编辑和生成能力 Image Edit Arena	OpenAI、Google、字节、Black Forest Labs、Reve
文生图能力 Text-to-Image Arena	OpenAI、Google、Black Forest Labs、腾讯
图像编辑和生成能力 Image Editing Leaderboard	OpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve
文生图能力 Text to Image Leaderboard	OpenAI、Google、Black Forest Labs、字节、ImagineArt
GPQA	OpenAI、Google、xAI、Anthropic、阿里巴巴
FrontierMath	OpenAI、Google、DeepSeek、月之暗面、Anthropic、xAI
Humanity's Last Exam	Google、OpenAI、Anthropic
GAIA	JoinAI、Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org、ShawnAgent、ZTE-AICloud、LR AILab等

关注我，第一时间掌握更多AI前沿资讯！

索尼宣布与 TCL 成立合资公司

1 月 20 日，索尼宣布与 TCL 电子签署意向备忘录，拟设立家庭娱乐合资公司。根据协议，TCL 将持有新公司 51% 股权，索尼持股 49%，该合资公司将全面承接索尼家庭娱乐业务，在全球范围内开展电视机及家庭音响产品的开发、设计、制造、销售、物流及客户服务；产品会继续沿用 Sony 与 BRAVIA 品牌。

索尼与 TCL 双方计划于 2026 年 3 月底前签署最终协议，新公司预计 2027 年 4 月开启正式运营。来源

Ayaneo 发布 Konkr Fit 掌机

1 月 20 日，Ayaneo 子品牌 Konkr 发布其首款 Windows 掌机 Konkr Fit。Konkr Fit 搭载 AMD Ryzen AI 9 HX 470 处理器，采用 Zen 5 架构与 RDNA 3.5 图形核心；屏幕由前代 Android 型号的 6 英寸升级至 7 英寸 OLED 面板；内置 80Wh 电池，容量规模高于 Legion Go 2（74Wh）及 Legion Go S（55.5Wh）；操控方案包含霍尔摇杆、可调节触发器及双背键；机身顶部设有双 USB-C 接口，背面采用大面积散热进气口与外露螺丝设计，提供复古灰及黄色两种配色。

目前该设备定价与发售日期尚未公布。来源

红魔发布红魔 11 Air 等多款新品

1 月 20 日，红魔正式发布红魔 11 Air 及其电竞生态新品。红魔 11 Air 搭载高通骁龙 8 至尊版处理器与红芯 R4 自研电竞芯片，配备 LPDDR5X ULTRA 内存及 UFS 4.1 闪存，采用 6.85 英寸 1.5K 屏下摄像头全面屏，支持 144Hz 刷新率、2500Hz 瞬时触控采样率；同时搭载 2592Hz 高频 PWM 调光及 DC 调光方案，内置 7000mAh 电池，支持 120W 快充，散热系统由 24000 转/分的主动风扇和 0.5mm 的 VC 面板组成，机身还集成了 520Hz 游戏肩键与 X 轴线性马达。

同场还发布了多款电竞生态新品，包括采用碳纤维机身、蓝宝石玻璃后盖及流金水冷散热系统的红魔 11 Pro+，搭载英伟达 RTX 5090 显卡、支持裸眼 3D 显示技术的红魔游戏本 16 Pro Golden Saga · 3D 探索版等。红魔 11 Air 售价 3699 元起，红魔 11 Pro+ Golden Saga 24GB+1TB 版售价 9899 元。

另有红魔电竞平板 3 Pro Golden Saga 预计 1 月底发售，定价尚未公布。来源

智谱 GLM-4.7-Flash 模型发布并开源

1 月 20 日，智谱正式发布并开源 GLM-4.7-Flash 混合思考模型。该模型总参数量为 30B，激活参数量为 3B，定位为兼顾性能与效率的轻量化部署方案，目前已在智谱开放平台 BigModel.cn 上线并提供免费调用。在 SWE-bench Verified 与 τ²-Bench 等主流基准测试中，该模型的综合表现超过了 gpt-oss-20b 及 Qwen3-30B-A3B-Thinking-2507，在同尺寸级别模型中取得了开源 SOTA 分数。

GLM-4.7-Flash 主要针对编程场景进行优化，涵盖前、后端开发任务，并适用于中文写作、翻译、长文本处理及情感角色扮演等通用领域。随着新版本的发布，上一代免费模型 GLM-4.5-Flash 定于 2026 年 1 月 30 日正式下线，届时所有相关 API 请求将自动路由至 GLM-4.7-Flash。此次迭代通过提升逻辑推理能力与优化参数规模，旨在为开发者提供更高密度的智能服务支持。来源

Netflix 上线直播实时投票功能

1 月 20 日，Netflix 正式上线直播内容实时交互投票功能。该功能随选秀节目 Star Search 首发，订阅用户可通过电视遥控器或移动端 App 参与多选投票或星制评分，支持全球规模的实时票数汇总与限时截止，可实现观众对直播叙事进程的直接干预。

Netflix 表示，该交互架构此前于 2025 年 8 月通过《David Chang 晚餐秀现场》完成技术验证，并于 TechCrunch Disrupt 2025 大会确认全量推广。来源

微软 Copilot 推出 Real Talk 与视频生成功能

1 月 20 日，微软 Copilot 推出 Real Talk 交互模式，该模式旨在提供类人化且更具互动性的对话体验，引入了不同等级的深度思考和写作风格选项，支持查看思考和推理路径，具备长上下文记忆能力，沟通过程中会参考过往对话和用户背景，并适时表现出好奇心或针对逻辑矛盾主动提出反驳。

此外，Copilot 也在 Android 移动端测试视频生成功能，允许用户生成最长 8 秒、包含音频的视频片段。目前该视频生成功能的底层模型未知且处于灰度推送阶段，暂无强制订阅要求。来源

索尼推出《失落星船：马拉松》限定游戏手柄

索尼于 1 月 19 日宣布配合 Bungie 工作室 3 月 5 日发行的《失落星船：马拉松》游戏，同步推出两款限定硬件：售价 84.99 美元的 DualSense 限量版手柄及售价 169.99 美元的 Pulse Elite 限量版耳机。

DualSense 限量版手柄在设计上深度融合了《失落星船：马拉松》的游戏世界观，Bungie 设计团队表示，其目标是打造一款仿佛直接从游戏世界中取出的「真实物件」，为呼应游戏独特的工业美学与环境架构，采用了大胆的图形设计与鲜明的色彩搭配。《失落星船：马拉松》限量版 Pulse Elite 耳机则延续了与手柄相同的设计语言。来源

看看就行的小道消息

消息源 LeicaRumors 于 1 月 19 日发布博文，称徕卡（Leica）计划于 2026 年 1 月 29 日发布首款 35mm 焦段的夜神（Noctilux）系列镜头 Noctilux-M 1.2/35 ASPH.，这也意味着该系列将首次推出 35mm 人文焦段；曝光的谍照显示，Noctilux-M 1.2/35 ASPH. 延续了徕卡经典的工业设计语言，镜身采用相对紧凑的铝制外壳，饰以标志性的黄色刻度读数，值得注意的是该镜头配备了固定式遮光罩，用户需通过旋转动作将其旋出使用。来源
1 月 20 日，三星在官网发布并随后撤回了 Bixby 的升级公告，根据该公告，新版 Bixby 将深度集成 Perplexity AI 以实现基于 Web 的自然语言实时问答与信息检索，同时引入新的设备代理架构，支持识别非特定指令意图并自动触发对应系统设置。新版助手将随 One UI 8.5 Beta 项目开启测试，并计划作为 Galaxy S26 系列手机的核心预装功能发布。来源

少数派的近期动态

我们正在优化并改进新的首页版式，如果你在使用过程中发现了任何问题或者有改进建议，请通过反馈表单告知我们。首页反馈收集

你可能错过的文章

> 下载少数派 2.0 客户端、关注少数派公众号，解锁全新阅读体验 📰

> 实用、好用的正版软件，少数派为你呈现 🚀