标签 OpenRouter 下的文章

我用 LobeChat + HodlAI 测试了我的几个 Agent ,感觉到用量明显不对;加上站长说了用的方案是「 new api + openrouter 」我就测试了下到底是什么导致的,然后发现 openrouter 相当草台班子啊

1) 对于 Claude 模型不返回 usage 信息

我第一个观察到的点是 LobeChat 右下角之前一直都有的统计信息没了;然后我自己请求了下 openrouter 的 API 发现对于 Claude 模型,用 /chat/completions 接口根本没有 usage 信息返回

2) 用 Claude Messages 接口返回的 usage 信息格式不对

那我试试 Claude 模型 + /messages 接口呢🤔 惊喜,usage 信息来了!

但为啥 LobeChat 还是不能正常展示呢…… 结果我一看,"cache_creation_input_tokens":null 是个什么鬼,官方是 0 啊!

题外话,这种问题 LobeChat 确实可以兼容下;但官方 API Reference 里明确写了这个类型是 number + 它在不存在时自己返回的是 0 ,openrouter 返回个 null 也确实不太合适

3) 大善人还是 bug

cache_creation_input_tokens 的语义其实是「本次创建缓存用了多少 token 」,Claude 会把这类 token 多收 25% 的费用

那它是 null…… 究竟缓存了吗?收了缓存钱了吗?

答案其实是…… 缓存了但并没收钱🤔 OpenRouter 把这笔费用自己承担了

4) 所以为啥感觉贵呢

首先,即使它缓存了,但后面的请求不一定用缓存 —— OpenRouter 的 Claude 上游是 4 个随机的(我感觉完全没有「请求亲和性」的设计),所以理论上只有 25% 的概率会利用到缓存

不过真正的问题是…… 还记得 bug 1 吗?在 HodlAI 中,newapi 并没有拿到 openrouter 的正确的用量信息,所以 newapi 只能自己计算 token 按照无缓存计费,那么综合考虑 Agent 的上下文叠加 + 缓存有 90% off ,所以感觉贵就有情可原了

题外话,那用 claude messages 格式接入 newapi 是不是就能正确计费了?答案是…… 并不能…… newapi 也未能正确解析 openrouter 返回的 usage —— 而 claude 官方的就没有任何问题 —— 二者只差了个 null 所以估计还是那个 null 引起的

5) 还有啥其它的吗

OpenRouter 的 Activity 页面就没有人用吗?简直就是个 bug 集合体!

日志出现有十分钟以上的延迟,基于时间的筛选完全不能正常工作,打开的详情页面那个 json 完全靠猜才能知道含义

本文介绍我对 Clawdbot / Moltbot AI 个人助手的尝鲜使用。有蹭热度嫌疑,喜干货者慎入 :)

最近大热的 Clawdbot(现改名为 Moltbot) 是一个人 AI 助手,主打个人 Self-Hosted 的 ai agent。可运行在您自己的设备上的 AI 助手。不管你在哪里,均可以通过国际上常用的 IM 聊天平台(WhatsApp/Telegram/Matrix 等等,但不包括 WeChat)通过聊天与 ai agent 进行互动。

Just another chatbot ?

如果你硬要我说点非市场炒作的人话,不要老打鸡血天天震撼和炸裂,回归朴素码农实用主义的话。那么问题的核心是:这所谓的 “新” 玩意,和之前的支持本地部署的,做点 hack 也可以互联网访问的 lobehub / librechat 甚至更久远的 open-webui 这类已经支持 MCP 工具 的 LLM chat UI 有什么区别?

说实话,在我短短数小时的安装和使用时间里,我只能告诉大家一些基本概念和功能上的不同,也因了解时间有限,说得不对请纠正:

  • 任务长期化、异步化。不再是一个聊天请求触发,然后在线等待响应的工作流程。
  • 多任务并行化
  • IM 聊天平台 作为主交换方式。 这大大简化了部署和远程使用,只需要一个 IM 聊天平台的接入即可。对大众用户比要 Port Mapping 或 Tailscale 才能使用的门槛要低很多。异步任务的通知推送问题,多模态图像声音的输入输出问题,接入的便利性问题,一个方案同时解决了。
  • 支持 Skills 等已经深入民心的 AI 定制设计模式。只要本地命令行能做的,Moltbot 也能做。

看完这些,你大概会联想起 ManusOpenManus

安装

网上已经非常多安装手把手教程了。所以我不打算写教程了,这里只说说我使用的一些配置:

综合考虑到网络环境的难和付款的便利,我选择了 openrouter 以及 anthropic/claude-sonnet-4.5 模型 。

配置文档:

https://docs.molt.bot/providers/openrouter

配置示例:

{
  env: { OPENROUTER_API_KEY: "sk-or-..." },
  agents: {
    defaults: {
      model: { primary: "openrouter/anthropic/claude-sonnet-4.5" }
    }
  }
}

注意,直接用 CN 的 source ip 是访问不了 openrouter 的 claude-sonnet-4.5 的,会 http status 403 : This model is not available in your region

是有点贵,不过先试试再找平替吧。

简单试用

image.png

这里只是简单试用一下 AI 助手对工具的智能调用能力。还不错。不过 UI 设计还是有待改进的。很工程师风的界面用户体验。不过这界面叫 Dashboard ,这个风格也说得过去吧。

计划

计划后面试试接入适合国情的 Matrix IM ,看看效果。例如,我收到 Prometheus 报警 Homelab 问题时,可以让 Moltbot 自动分析原因和自动修复。也可以接入语音 TTS/STT ,甚至图像识别等等。有进度也会分享分享。再见。

1. 本周概览

本周大模型行业动态频发,美团更新了大规模推理模型LongCat-Flash-Thinking-2601,智谱开源轻量化模型GLM-4.7-Flash,MiniMax发布AI原生工作台。在榜单方面,OpenRouter模型调用量出现显著变化,Claude Opus 4.5调用量大幅下滑,而Claude Sonnet 4.5升至榜首,编程领域竞争激烈,各大公司继续在不同能力维度展开激烈角逐。

2. 重点关注事件

  • 美团于1.15更新大规模推理模型LongCat-Flash-Thinking-2601,该模型拥有5600亿参数,基于创新的MoE架构构建,引入了重思考模式(Heavy Thinking Mode),能够同时启动8路思考并最终总结出更全面、更可靠的结论
  • 智谱于1.20开源30B混合思考模型GLM-4.7-Flash,激活3B参数,提供免费API,性能超越同量级模型,为轻量化部署提供新选择
  • MiniMax于1.20发布Agent 2.0(AI-native Workspace),实现本地云端一体,推出Expert Agents垂直专家系统,具备读文件、写脚本、制作PPT、跑定时任务等功能,定义AI原生工作台概念
  • DeepSeek新模型MODEL1于1.21曝光,代码显示采用全新架构,具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面,在内存优化上有多处创新
  • Anthropic于1.22开源全新「AI宪法」(Claude's Constitution),确立了当不同价值观发生冲突时的权衡顺序:「广泛安全」、「广泛道德」、「遵守Anthropic准则」、「真诚助人」
  • 谷歌DeepMind于1.22发布D4RT(Dynamic 4D Reconstruction and Tracking),用于跨时空4D场景重建和跟踪,采用统一的编码器-解码器Transformer架构,在各类4D重建任务中均优于此前方法

3. 榜单变化

  • OpenRouter整体模型调用量方面,Claude Opus 4.5调用量大幅下滑35%至395B tokens,排名从第一暴跌至第六;Claude Sonnet 4.5升至榜首但增幅仅11%;免费模型MiMo-V2-Flash持续走强,占比增长18%至582B tokens,排名从第三升至第二;Gemini 2.5 Pro异军突起,调用量暴增300%至413B tokens,首次进入前十即位列第五;Grok 4.1 Fast增长13%至282B tokens;Gemini 2.5 Flash Lite调用量陷入停滞,零增长导致排名从第八跌至第十
  • OpenRouter模型市占率方面,Google模型份额跃升至26.0%,增幅达2.8个百分点,持续扩大领先优势;Anthropic份额大幅下滑4.7个百分点至16.7%,虽仍位居第二但与榜首差距明显拉大;OpenAI份额小幅回升0.6个百分点至13.1%;x-ai份额上升1.3个百分点至12.6%,但因增速不及OpenAI导致排名从第3降至第4;Mistral AI份额下降0.3个百分点至3.5%,被Qwen以0.9个百分点的增幅反超,双方排名发生易位
  • OpenRouter编程调用量方面,Claude Opus 4.5占比断崖式下跌,从20.6%骤降至10.6%,降幅达10个百分点,是两周内变化幅度最大的模型,排名从第2位跌至第3位;Grok Code Fast 1持续扩大领先优势,占比从21.6%小幅攀升至22.8%,增幅1.2个百分点,稳居市场第一;免费模型MiMo-V2-Flash异军突起,占比从2.8%飙升至5.5%,增幅2.7个百分点,排名从第8位跃升至第5位;Claude Sonnet 4.5占比显著增加,从7.7%升至14.1%,增幅6.4个百分点,排名从第4位升至第2位
  • 编程能力榜单(Code Arena):gemini-3-flash (thinking-minimal) 上榜,排名第8,超过GPT-5.2
  • 图像编辑能力榜单(Text to Image Arena):flux-2-flex分数追平nano-banana,二者排名易位
  • 文生图能力榜单(Artificial Analysis Text to Image Leaderboard):ImagineArt 1.5 Preview上榜,排名第10
  • GAIA榜单:Shawn Agent更新v3.1,排名第7,得分达89.37%

4. 排行榜

测评类型第一名第二名第三名
模型调用量Claude Sonnet 4.5MiMo-V2-Flash(free)Grok Code Fast 1
公司市占率GoogleAnthropicOpenAI
编程模型调用量Grok Code Fast 1Claude Sonnet 4.5Claude Opus 4.5

各公司按不同能力领域排名汇总

测评类型领先公司
大语言模型 Text ArenaGoogle、xAI、Anthropic、百度、OpenAI、智谱、阿里巴巴、月之暗面
编程能力 Code ArenaAnthropic、OpenAI、Google、智谱、MiniMax
编程能力 LiveCodeBenchOpenAI、Anthropic、Google
代码工程任务能力 SWE-benchLite基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统
图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Black Forest Labs、Reve
文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯
图像编辑和生成能力 Image Editing LeaderboardOpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve
文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节、ImagineArt
GPQAOpenAI、Google、xAI、Anthropic、阿里巴巴
FrontierMathOpenAI、Google、DeepSeek、月之暗面、Anthropic、xAI
Humanity's Last ExamGoogle、OpenAI、Anthropic
GAIAJoinAI、Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org、ShawnAgent、ZTE-AICloud、LR AILab等

关注我,第一时间掌握更多AI前沿资讯!

vibe code 的产物,写着好玩的,目前仅测试过大香蕉,使用的是对话接口

如有问题,都是小克的锅

未来期望:增加并发,skill 后台异步

仓库地址:ishalumi/image-create-mcp: MCP server for AI image generation with multi-provider support (OpenAI DALL-E, Gemini, OpenRouter). Works with Claude Code, Cursor, Roo, and other AI coding tools.


📌 转载信息
原作者:
isha_Illminas
转载时间:
2026/1/8 17:58:58

多模态并行,有点意思


📌 转载信息
原作者:
defunct9
转载时间:
2026/1/5 16:18:27

没把我累疯,从今天早上 7 点半一直分析到刚刚,终于把 Kiro 协议注册机给 done 了

看到 佬的帖子 我想自己试试看

不过还是有点小毛病的,指纹生成有大问题,由于时间紧张我是混合了 BrowserForge 和我自己的垃圾指纹,勉强可以过 send otp, 但是会被极速封号,下周再完善一下全部改为 BrowserForge

还有个小问题就是 initizaloAUTH 返回的是个跳转链接,但是它是通过网页动态跳转的而不是 302 到 workflowHandle, 跳转先用 playwright 跳了(反正不是啥重要的,也没有指纹)下周再分析一下 main sso 的跳转逻辑

加密方面,twmic 的算法不难,然后密码那一点还有个加密

元旦收获好大,写了 OpenRouter,Groq,Ollama,Gumloop,ZAI,Qwen 的协议注册机 (Aliyun Captcha 我给他旁路了,100% solve 滑块,类似 turnstile solver)

Cerebras 和 Zencoder 只能浏览器了,recaptcha score 达不到 我准备自己写一个本地的 V2 解决器


📌 转载信息
转载时间:
2026/1/3 15:02:46