标签 OpenRouter 下的文章

openrouter 有点 buggy 啊

作者: 纯情
时间: 2026-01-31
分类:
评论

我用 LobeChat + HodlAI 测试了我的几个 Agent ，感觉到用量明显不对；加上站长说了用的方案是「 new api + openrouter 」我就测试了下到底是什么导致的，然后发现 openrouter 相当草台班子啊

1) 对于 Claude 模型不返回 usage 信息

我第一个观察到的点是 LobeChat 右下角之前一直都有的统计信息没了；然后我自己请求了下 openrouter 的 API 发现对于 Claude 模型，用 /chat/completions 接口根本没有 usage 信息返回

2) 用 Claude Messages 接口返回的 usage 信息格式不对

那我试试 Claude 模型 + /messages 接口呢🤔 惊喜，usage 信息来了！

但为啥 LobeChat 还是不能正常展示呢…… 结果我一看，"cache_creation_input_tokens":null 是个什么鬼，官方是 0 啊！

题外话，这种问题 LobeChat 确实可以兼容下；但官方 API Reference 里明确写了这个类型是 number + 它在不存在时自己返回的是 0 ，openrouter 返回个 null 也确实不太合适

3) 大善人还是 bug

cache_creation_input_tokens 的语义其实是「本次创建缓存用了多少 token 」，Claude 会把这类 token 多收 25% 的费用

那它是 null…… 究竟缓存了吗？收了缓存钱了吗？

答案其实是…… 缓存了但并没收钱🤔 OpenRouter 把这笔费用自己承担了

4) 所以为啥感觉贵呢

首先，即使它缓存了，但后面的请求不一定用缓存 —— OpenRouter 的 Claude 上游是 4 个随机的（我感觉完全没有「请求亲和性」的设计），所以理论上只有 25% 的概率会利用到缓存

不过真正的问题是…… 还记得 bug 1 吗？在 HodlAI 中，newapi 并没有拿到 openrouter 的正确的用量信息，所以 newapi 只能自己计算 token 按照无缓存计费，那么综合考虑 Agent 的上下文叠加 + 缓存有 90% off ，所以感觉贵就有情可原了

题外话，那用 claude messages 格式接入 newapi 是不是就能正确计费了？答案是…… 并不能…… newapi 也未能正确解析 openrouter 返回的 usage —— 而 claude 官方的就没有任何问题 —— 二者只差了个 null 所以估计还是那个 null 引起的

5) 还有啥其它的吗

OpenRouter 的 Activity 页面就没有人用吗？简直就是个 bug 集合体！

日志出现有十分钟以上的延迟，基于时间的筛选完全不能正常工作，打开的详情页面那个 json 完全靠猜才能知道含义

Clawdbot / Moltbot AI 个人助手蹭热度尝鲜

作者: 纯情
时间: 2026-01-28
分类:
评论

本文介绍我对 Clawdbot / Moltbot AI 个人助手的尝鲜使用。有蹭热度嫌疑，喜干货者慎入 :)

最近大热的 Clawdbot(现改名为 Moltbot) 是一个人 AI 助手，主打个人 Self-Hosted 的 ai agent。可运行在您自己的设备上的 AI 助手。不管你在哪里，均可以通过国际上常用的 IM 聊天平台（WhatsApp/Telegram/Matrix 等等，但不包括 WeChat）通过聊天与 ai agent 进行互动。

Just another chatbot ?

如果你硬要我说点非市场炒作的人话，不要老打鸡血天天震撼和炸裂，回归朴素码农实用主义的话。那么问题的核心是：这所谓的 “新” 玩意，和之前的支持本地部署的，做点 hack 也可以互联网访问的 lobehub / librechat 甚至更久远的 open-webui 这类已经支持 MCP 工具的 LLM chat UI 有什么区别？

说实话，在我短短数小时的安装和使用时间里，我只能告诉大家一些基本概念和功能上的不同，也因了解时间有限，说得不对请纠正：

任务长期化、异步化。不再是一个聊天请求触发，然后在线等待响应的工作流程。
多任务并行化
IM 聊天平台作为主交换方式。这大大简化了部署和远程使用，只需要一个 IM 聊天平台的接入即可。对大众用户比要 Port Mapping 或 Tailscale 才能使用的门槛要低很多。异步任务的通知推送问题，多模态图像声音的输入输出问题，接入的便利性问题，一个方案同时解决了。
支持 Skills 等已经深入民心的 AI 定制设计模式。只要本地命令行能做的，Moltbot 也能做。

看完这些，你大概会联想起 Manus 或 OpenManus 。

安装

网上已经非常多安装手把手教程了。所以我不打算写教程了，这里只说说我使用的一些配置：

综合考虑到网络环境的难和付款的便利，我选择了 openrouter 以及 anthropic/claude-sonnet-4.5 模型。

配置文档：

https://docs.molt.bot/providers/openrouter

配置示例：

{
  env: { OPENROUTER_API_KEY: "sk-or-..." },
  agents: {
    defaults: {
      model: { primary: "openrouter/anthropic/claude-sonnet-4.5" }
    }
  }
}

注意，直接用 CN 的 source ip 是访问不了 openrouter 的 claude-sonnet-4.5 的，会 http status 403 : This model is not available in your region

是有点贵，不过先试试再找平替吧。

简单试用

这里只是简单试用一下 AI 助手对工具的智能调用能力。还不错。不过 UI 设计还是有待改进的。很工程师风的界面用户体验。不过这界面叫 Dashboard ，这个风格也说得过去吧。

计划

计划后面试试接入适合国情的 Matrix IM ，看看效果。例如，我收到 Prometheus 报警 Homelab 问题时，可以让 Moltbot 自动分析原因和自动修复。也可以接入语音 TTS/STT ，甚至图像识别等等。有进度也会分享分享。再见。

大模型榜单周报（2026/01/24）

作者: 纯情
时间: 2026-01-25
分类: 资讯
评论

1. 本周概览

本周大模型行业动态频发，美团更新了大规模推理模型LongCat-Flash-Thinking-2601，智谱开源轻量化模型GLM-4.7-Flash，MiniMax发布AI原生工作台。在榜单方面，OpenRouter模型调用量出现显著变化，Claude Opus 4.5调用量大幅下滑，而Claude Sonnet 4.5升至榜首，编程领域竞争激烈，各大公司继续在不同能力维度展开激烈角逐。

2. 重点关注事件

美团于1.15更新大规模推理模型LongCat-Flash-Thinking-2601，该模型拥有5600亿参数，基于创新的MoE架构构建，引入了重思考模式(Heavy Thinking Mode)，能够同时启动8路思考并最终总结出更全面、更可靠的结论
智谱于1.20开源30B混合思考模型GLM-4.7-Flash，激活3B参数，提供免费API，性能超越同量级模型，为轻量化部署提供新选择
MiniMax于1.20发布Agent 2.0（AI-native Workspace），实现本地云端一体，推出Expert Agents垂直专家系统，具备读文件、写脚本、制作PPT、跑定时任务等功能，定义AI原生工作台概念
DeepSeek新模型MODEL1于1.21曝光，代码显示采用全新架构，具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面，在内存优化上有多处创新
Anthropic于1.22开源全新「AI宪法」（Claude's Constitution），确立了当不同价值观发生冲突时的权衡顺序：「广泛安全」、「广泛道德」、「遵守Anthropic准则」、「真诚助人」
谷歌DeepMind于1.22发布D4RT（Dynamic 4D Reconstruction and Tracking），用于跨时空4D场景重建和跟踪，采用统一的编码器-解码器Transformer架构，在各类4D重建任务中均优于此前方法

3. 榜单变化

OpenRouter整体模型调用量方面，Claude Opus 4.5调用量大幅下滑35%至395B tokens，排名从第一暴跌至第六；Claude Sonnet 4.5升至榜首但增幅仅11%；免费模型MiMo-V2-Flash持续走强，占比增长18%至582B tokens，排名从第三升至第二；Gemini 2.5 Pro异军突起，调用量暴增300%至413B tokens，首次进入前十即位列第五；Grok 4.1 Fast增长13%至282B tokens；Gemini 2.5 Flash Lite调用量陷入停滞，零增长导致排名从第八跌至第十
OpenRouter模型市占率方面，Google模型份额跃升至26.0%，增幅达2.8个百分点，持续扩大领先优势；Anthropic份额大幅下滑4.7个百分点至16.7%，虽仍位居第二但与榜首差距明显拉大；OpenAI份额小幅回升0.6个百分点至13.1%；x-ai份额上升1.3个百分点至12.6%，但因增速不及OpenAI导致排名从第3降至第4；Mistral AI份额下降0.3个百分点至3.5%，被Qwen以0.9个百分点的增幅反超，双方排名发生易位
OpenRouter编程调用量方面，Claude Opus 4.5占比断崖式下跌，从20.6%骤降至10.6%，降幅达10个百分点，是两周内变化幅度最大的模型，排名从第2位跌至第3位；Grok Code Fast 1持续扩大领先优势，占比从21.6%小幅攀升至22.8%，增幅1.2个百分点，稳居市场第一；免费模型MiMo-V2-Flash异军突起，占比从2.8%飙升至5.5%，增幅2.7个百分点，排名从第8位跃升至第5位；Claude Sonnet 4.5占比显著增加，从7.7%升至14.1%，增幅6.4个百分点，排名从第4位升至第2位
编程能力榜单（Code Arena）：gemini-3-flash (thinking-minimal) 上榜，排名第8，超过GPT-5.2
图像编辑能力榜单（Text to Image Arena）：flux-2-flex分数追平nano-banana，二者排名易位
文生图能力榜单（Artificial Analysis Text to Image Leaderboard）：ImagineArt 1.5 Preview上榜，排名第10
GAIA榜单：Shawn Agent更新v3.1，排名第7，得分达89.37%

4. 排行榜

测评类型	第一名	第二名	第三名
模型调用量	Claude Sonnet 4.5	MiMo-V2-Flash(free)	Grok Code Fast 1
公司市占率	Google	Anthropic	OpenAI
编程模型调用量	Grok Code Fast 1	Claude Sonnet 4.5	Claude Opus 4.5

各公司按不同能力领域排名汇总

测评类型	领先公司
大语言模型 Text Arena	Google、xAI、Anthropic、百度、OpenAI、智谱、阿里巴巴、月之暗面
编程能力 Code Arena	Anthropic、OpenAI、Google、智谱、MiniMax
编程能力 LiveCodeBench	OpenAI、Anthropic、Google
代码工程任务能力 SWE-benchLite	基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统
图像编辑和生成能力 Image Edit Arena	OpenAI、Google、字节、Black Forest Labs、Reve
文生图能力 Text-to-Image Arena	OpenAI、Google、Black Forest Labs、腾讯
图像编辑和生成能力 Image Editing Leaderboard	OpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve
文生图能力 Text to Image Leaderboard	OpenAI、Google、Black Forest Labs、字节、ImagineArt
GPQA	OpenAI、Google、xAI、Anthropic、阿里巴巴
FrontierMath	OpenAI、Google、DeepSeek、月之暗面、Anthropic、xAI
Humanity's Last Exam	Google、OpenAI、Anthropic
GAIA	JoinAI、Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org、ShawnAgent、ZTE-AICloud、LR AILab等

关注我，第一时间掌握更多AI前沿资讯！

大香蕉图片生成 mcp，支持文生图，图生图

作者: 纯情
时间: 2026-01-08
分类: 网络
评论

vibe code 的产物，写着好玩的，目前仅测试过大香蕉，使用的是对话接口

如有问题，都是小克的锅

~~未来期望：增加并发，skill 后台异步~~

仓库地址：ishalumi/image-create-mcp: MCP server for AI image generation with multi-provider support (OpenAI DALL-E, Gemini, OpenRouter). Works with Claude Code, Cursor, Roo, and other AI coding tools.

📌 转载信息

来源：
https://linux.do/t/topic/1419787

原作者：
isha_Illminas

转载时间：
2026/1/8 17:58:58

发现一个好玩的东西，可以让 Claude code 多模型并行，GLM 4.7 , Minimax, openrouter, ccr 一起转

作者: 纯情
时间: 2026-01-05
分类: 网络
评论

多模态并行，有点意思

📌 转载信息

来源：
https://linux.do/t/topic/1407567

原作者：
defunct9

转载时间：
2026/1/5 16:18:27

Kiro 协议注册机 Done!

作者: 纯情
时间: 2026-01-03
分类: 网络
评论

没把我累疯，从今天早上 7 点半一直分析到刚刚，终于把 Kiro 协议注册机给 done 了

看到佬的帖子我想自己试试看

不过还是有点小毛病的，指纹生成有大问题，由于时间紧张我是混合了 BrowserForge 和我自己的垃圾指纹，勉强可以过 send otp, 但是会被极速封号，下周再完善一下全部改为 BrowserForge

还有个小问题就是 initizaloAUTH 返回的是个跳转链接，但是它是通过网页动态跳转的而不是 302 到 workflowHandle, 跳转先用 playwright 跳了（反正不是啥重要的，也没有指纹）下周再分析一下 main sso 的跳转逻辑

加密方面，twmic 的算法不难，然后密码那一点还有个加密

元旦收获好大，写了 OpenRouter,Groq,Ollama,Gumloop,ZAI,Qwen 的协议注册机 (Aliyun Captcha 我给他旁路了，100% solve 滑块，类似 turnstile solver)

Cerebras 和 Zencoder 只能浏览器了，recaptcha score 达不到我准备自己写一个本地的 V2 解决器

📌 转载信息

来源：
https://linux.do/t/topic/1399913

转载时间：
2026/1/3 15:02:46