零成本接入 GLM-5.1!Modal 平台免费不限量 API 对接 Claude Code
周五下午赶重构任务,Claude Code 连续弹 刷 Twitter 看到 Modal 宣布一件事:把智谱 GLM-5.1 挂到自家 GPU 集群,免费开放 API 端点,只按 QPS 限速,Token 总量不封顶。半小时跑通 Claude Code 接入,就有了这篇笔记。 对重度用户就是天然的"主力卡 + 备胎卡"。 端点: Claude Code 走 Anthropic 协议,Modal 走 OpenAI 协议,中间需要一个协议转换网关。Modal 官方已经写好了:modal-jazz。 然后给 Claude Code 配环境变量: 重启终端跑一次 这俩本身就走 OpenAI 协议,不用网关中转,改配置文件就行: 参考仓库:modal-jazz/frontends/openclaw · modal-jazz/frontends/opencode 主力继续用 Claude Code 原厂,但被限流卡住时,Modal + GLM-5.1 + modal-jazz 是当前性价比最高的应急通道,五分钟配完,不限 Token,免费。 AI 编码工具用到生产级别的人都懂一个道理:永远给自己准备一条 B 路线。 本文为 JeecgBoot AI 专题研究系列文章。 <!-- 发布设置:置顶=是, 推荐=是, 发布时删除第一行大标题 -->JeecgBoot AI专题研究 | Modal 平台 GLM-5.1 免费不限 Token 接入 Claude Code
起因:Claude Code 限流太烦
429 Too Many Requests,Coding Plan 在高压场景下扛不住。一、为什么这对组合香
二、拿 Key(1 分钟)
Example usage 里的 baseUrl 和模型 IDhttps://api.us-west-2.modal.direct/v1/chat/completions
模型 ID:glm-5-endpoint三、接到 Claude Code
git clone https://github.com/modal-projects/modal-jazz.git
cd modal-jazz/frontends/claude
pip install -r requirements.txt
export MODAL_API_KEY="你的 key"
python app.py # 监听 127.0.0.1:8000export ANTHROPIC_BASE_URL="http://127.0.0.1:8000"
export ANTHROPIC_AUTH_TOKEN="任意字符串"
export ANTHROPIC_MODEL="glm-5-endpoint"claude,Modal 控制台能看到请求就是通了。更深的用法(MCP、tool use、cache_control)参考 Claude Code LLM Gateway 文档。四、OpenClaw / OpenCode
{
"llm_backend": {
"url": "https://api.us-west-2.modal.direct/v1",
"api_key": "你的 Modal Key",
"model": "glm-5-endpoint"
}
}五、两天用下来的几个体感
小结