标签 NVIDIA NIM 下的文章

去 nvidia 官网注册:

一、从官网进行获取 api-key

起手先注册账户拿 Key

然后主要是我不用 ccr,所以干脆搓个好了
用 ccr 就可以直接用。

配置文件 json.son

{
  "nvidia_url": "https://integrate.api.nvidia.com/v1/chat/completions",
  "nvidia_key": "nvapi-api-key"
}

直接运行,监听端口 3001

glm 4.7 的配法:

export ANTHROPIC_BASE_URL=http://localhost:3001
export ANTHROPIC_AUTH_TOKEN=nvapi-api-key
export ANTHROPIC_DEFAULT_HAIKU_MODEL=z-ai/glm4.7
export ANTHROPIC_DEFAULT_SONNET_MODEL=z-ai/glm4.7
export ANTHROPIC_DEFAULT_OPUS_MODEL=z-ai/glm4.7

claude

minimax 2.1 的配法:

export ANTHROPIC_BASE_URL=http://localhost:3001
export ANTHROPIC_AUTH_TOKEN=nvapi-api-key
export ANTHROPIC_DEFAULT_HAIKU_MODEL=minimaxai/minimax-m2.1
export ANTHROPIC_DEFAULT_SONNET_MODEL=minimaxai/minimax-m2.1
export ANTHROPIC_DEFAULT_OPUS_MODEL=minimaxai/minimax-m2.1

claude

📌 转载信息
原作者:
defunct9
转载时间:
2026/1/20 11:12:05

最近发现英伟达的 NIM(NVIDIA Inference Microservices)平台上,竟然可以免费调用 GLM-4.7Minimax-M2.1 这两个重磅模型。
重点是:不需要你有 4090,也不需要复杂的部署,只需要一个 API Key。
保姆级教程:
如何免费获取 Key 整个过程非常简单,大概只需要 3 分钟。
第一步:注册与登录直接访问 NVIDIA NIM 的集成主页:
https://build.nvidia.com/explore/discover 如果你没有英伟达账号,需要注册一个。建议使用邮箱注册


第二步:手机号验证(关键)
这是很多人卡住的地方。注册成功后,为了防止滥用,英伟达要求验证手机号。** 亲测:中国大陆的 +86 手机号是可以完美支持的。** 在验证页面选择 “China”,输入你的手机号,接收验证码即可。验证通过后,你就拥有了免费调用 API 的权限。
第三步:获取 API Key
登录成功后,在模型列表中随便点开一个模型(比如 DeepSeek-R1 或 Llama-3)。点击页面右上角的 “Get API Key” 获取密钥, 点击 “View Code” 查看请求示例。系统会为你生成一个以 nvapi- 开头的密钥。请务必保存好这个 Key。
前面文字内容摘自某公众号,下面是 VSCode 中的具体设置:
API Provider: OpenAI Compatible
Base URL: https://integrate.api.nvidia.com/v1/
OpenAI Compatible API Key: 填你自己申请的 API
Model ID :
GLM-4.7: z-ai/glm4.7
Minimax M2.1: minimaxai/minimax-m2.1

但是有限制:Your API Rate LimitUp to 40 rpm,也挺好

支持的模型


📌 转载信息
原作者:
user484
转载时间:
2026/1/16 12:25:17

https://linux.do/t/topic/1436106?u=yeahhe

英伟达的 api 无法用浏览器网页纯前端调用,所以我用 GLM 搭了一个中转 URL,解决 CORS 问题

https://p1609eqjhck0-d.space.z.ai/api/nim/v1/chat/completions

效果:



📌 转载信息
原作者:
yeahhe
转载时间:
2026/1/14 18:00:10

这里简单介绍一下,这个平台相当于 老黄用自家的显卡,部署了这些模型,然后统一用 OpenAPI 接口来给大家造福利(bushi),但是也确实好用,虽然高峰期的时候会卡,但白嫖是吧
话不多说,让我们 勒死 go

一、从官网进行获取 api-key

起手先注册账户拿钥匙

二、怎么进行使用

1. openapi 格式使用

baseurl: https://integrate.api.nvidia.com/v1/chat/completions
API Key: 就是第一步申请的 key
这里以沉浸式翻译插件,使用 Kimi2-thinking 举例。


添加自定义服务

注意,这里选择 open-api

配置如下:moonshotai/kimi-k2-thinking



然后手动调试一下是否可用


这里打 即可。

tip:如果不知道哪个模型,可以到官网中进行查看,方法如下:



📌 转载信息
转载时间:
2026/1/14 10:39:49

英伟达 NIM 开发者平台两个最近很火的国产模型 GLM-4.7 和 MiniMax M2.1,下面教大家手把手免费薅 API

1、打开 build.nvidia.com 点击右上角的 login,输入邮箱地址,点击 Next


2、自动跳转到创建 nvidia 账户页面,创建账户


3、邮箱会收到一个 6 位验证码,填进去。在 nvidia cloud 界面,随便输入一个用户名,进行下一步


4、页面右上角会出现一个 Verify,点击出现验证手机号界面,location 选择 china,phone number 填写 86 1xxxxx (自己手机号)。注意一定要先填手机号,再选择国家,要不然下方的 sendcode 按钮为灰色不可点击


5、验证通过后,获取 api key。登录后,点右上角头像 → API Keys。

找到 Generate API Key。给 Key 起个名字,过期时间可以调成 Never Expire,得到的 key 为 “nvapi-” 开头的字符串。复制保存!这个 Key,能调用 NIM 上所有免费模型。


6、API 地址,填入 https://integrate.api.nvidia.com/v1。

API 密钥,就是上面生成的 API Key。

模型,推荐 z-ai/glm4.7、minimaxai/minimax-m2.1 和 moonshotai/kimi-k2-thinking


📌 转载信息
原作者:
user1881
转载时间:
2026/1/6 11:42:04

在别的地方看到的,不知道对你们有用吗

nvidia 免费开放了 GLM-4.7 和 minimax-m2.1 的 API

在 nvidia 注册账号生成 key

然后请求地址使用
integrate.api.nvidia.com/v1/chat/co.
直接开启免费模式


📌 转载信息
原作者:
qiaoba
转载时间:
2026/1/5 13:00:18