标签 AI生图下的文章

麻麻再也不用担心我不会生图提示词啦

作者: 纯情
时间: 2026-01-20
分类: 网络
评论

1. 拿你喜欢的 ai 图，
我这里拿这位佬的现成的图打个样

(你也可以像我一样把这提示词做成 gem 或者 gpt 会更好用。)

把图上传到哈基米或者 chatgpt，输入以下提示词:

将此图像转换为 JSON 提示字符，包括尺寸和所有视觉细节

2, 拿到 json 后，就可以对 ai 提出要求，要修改的，随便你怎么发挥吧 (本文主要就是分享提取，下面的演示只是用法之一)
一般在上一步解析出来之后 ai 会友情提示

我比较直接我对 ai 提出的要求如下:

3. 复制 ai 按你要求修改后的 json，咱们直接新建对话直接粘贴，记得开启 "大香蕉" 或 "创建图片"

至此，艺术已成

over .

📌 转载信息

来源：
https://linux.do/t/topic/1488391

转载时间：
2026/1/20 10:52:26

LongCat 上线 AI 生图！精准高效，AI 创作不设限

作者: 纯情
时间: 2026-01-19
分类: 开源
评论

美团 LongCat 全新上线 AI 生图功能，该功能基于 LongCat 系列模型「LongCat-Image」打造而成。不仅在文生图任务中实现了“快、真、准” ：出图快速响应、达到摄影棚拍摄质感、中文渲染精准度高；更在图像编辑任务上做到了精准便捷，无需复杂指令，可以用自然语言对图像进行二次编辑。无论是追求高效出图的普通用户，还是需要精准落地创意的专业创作者，LongCat 都以 “轻量化模型 + 流畅体验” ，让 AI 生图真正成为人人可用的创作工具。

目前，AI 生图功能已在 LongCat APP 和 https://longcat.ai/ 同步上线，轻松解锁高效创作新方式。

LongCat · AI 生图「三大功能亮点」

亮点一：图像生成 + 编辑一体化，创意落地无断点

从 “文字生成图片” 到 “用嘴改图” 一步到位，帮你轻松拿捏专业创作：

简单提示词也能高效出图：基于深度优化语义理解能力，简单提示词也能生成效果高度契合画面、布局、氛围及内容，在保障质量的前提下大幅提升创作效率。
全场景编辑无断点：支持物体增删、风格迁移、视角转换、人像精修、文本修改等 15 类细分任务，无论是简单的背景替换，还是复杂的多轮复合指令，均能精准执行。
多轮编辑不丢质感：修改后画面和原图风格、光影保持一致，不会出现 “拼接感”，人像编辑保留面部特征，多轮编辑画面不跑偏。

prompt：头发颜色变成灰色，衣服颜色变成米色，面带微笑

prompt：拉远镜头，显示更多室内场景

prompt：将人物变为棕色的熊，保持相同的姿态

prompt：消除最左边的饮料

prompt：让猫闭上眼睛

prompt：变成真的老虎，在海边

prompt：在红色圈添加一个白色的钟表，绿色框添加黑色的手提包，黑色框添加一只白色的猫

亮点二：中文文字生成超能打，生僻字也不翻车

中文文字生成能力优异，生僻字生成也不在话下：

字符渲染优异：店铺牌匾、海报标题、书籍封面等场景的中文文字，无错字、漏字、字体扭曲，多行排版、段落文本均能精准渲染
生僻字高覆盖率：非常见字、异体字、书法字体（楷体、行书）准确率较高，适配传统文化、专业领域等特殊创作需求
智能排版：自动匹配场景调整文字大小、颜色、行距，如古风文案搭配书法字体，科技主题适配现代无衬线字体，无需手动调整

亮点三：快速生成摄影棚级质感画面

快速响应不等待：轻量化技术优化让单张高清图高效生成，效率较同类工具有一定提升，高频创作无需久候。
质感堪比棚拍实景：优化构图与光影美学，物体纹理、场景光影精准复刻真实世界，人物肢体、物体比例遵循物理规律，实现摄影棚拍质感。

强大功能背后的「技术底座」

LongCat-Image具备出色的跨语言图像编辑能力，通过共享 MM-DiT+Single-DiT 混合主干架构与VLM条件编码器，文生图与编辑能力相互辅助，继承文生图的出图质量并具备出色的指令遵循、一致性保持能力，在主流公开评测基准上达到第一梯队水平。文字生成专项能力上，覆盖全量通用规范汉字并在在商业海报、自然场景文字上都展现出极强的适用性。此外，通过精细化模型设计及多阶段训练策略优化，极大提升生成真实度、合理性并可支持消费级显卡高效推理。

文字生成基准测试

图像编辑基准测试性能比较

用 LongCat 记录你的「灵感瞬间」吧！

LongCat APP 体验入口：在「LongCat APP」中，你可以：输入一句话，生成高质量图像，或对生成图像进行迭代编辑、多轮生成，快速响应。

LongCat Web 端入口：

您可以登录 https://longcat.ai/ ，体验高效的 AI 生图功能，或对生成图像进行多轮编辑。

iOS 用户可在 APPStore 中搜索「LongCat」

更多玩法探索

LongCat 上线 AI 生图！精准高效，AI 创作不设限

作者: 纯情
时间: 2026-01-18
分类: 资讯
评论

目前，AI 生图功能已在 LongCat APP 和 https://longcat.ai/ 同步上线，轻松解锁高效创作新方式。

LongCat · AI 生图「三大功能亮点」

亮点一：图像生成 + 编辑一体化，创意落地无断点

从 “文字生成图片” 到 “用嘴改图” 一步到位，帮你轻松拿捏专业创作：

简单提示词也能高效出图：基于深度优化语义理解能力，简单提示词也能生成效果高度契合画面、布局、氛围及内容，在保障质量的前提下大幅提升创作效率。
全场景编辑无断点：支持物体增删、风格迁移、视角转换、人像精修、文本修改等 15 类细分任务，无论是简单的背景替换，还是复杂的多轮复合指令，均能精准执行。
多轮编辑不丢质感：修改后画面和原图风格、光影保持一致，不会出现 “拼接感”，人像编辑保留面部特征，多轮编辑画面不跑偏。

prompt：头发颜色变成灰色，衣服颜色变成米色，面带微笑

prompt：拉远镜头，显示更多室内场景

prompt：将人物变为棕色的熊，保持相同的姿态

prompt：消除最左边的饮料

prompt：让猫闭上眼睛

prompt：变成真的老虎，在海边

prompt：在红色圈添加一个白色的钟表，绿色框添加黑色的手提包，黑色框添加一只白色的猫

亮点二：中文文字生成超能打，生僻字也不翻车

中文文字生成能力优异，生僻字生成也不在话下：

字符渲染优异：店铺牌匾、海报标题、书籍封面等场景的中文文字，无错字、漏字、字体扭曲，多行排版、段落文本均能精准渲染
生僻字高覆盖率：非常见字、异体字、书法字体（楷体、行书）准确率较高，适配传统文化、专业领域等特殊创作需求
智能排版：自动匹配场景调整文字大小、颜色、行距，如古风文案搭配书法字体，科技主题适配现代无衬线字体，无需手动调整

亮点三：快速生成摄影棚级质感画面

快速响应不等待：轻量化技术优化让单张高清图高效生成，效率较同类工具有一定提升，高频创作无需久候。
质感堪比棚拍实景：优化构图与光影美学，物体纹理、场景光影精准复刻真实世界，人物肢体、物体比例遵循物理规律，实现摄影棚拍质感。

强大功能背后的「技术底座」

文字生成基准测试

图像编辑基准测试性能比较

用 LongCat 记录你的「灵感瞬间」吧！

LongCat APP 体验入口：在「LongCat APP」中，你可以：输入一句话，生成高质量图像，或对生成图像进行迭代编辑、多轮生成，快速响应。

LongCat Web 端入口：

您可以登录 https://longcat.ai/ ，体验高效的 AI 生图功能，或对生成图像进行多轮编辑。

iOS 用户可在 APPStore 中搜索「LongCat」

更多玩法探索

AMD，Yes！搞定 AMD 显卡在 Windows 本地部署 ComfyUI + Z-Image 生图的全流程及踩坑记录

作者: 纯情
时间: 2025-12-26
分类: 网络
评论

AMD 7800XT 显卡 Windows 本地部署 ComfyUI + Z-Image 保姆级教程

前言

作为一名 AMD Yes! 用户，想在本地跑 AI 生图实在费劲。

网上很多教程推荐使用 WSL（Linux 子系统）或者双系统，我折腾了一圈，全部以失败告终，不仅步骤繁琐，还容易报错。

经过多次尝试，我终于摸索出了一套 在 Windows 下最稳、最简单的方案：利用 秋叶大神的整合包 + ZLUDA。现在我也能愉快地生图了，把踩过的坑分享给大家，希望能帮到同样使用 A 卡的佬友。

第一步：搞定驱动

AMD 跑 AI，驱动是重中之重。这里有两个巨大的坑，请严格按照以下步骤操作：

1. 下载并安装专用驱动

你需要安装特定的 PRO 版本驱动来支持 ROCm/HIP 环境。请按顺序下载：

HIP 支持驱动 (必须安装) ：
- 版本：AMD-Software-PRO-Edition-23.Q4-Win10-Win11-For-HIP
- 下载地址：点击下载
显卡核心驱动 (配合使用) ：
- 版本：AMD-Software-PRO-Edition-25.Q3 (由于官方链接失效，请使用第三方备份)
- 下载地址：DriversCloud 下载

避坑指南 1：禁止驱动自动更新！

非常重要！ 安装完上述驱动后，一定要在 AMD 驱动软件设置里，把 “自动更新” 关掉！
如果不关，重启电脑后它会自动更新到最新的游戏驱动，会导致环境失效（比如提示显存不足、报错等），那时候就得全部重来了。

第二步：安装 ComfyUI 整合包

为了省去繁琐的代码部署，我们直接使用 B 站秋叶大佬的整合包，开箱即用。

下载地址：夸克网盘
解压密码：bilibili-秋葉aaaki

操作步骤：

下载并解压 ComfyUI-aki-v2。
点击 启动器 运行。

启动器设置（启用 ZLUDA）

进入启动器界面后，不要急着点运行：

在启动器设置或内核选择中，找到 ZLUDA 选项并选中它（这是让 A 卡模拟 N 卡环境运行的关键）。
确保显卡选项已正确识别你的 7800XT。

第三步：更新内核（避坑指南 2）

这里是很多人失败的地方。整合包自带的核心可能较旧，直接跑新模型会报错。

操作方法：
在启动器界面，找到 “版本管理” 或 “更新” 选项，选择 “最新代码”，点击一键更新。
更新完成后，务必 重启软件，否则工作流可能无法正常加载。

第四步：模型选择与配置（性能优化篇）

避坑指南 3：显存不够怎么办？

我的 7800XT 虽然有 16G 显存，但在跑完整版 Z-Image (Flux) 模型时，显存依然捉襟见肘。

完整版现状：生一张图需要 500 秒 左右（严重爆显存，速度极慢）。
优化方案：使用 FP8 Scala 版本 的模型。

优化后的效果：

显存占用：仅需 6-7G。
生成速度：缩短至 50 秒 一张图（速度提升 10 倍！）。
画质损失：几乎肉眼不可见。

必备模型下载清单

Z-Image Turbo 需要三个核心组件才能运行：主模型、文本模型、VAE。请按照下面的清单下载，并严格放入对应的文件夹中（找不到文件夹就根据路径自己新建一个，注意文件名不要改动太大）。

提示：由于涉及 HuggingFace 和 Civitai，部分网络可能需要魔法才能打开。

1. 主模型 (Checkpoints)

这是画图的主力核心，我们选用的是针对显存优化的量化版本，非常适合 7800XT 这样的 16G 显卡。

模型名称：Z-Image-Turbo (Quantized)
下载地址：点击前往 Civitai 下载
存放路径：
```
ComfyUI-aki-v2\models\checkpoints
```

2. 文本模型 (Text Encoder / CLIP)

这是 AI 的 “耳朵”，用来听懂你的提示词。Z-Image 使用的是 Qwen (通义千问) 的 3.4B 版本作为文本编码器。

模型名称：qwen_3_4b.safetensors
下载地址：点击前往 HuggingFace 下载
存放路径：
```
ComfyUI-aki-v2\models\clip
```
(注：如果文件夹里没有 clip 文件夹，找一下有没有 text_encoders ，或者直接手动新建一个 clip 文件夹)

3. VAE 模型 (解码器)

这是 AI 的 “眼睛”，负责将计算好的数据解码成我们在屏幕上看到的像素图片。如果没有它，生成的图可能是一片灰色或彩色噪点。

模型名称：ae.safetensors
下载地址：点击前往 HuggingFace 下载
存放路径：

ComfyUI-aki-v2\models\vae

主模型 (Checkpoints) ：下载 fp8 版本的 Z-Image/Flux 模型。
文本编码器 (Text Encoder) ：下载 Qwen 8B (或对应的 Clip/T5) 文本模型。没有它，AI 听不懂你的提示词，点击下载。
VAE 模型：下载对应的 AE/VAE 模型。没有它，生成的图片会是一片灰或者噪点，点击下载。

第五步：愉快生图

将下面的内容保存为 json

{ "2": { "inputs": { "text": "a beautiful landscape, high quality, 8k", "clip": ["16", 0] }, "class_type": "CLIPTextEncode", "_meta": { "title": "正向提示词" } }, "4": { "inputs": { "seed": , "steps": 8, "cfg": 1, "sampler_name": "euler", "scheduler": "simple", "denoise": 1, "model": ["15", 0], "positive": ["2", 0], "negative": ["9", 0], "latent_image": ["5", 0] }, "class_type": "KSampler", "_meta": { "title": "K采样器" } }, "5": { "inputs": { "width": 768, "height": 768, "batch_size": 1 }, "class_type": "EmptyLatentImage", "_meta": { "title": "空Latent图像" } }, "6": { "inputs": { "vae_name": "ae.safetensors" }, "class_type": "VAELoader", "_meta": { "title": "加载VAE" } }, "7": { "inputs": { "samples": ["4", 0], "vae": ["6", 0] }, "class_type": "VAEDecode", "_meta": { "title": "VAE解码" } }, "8": { "inputs": { "filename_prefix": "ComfyUI", "images": ["7", 0] }, "class_type": "SaveImage", "_meta": { "title": "保存图像" } }, "9": { "inputs": { "text": "blurry, ugly, bad, lowres, jpeg artifacts, watermark, distorted, noisy, artifact, glitch, oversaturation, neon tones, harsh contrast or glow, color cast, pixelated, blocky", "clip": ["16", 0] }, "class_type": "CLIPTextEncode", "_meta": { "title": "反向提示词" } }, "15": { "inputs": { "ckpt_name": "zImageTurboQuantized_fp8ScaledE4m3fnKJ.safetensors" }, "class_type": "CheckpointLoaderSimple", "_meta": { "title": "加载主模型" } }, "16": { "inputs": { "clip_name": "qwen_3_4b.safetensors", "type": "stable_diffusion" }, "class_type": "CLIPLoader", "_meta": { "title": "加载CLIP文本编码器" } } }

在工作流界面，按住 Ctrl+O，选择刚才的 json，导入后会形成如下工作流，点击运行即可。

这套工作流非常强大，不仅可以用来提示词生图，还能先炼丹，用 lora 脸模、腿模等配合提示词生图，还能生成视频，不过生成视频的模型需要更高的版本才支持，这属于进阶篇了，我折腾了几天目前这套已经足够使用了。

📌 转载信息

来源：
https://linux.do/t/topic/1363301

原作者：
mydubai7794

转载时间：
2025/12/26 11:03:52

标签 AI生图下的文章

麻麻再也不用担心我不会生图提示词啦

LongCat 上线 AI 生图！精准高效，AI 创作不设限

LongCat · AI 生图「三大功能亮点」

亮点一：图像生成 + 编辑一体化，创意落地无断点

亮点二：中文文字生成超能打，生僻字也不翻车

亮点三：快速生成摄影棚级质感画面

强大功能背后的「技术底座」

用 LongCat 记录你的「灵感瞬间」吧！

LongCat 上线 AI 生图！精准高效，AI 创作不设限

LongCat · AI 生图「三大功能亮点」

亮点一：图像生成 + 编辑一体化，创意落地无断点

亮点二：中文文字生成超能打，生僻字也不翻车

亮点三：快速生成摄影棚级质感画面

强大功能背后的「技术底座」

用 LongCat 记录你的「灵感瞬间」吧！

AMD，Yes！搞定 AMD 显卡在 Windows 本地部署 ComfyUI + Z-Image 生图的全流程及踩坑记录

AMD 7800XT 显卡 Windows 本地部署 ComfyUI + Z-Image 保姆级教程

前言

第一步：搞定驱动

1. 下载并安装专用驱动

避坑指南 1：禁止驱动自动更新！

第二步：安装 ComfyUI 整合包

启动器设置（启用 ZLUDA）

第三步：更新内核（避坑指南 2）

第四步：模型选择与配置（性能优化篇）

避坑指南 3：显存不够怎么办？

必备模型下载清单

1. 主模型 (Checkpoints)

2. 文本模型 (Text Encoder / CLIP)

3. VAE 模型 (解码器)

第五步：愉快生图

最新文章

最近回复

分类

归档

其它

标签 AI生图 下的文章

麻麻再也不用担心我不会生图提示词啦

LongCat 上线 AI 生图！精准高效，AI 创作不设限

LongCat · AI 生图「三大功能亮点 」

亮点一：图像生成 + 编辑一体化，创意落地无断点

亮点二：中文文字生成超能打，生僻字也不翻车

亮点三：快速生成摄影棚级质感画面

强大功能背后的「技术底座」

用 LongCat 记录你的「灵感瞬间」吧！

LongCat 上线 AI 生图！精准高效，AI 创作不设限

LongCat · AI 生图「三大功能亮点 」

亮点一：图像生成 + 编辑一体化，创意落地无断点

亮点二：中文文字生成超能打，生僻字也不翻车

亮点三：快速生成摄影棚级质感画面

强大功能背后的「技术底座」

用 LongCat 记录你的「灵感瞬间」吧！

AMD，Yes！搞定 AMD 显卡在 Windows 本地部署 ComfyUI + Z-Image 生图的全流程及踩坑记录

AMD 7800XT 显卡 Windows 本地部署 ComfyUI + Z-Image 保姆级教程

前言

第一步：搞定驱动

1. 下载并安装专用驱动

避坑指南 1：禁止驱动自动更新！

第二步：安装 ComfyUI 整合包

启动器设置（启用 ZLUDA）

第三步：更新内核（避坑指南 2）

第四步：模型选择与配置（性能优化篇）

避坑指南 3：显存不够怎么办？

必备模型下载清单

1. 主模型 (Checkpoints)

2. 文本模型 (Text Encoder / CLIP)

3. VAE 模型 (解码器)

第五步：愉快生图

最新文章

最近回复

分类

归档

其它

标签 AI生图下的文章

LongCat · AI 生图「三大功能亮点」

LongCat · AI 生图「三大功能亮点」