标签 AI绘画 下的文章

感谢:【开源欢迎star】即梦海外版2api :Dreamina2API 以及:jimeng-api

晚上看到海外版注册机,然后看到有个 2api 是 py 版本,想着能不能重构下,直接部署到大善人那儿,于是让 AI 搓了一个出来,目前只有文生图,其他还没弄(熬不动了,溜去睡了)


在线:https://j.aisk.de5.net

项目地址:dreamina-api

感谢支持


📌 转载信息
转载时间: 2026/1/25 08:05:03

引言

在上一篇文章中,我们探讨了 AI 绘画看似神奇的“魔法”背后的真相:它并非凭空创造,而是一个从混沌的噪点中,通过无数次“观察-脑补-修正”的循环,逐步建立秩序、生成图像的过程。理解了这一核心原理,一个自然的问题随之产生:我们该如何操控这个过程?是需要编写晦涩难懂的代码,还是有更直观、更易上手的方法?

答案是肯定的。今天,我们将介绍一位强大的幕后英雄——ComfyUI。作为一款基于节点流程的 Stable Diffusion 用户界面,ComfyUI 就像是一个透明的 AI 魔法工坊。它将复杂的 AI 生成过程拆解为一个个独立的模块,让使用者能够像搭积木一样,直观地构建和掌控自己的 AI 绘画工作流。本文将带领读者走进这个工坊,通过拆解一个最基础的文生图工作流,揭示每一个“积木”是如何分工协作,最终完成那场精彩的“脑补”大戏的。

第一部分:初识 ComfyUI —— AI 的可视化乐高

如果将传统的、集成度高的 AI 绘画 WebUI 比作一个功能齐全的“黑盒子”微波炉,用户只需放入食材、按下按钮即可得到成品,那么 ComfyUI 就更像是一套透明的乐高积木,或者一个开放式的中央厨房。

ComfyUI 的核心特点在于其“节点化 (Node-based)”的设计理念。在这里,每一个功能——无论是加载模型、处理文本,还是执行采样、解码图像——都被封装成了一个个独立的方块,称为“节点”。用户通过线缆将这些节点连接起来,定义数据的流向。

这种可视化流向的设计,使得 AI 的工作过程不再神秘。使用者看到了什么连接,AI 后台就执行了什么操作。数据从哪里来,到哪里去,经过了怎样的处理,一切都一目了然。更重要的是,这种极致的灵活性赋予了用户无限的创造空间。使用者可以根据自己的需求,像搭积木一样自由组合各种节点,构建出从简单到无比复杂的个性化创意工作流。

第二部分:解剖一只麻雀 —— 最基础的文生图工作流拆解

面对 ComfyUI 的界面,初学者可能会对满屏的节点和连线感到困惑。但无需担心,万丈高楼平地起。理解了最基础的工作流,就掌握了通往复杂应用的钥匙。下面展示的是一个最典型的 ComfyUI 文生图(Text-to-Image)工作流界面,我们将逐一拆解其中的核心角色。

1. 大管家:加载器 (Checkpoint Loader Simple)

一切工作的起点,是这个被称为“加载器”的节点。它就像是整个魔法工坊的物料仓库大管家。

它的作用是加载预先训练好的模型文件,通常称为 Checkpoint。这个文件至关重要,因为它打包了 AI 的核心能力:负责图像生成的“大脑”(UNet 网络)、负责理解文本的“眼睛”(CLIP 模型)以及负责图像数据转换的“翻译器”(VAE)。选择不同的 Checkpoint 文件,就决定了 AI 的“阅历”和基础“画风”,是擅长二次元动漫,还是写实摄影,全赖于此。它是所有后续工作的基石。

2. 翻译官与指挥棒:CLIP 文本编码器 (CLIP Text Encode)

人类使用自然语言描述画面,而 AI 的核心模型只能理解数学化的向量。这就需要“CLIP 文本编码器”充当人类与 AI 之间的沟通桥梁。

这个节点的作用是将用户输入的文本提示词(Prompt),“翻译”成 AI 能懂的数学指令,在技术上称为“条件 (Conditioning)”

在基础工作流中,通常会看到两个这样的节点。一个负责翻译正向提示词,生成“正向条件”,告诉 AI “画面里必须出现什么”(如:一只猫、高质量、阳光);另一个负责翻译反向提示词,生成“反向条件”,告诉 AI “画面里绝对不能出现什么”(如:低质量、变形、水印)。这两个条件就像是两根指挥棒,将在后续的生成过程中,严格引导和约束 AI 的创作方向。

3. 魔术师与沙盘:K 采样器 (KSampler)

“K 采样器”是整个工坊的核心车间,是奇迹真正发生的地方。它负责执行我们之前提到的“从噪点到清晰图像”的去噪循环。

为了高效地处理图像生成这一庞大的计算工程,AI 极其聪明地选择了一个策略:不在巨大的像素级画布上直接作画,而是在一个被称为“潜在空间 (Latent Space)”的沙盘上搭建一个精巧的“小模型”(潜在图像)。KSampler 就是在这个沙盘上进行精细化作业的魔术师。因为它处理的是高度浓缩的信息,而非海量的像素数据,所以效率极高。

这位魔术师在沙盘上工作时,并非随心所欲。它需要三种原料:从加载器获取的“模型”能力、一个初始的“空白画布”(通常是一个纯噪声的潜在图像),以及最重要的——从文本编码器传来的两根“指挥棒”。

在设定的步数内,KSampler 执行着“观察-脑补-修正”的循环。在每一步操作中,它都会严格参照“正向条件”的指南和“反向条件”的禁令,努力将沙盘上混沌的噪声,逐步转化为符合人类要求的、有意义的“小模型”。

4. 神奇打印机:VAE 解码 (VAE Decode)

当 KSampler 在沙盘上完成了创作,我们得到的是一个“潜在图像”。它虽然包含了画面的所有核心信息,但却是一团人类肉眼无法辨识的压缩数据。

这时就需要“VAE 解码”节点出场了。它就像是一台神奇的建筑打印机。它接过沙盘上那个抽象的“小模型”,利用大管家提供的 VAE 工具(图像数据转换的翻译器),按照特定的规则将这份压缩数据“解压”,并最终“打印”成我们眼前这座宏伟、清晰、色彩斑斓的像素大图。

5. 展示台:保存/预览图像 (Save/Preview Image)

工作流的终点是“保存/预览图像”节点。它的任务非常直观:将 VAE 解码器输出的最终像素图像展示在界面上供用户检阅,并将其保存到计算机的硬盘中,完成整个创作流程。

第三部分:连线——让数据流动起来

在 ComfyUI 中,节点之间的连线不仅仅是视觉上的连接,它们代表了数据显性的流动路径。理解了连线,就理解了 AI 工作的逻辑。

就像不同形状的积木插口一样,ComfyUI 中只有相同类型的数据端口才能连接,这保证了流程的正确性。

  • 模型连模型 (MODEL):将加载器中的绘画能力传递给采样器。
  • 条件连条件 (CONDITIONING):将文本编码器生成的“指挥棒”传递给采样器,指引创作方向。
  • 潜在图像连潜在图像 (LATENT):在采样器和解码器之间传递那个核心的沙盘“小模型”。
  • VAE 连 VAE (VAE):将加载器中的翻译规则传递给解码器,用于最终图像的还原。

整个流程可以总结为一条清晰的主线:加载模型备物料 -> 输入文字变指挥棒 -> 准备沙盘造噪声 -> 采样核心搞创作(受指挥棒引导) -> VAE 解码打印出图像。

结语

ComfyUI 以其独特的节点化设计,看似复杂,实则提供了一种最直观、最透彻的方式来理解和掌控 AI 绘画。它将深奥的 AI 生成原理拆解为一个个清晰可见的步骤,让我们不仅能“知其然”(看到最终的精美图像),更能“知其所以然”(理解图像是如何一步步生成的)。

通过理解“潜在空间”这个高效运作的沙盘,以及“条件”这两根强有力的指挥棒,我们揭开了 AI 绘画魔法的一角。掌握基础工作流只是第一步,ComfyUI 的魅力在于其无限的扩展性。鼓励每一位使用者去探索更多的高级节点,如 ControlNet、LoRA 等,搭建属于自己的、独一无二的 AI 绘画流水线,释放无限的创造潜能。

本文由mdnice多平台发布

在当今的数字时代,只需输入一句描述,如“一只穿着宇航服的猫在月球上喝咖啡,电影感光影”,几秒钟后,屏幕上便会呈现出一张惊艳的图像。Midjourney、Stable Diffusion 等 AI 绘画工具的出现,仿佛让“神笔马良”的故事成为了现实。

但这背后究竟是魔法,还是科技?

在那个神秘的进度条背后,AI 究竟在进行怎样的操作?它的“大脑”里是否真的住着一位不知疲倦的画手,拿着画笔在白纸上从零开始创作?

本文将抛开复杂的专业术语,以通俗易懂的方式拆解这一神奇过程。真相或许比想象中更有趣——AI 绘画,本质上是一场大型的“脑补”游戏。


第一部分:画布的真相——它居然不是空白的!

谈及绘画,人们的第一反应通常是:在一张干净的白纸上构图、打草稿、上色。

然而,AI 的创作方式截然不同。它的起点并非空白,而是一片混沌。

如果能深入 AI 的后台一探究竟,会发现当它准备开始工作时,面前的“画布”呈现出如下形态:

这是一张密密麻麻、杂乱无章的噪点图,在技术上被称为“纯噪声”

在人类眼中,这或许只是毫无意义的混乱。但在 AI 眼中,这里隐藏着无限可能。AI 作画的本质,并非“无中生有”,而是“从混乱中建立秩序”。它不是在做加法(往白纸上添加内容),而是在做减法(去除不需要的噪点)。


第二部分:AI 的特殊技能——“脑补大师”是怎样炼成的?

面对这样一屏毫无头绪的雪花,AI 如何知道该从何处下手?这得益于它在投入使用前经历的魔鬼训练。

在尚未掌握绘画技能之前,AI 分析了数十亿张人类世界的图片。其学习方式颇为独特,堪称一位“破坏与重建狂魔”

训练过程中,研究人员会向 AI 展示一张清晰的照片(例如一只小狗),随后逐步向照片中添加“沙子”(噪点),使照片逐渐变得模糊,直至完全变为一张无法辨认的雪花屏。

AI 的任务便是学习如何“倒放”这一过程——即凭经验将这张雪花屏还原成最初的那只小狗。

经过亿万次此类练习,AI 练就了一双“火眼金睛”,成为了世界上顶尖的“去噪专家”。面对任何混乱的图像,它的第一反应便是:“这太乱了,需要将其清理干净。”


第三部分:关键时刻——面对一片雪花,AI 怎么下第一笔?

这是整个生成过程中最为神奇的环节。

当用户输入指令:“画一只猫”,AI 面对着手中那张杂乱无章的雪花屏,内心或许是崩溃的:“这里哪里有猫?这全是噪点。”

此时,奇迹发生了。这个过程类似于人们童年时常玩的游戏——“在云朵里找形状”

想象一下,躺在草地上注视着天上杂乱无章的云团发呆。此时,若有人提示:“嘿,你看那片云,像不像一只猫?”

一旦接受了这一设定,大脑便会开始强行“脑补”。越看越觉得:“左边那团突出的云确实有点像猫耳朵,中间那块暗影有点像猫身子……”

AI 画画的第一步,正是这种强制的“幻视”。

当用户输入“猫”作为提示词,便相当于给了 AI 一个强烈的暗示。它被迫在那堆毫无意义的噪点中寻找“猫”的蛛丝马迹。

它会审视那些随机排列的像素点,强行联想:“虽然目前很乱,但如果非要说的话,中间这几个黑点凑在一起,相较于角落里的白点,更有潜力发展成一个猫鼻子。”

于是,AI 迈出了极其微小的第一步:它并未直接画出猫鼻子,而只是将那些像素的颜色,朝着“猫”的方向轻轻推了一把。


第四部分:见证奇迹——从模糊到清晰的循环

这一步迈出后,画布看起来依然是一团糟。但 AI 绘画并非一步到位,它更像是一位手持橡皮擦和雕刻刀的雕塑家,一点一点将作品“磨”出来。

这个过程在软件中通常被称为“步数”(Steps)。

  • 第 1 步: 对着雪花屏强行脑补,画面依然混沌,但已显现出极其微弱的趋势。
  • 第 10 步: AI 认为“猫”的形象越来越确定,下手逐渐加重,画面中出现了一个模糊的影子,能隐约辨识出动物的轮廓。
  • 第 20 步: 轮廓日益清晰,AI 开始雕琢细节:“此处应有毛发,彼处应是眼睛的反光。”
  • 第 30 步: 大功告成!噪点被清理干净,光影、质感完美呈现,一只栩栩如生的猫诞生了。

这就是为什么 AI 生成图片需要几秒钟的时间,因为它在后台快速地进行了数十次“观察-脑补-修正”的循环。


第五部分:灵魂拷问——为什么每次生成的图片都不一样?

人们可能会发现,使用相同的提示词和模型设置,点击两次生成,AI 给出的图片却是完全不同的。既然是机器,为何结果不稳定?

这正是 AI 绘画的迷人之处,其原因主要有二:

1. 起跑线不同(蝴蝶效应)

还记得最初那张“雪花屏”吗?每次点击生成按钮,AI 面对的那张雪花屏都是电脑随机新生成的。

世界上没有两片相同的树叶,也没有两张相同的噪点图。

也许这一次,初始噪点的左上角偶然多出了几个黑点,AI 便觉得:“此处适合画一只黑猫”;下一次,中间的噪点偏黄一点,AI 便觉得:“这次画只橘猫更合理”。

初始状态的极其微小差别,经过数十步的放大,最终导致了结果的巨大不同。这就是 AI 世界的“蝴蝶效应”。

2. “猫”是一个范围,不是一个点

在 AI 的庞大数据库里,“猫”并非一张固定的标准证件照,而是一个巨大的概念库。

提示词只是将 AI 推向了“猫”的领地,但具体落在领地里的哪个位置——是波斯猫还是狸花猫,是躺姿还是坐姿——充满了随机性。除非使用非常精确的语言进行限制,否则 AI 很乐意在“猫”的领地里随机探索。


结语

综上所述,AI 绘画并没有自主意识,它其实并不懂什么是艺术,也不懂什么是猫。

它只是一个阅图无数、拥有超强计算能力的“去噪机器”,一个有着严重强迫症的“脑补大师”。

但正是这种纯粹的数学计算,加上一点点随机的运气,为人类带来了近乎无限的创造力。下次当再次按下生成按钮时,不妨想象一下 AI 在后台对着一堆雪花屏努力“脑补”的样子,这或许正是科技的可爱之处。

本文由mdnice多平台发布

在当今的数字时代,只需输入一句描述,如“一只穿着宇航服的猫在月球上喝咖啡,电影感光影”,几秒钟后,屏幕上便会呈现出一张惊艳的图像。Midjourney、Stable Diffusion 等 AI 绘画工具的出现,仿佛让“神笔马良”的故事成为了现实。

但这背后究竟是魔法,还是科技?

在那个神秘的进度条背后,AI 究竟在进行怎样的操作?它的“大脑”里是否真的住着一位不知疲倦的画手,拿着画笔在白纸上从零开始创作?

本文将抛开复杂的专业术语,以通俗易懂的方式拆解这一神奇过程。真相或许比想象中更有趣——AI 绘画,本质上是一场大型的“脑补”游戏。


第一部分:画布的真相——它居然不是空白的!

谈及绘画,人们的第一反应通常是:在一张干净的白纸上构图、打草稿、上色。

然而,AI 的创作方式截然不同。它的起点并非空白,而是一片混沌。

如果能深入 AI 的后台一探究竟,会发现当它准备开始工作时,面前的“画布”呈现出如下形态:

这是一张密密麻麻、杂乱无章的噪点图,在技术上被称为“纯噪声”

在人类眼中,这或许只是毫无意义的混乱。但在 AI 眼中,这里隐藏着无限可能。AI 作画的本质,并非“无中生有”,而是“从混乱中建立秩序”。它不是在做加法(往白纸上添加内容),而是在做减法(去除不需要的噪点)。


第二部分:AI 的特殊技能——“脑补大师”是怎样炼成的?

面对这样一屏毫无头绪的雪花,AI 如何知道该从何处下手?这得益于它在投入使用前经历的魔鬼训练。

在尚未掌握绘画技能之前,AI 分析了数十亿张人类世界的图片。其学习方式颇为独特,堪称一位“破坏与重建狂魔”

训练过程中,研究人员会向 AI 展示一张清晰的照片(例如一只小狗),随后逐步向照片中添加“沙子”(噪点),使照片逐渐变得模糊,直至完全变为一张无法辨认的雪花屏。

AI 的任务便是学习如何“倒放”这一过程——即凭经验将这张雪花屏还原成最初的那只小狗。

经过亿万次此类练习,AI 练就了一双“火眼金睛”,成为了世界上顶尖的“去噪专家”。面对任何混乱的图像,它的第一反应便是:“这太乱了,需要将其清理干净。”


第三部分:关键时刻——面对一片雪花,AI 怎么下第一笔?

这是整个生成过程中最为神奇的环节。

当用户输入指令:“画一只猫”,AI 面对着手中那张杂乱无章的雪花屏,内心或许是崩溃的:“这里哪里有猫?这全是噪点。”

此时,奇迹发生了。这个过程类似于人们童年时常玩的游戏——“在云朵里找形状”

想象一下,躺在草地上注视着天上杂乱无章的云团发呆。此时,若有人提示:“嘿,你看那片云,像不像一只猫?”

一旦接受了这一设定,大脑便会开始强行“脑补”。越看越觉得:“左边那团突出的云确实有点像猫耳朵,中间那块暗影有点像猫身子……”

AI 画画的第一步,正是这种强制的“幻视”。

当用户输入“猫”作为提示词,便相当于给了 AI 一个强烈的暗示。它被迫在那堆毫无意义的噪点中寻找“猫”的蛛丝马迹。

它会审视那些随机排列的像素点,强行联想:“虽然目前很乱,但如果非要说的话,中间这几个黑点凑在一起,相较于角落里的白点,更有潜力发展成一个猫鼻子。”

于是,AI 迈出了极其微小的第一步:它并未直接画出猫鼻子,而只是将那些像素的颜色,朝着“猫”的方向轻轻推了一把。


第四部分:见证奇迹——从模糊到清晰的循环

这一步迈出后,画布看起来依然是一团糟。但 AI 绘画并非一步到位,它更像是一位手持橡皮擦和雕刻刀的雕塑家,一点一点将作品“磨”出来。

这个过程在软件中通常被称为“步数”(Steps)。

  • 第 1 步: 对着雪花屏强行脑补,画面依然混沌,但已显现出极其微弱的趋势。
  • 第 10 步: AI 认为“猫”的形象越来越确定,下手逐渐加重,画面中出现了一个模糊的影子,能隐约辨识出动物的轮廓。
  • 第 20 步: 轮廓日益清晰,AI 开始雕琢细节:“此处应有毛发,彼处应是眼睛的反光。”
  • 第 30 步: 大功告成!噪点被清理干净,光影、质感完美呈现,一只栩栩如生的猫诞生了。

这就是为什么 AI 生成图片需要几秒钟的时间,因为它在后台快速地进行了数十次“观察-脑补-修正”的循环。


第五部分:灵魂拷问——为什么每次生成的图片都不一样?

人们可能会发现,使用相同的提示词和模型设置,点击两次生成,AI 给出的图片却是完全不同的。既然是机器,为何结果不稳定?

这正是 AI 绘画的迷人之处,其原因主要有二:

1. 起跑线不同(蝴蝶效应)

还记得最初那张“雪花屏”吗?每次点击生成按钮,AI 面对的那张雪花屏都是电脑随机新生成的。

世界上没有两片相同的树叶,也没有两张相同的噪点图。

也许这一次,初始噪点的左上角偶然多出了几个黑点,AI 便觉得:“此处适合画一只黑猫”;下一次,中间的噪点偏黄一点,AI 便觉得:“这次画只橘猫更合理”。

初始状态的极其微小差别,经过数十步的放大,最终导致了结果的巨大不同。这就是 AI 世界的“蝴蝶效应”。

2. “猫”是一个范围,不是一个点

在 AI 的庞大数据库里,“猫”并非一张固定的标准证件照,而是一个巨大的概念库。

提示词只是将 AI 推向了“猫”的领地,但具体落在领地里的哪个位置——是波斯猫还是狸花猫,是躺姿还是坐姿——充满了随机性。除非使用非常精确的语言进行限制,否则 AI 很乐意在“猫”的领地里随机探索。


结语

综上所述,AI 绘画并没有自主意识,它其实并不懂什么是艺术,也不懂什么是猫。

它只是一个阅图无数、拥有超强计算能力的“去噪机器”,一个有着严重强迫症的“脑补大师”。

但正是这种纯粹的数学计算,加上一点点随机的运气,为人类带来了近乎无限的创造力。下次当再次按下生成按钮时,不妨想象一下 AI 在后台对着一堆雪花屏努力“脑补”的样子,这或许正是科技的可爱之处。

本文由mdnice多平台发布

在 AI 绘画领域,我们一直在追求更快的出图速度和更低的硬件门槛。Z-image-turbo(简称 “造相”)是是阿里巴巴通义实验室于 2025 年底基于 Stable Diffusion WebUI 开发、发布的高效图像生成模型,60 亿参数、8 步采样等是其核心特性。它集成了多项加速技术,如 LCM (Latent Consistency Models) 和高效的模型与采样器,旨在实现秒级出图的极速体验。然而,高性能 AI 绘图往往需要强大的本地 GPU 支持。对于许多没有专业显卡的用户来说,这成为了一道门槛。本文将详细指导您如何利用 Google Colaboratory (Colab) 提供的免费或付费云端 GPU 资源,轻松部署 Z-image-turbo,彻底释放其速度潜力。

Z-image-turbo

文生图始终是热点,闭源这边,由 Gemini 3 Pro 驱动的 Nano-Banana Pro,几乎改变了大家对于平面设计的认知;开源方面,Flux 2.0 的开源随让图像生成效果大大提升,但过大的体量(30B+)几乎无法引起社区的关注。所以,Z-image 系列横空出世,6B 的体积以及社区量化版本的快速涌现,是大家真正能 “玩得上、玩得起” 的文生图模型。Z-image 包括多种变体,主要是三个版本:

  • Z-Image-Turbo:专注于快速推理,能够在低资源设备上高效运行,适合实时应用,支持中英文双语文本渲染(中文表现优异)。

  • Z-Image-Base:基础模型,适合开发者进行微调和二次开发。

  • Z-Image-Edit:专为图像编辑任务优化,支持根据自然语言指令进行精确编辑。

Z-image 系列已经设限,但本文示例使用的为社区 4bit 量化版本,支持 NSFW。

准备工作

在开始部署之前,请确保您拥有以下几项准备:

  1. Google 账号: 用于登录 Google Colab 并挂载 / 使用 Google Drive。
  2. 网络环境: 稳定的网络连接,以便顺利下载模型和运行环境。
  3. Hugging Face 账号 (可选但推荐): 如果您需要下载大型模型,拥有一个账号并设置好访问令牌会更方便。

首先,我们点击打开基于 4bit 量化版本 Z-image-turbo 的 jupyter 笔记本文件。

我们在 Google Colab 中,需要为 Z-image 项目分配合适的 GPU 加速资源,这是至关重要的一步:

  1. 点击打开顶部菜单栏的『修改』菜单, 选择『笔记本设置』。
  2. 在『笔记本设置』中选择 “T4 GPU” (对于免费用户,这是最佳选择) 或更高的配置(例如 A100,如果订阅了 Pro+)。
  3. 运行时类型选择 Python 3,点击『保存』。

运行时的修订也可以右上角的『连接』,在下拉菜单中选择『更改运行时类型』。


然后,在确定好提示词之后,就可以点击上方的『全部运行』开始执行顺序执行两个单元格的代码了。

运行与效率

示例不做修改,直接开始运行。需要先安装 z-image-turbo 及必要的依赖。


完成项目部署和依赖安装后,加载 Z-image-turbo,开始进行推理。


因为我们部署的是 4bit 量化版本,效率很高,1 分钟(实际推理耗时 01:07) 1 张图。至于和完全版本的质量差异,作者是无法识别并且不在意的。

结语

本文示例仅仅将量化本的 Z-image-turbo 部署在云端(Google colab),有效解决了本地硬件不足的问题。但是,很显然,我们不可能每次生成图片都需要将整个部署流程都完整跑一边,因此,如果能将 webui 部署到 google colab,通过远程访问公网 url,输入我们的图片生成指令,实时生成、显示、下载才是生产解决方案。我们后续将和大家分享如何将完整的包含 webui.py 的 Z-image-turbo 部署到 google colab,并借助 ngrok 或 cloudflare tunnel 进行内网穿透以提供公网访问的方法。


教程来自老 E


📌 转载信息
原作者:
yeahhe
转载时间:
2026/1/16 12:46:20

逛花瓣看到一些插画,很喜欢,就尝试着弄了一下,效果还可以捏,供佬友把玩。

咒语
一幅具有纹理感的扁平化儿童绘本插画。整个场景沐浴在勃勃生机的春光之中,营造出极致的温馨与惬意感。[场景描述]。画面严格采用丰富的春季色调,包括但不限于嫩绿、粉红、鹅黄、浅蓝。 --ar 9:16 
我的四季调色盘

春:嫩绿、粉红、鹅黄、浅蓝
夏:翠绿、湛蓝、金黄、大红
秋:焦橙、枯黄、水绿、赭红
冬:冰蓝、柔白、银灰、朱红


📌 转载信息
原作者:
Clarke.L
转载时间:
2026/1/15 10:52:11

虽然我比较懒,只分享了大概三组图…
但是阿真测了很多~
而且我也不只是分享图片捏~
我和马云的资产平均一下也能福布斯

先上我的吧~

我自己的经典 OC:

Anime angel girl, pink hair, stardust wings, sparkling eyes, surrounded by pastel stars, dreamy atmosphere.

什么奇奇怪怪的限制:


就非要多硬控我 30 秒呗

评价:

很可惜,动漫的手还是一如既往地烂…

插入:豆包左打攻击右脑


我的看法是 一如既往,在前就用地 在后就用得

但是无论如何非常可爱~
画风真的甜美~

给我写的一首生日歌配图:

豆包:


Niji:




显然文字生成并不支持中文,即便识别了双引号,甚至连无法识别的字符也懒得加,部分图片直接就没有任何符号 纯图
豆包的在我看来非常完美 不只是文字
Niji 的星星首先不是标准五角星 其次怎么看都有种钝钝的感觉
不过光影效果,特效之类的确实接近豆包了 豆包 10 分的话 niji 可以给到 7 分~

日式梦核

淡い水彩、細い線画、白髪、ロングストレートヘアー、女の子、白いワンピース、眠っている、儚い、背景白い花、儚い、白い蝶 、白昼夢

感觉还是很不错的嘟~

好了,我的内容结束了 希望对你有帮助

接下来就是正片:
来自阿真的超全测评

转载过来的时候修正了部分错字,并且给每一个提示词逐一加了代码块 (其实你无法想象这是多大的工作量),可以一键复制~
并且最后补了一下双语翻译~

超全 Niji V7 多场景实测,Midjourney 这位前顶流又仰卧起坐了。

文章较长,点开查看~

为了封面卡到半夜最后做出了个这啊啊可恶

嗨大家好!我是阿真!

前顶流 Midjourney 终于姗姗来迟,在 1 月 9 日推出了 Niji V7 。

我用的官方的网页端:https://www.midjourney.com/imagine

后续其他工具上了我再和大家同步,尤其做动漫风格作品的朋友们可以关注。

这里切换

主要更新内容如下:

图像质量提升

这是本版本最大的改进。连贯性大幅增强,细节表现更清晰,比如眼睛的反射细节、背景中飘落的花瓣等都能精准呈现,相当于一次 "高清升级"。距离拉近后 Waifu 的眼睛亮闪闪,光晕的效果更好了。

提示词遵循能力增强

模型对高度具体的请求响应能力更强,更偏向字面理解。比如可以准确区分左边红色立方体和右边蓝色立方体的位置,或绘制四只手臂各拿冰淇淋的角色。官方提醒,之前那些强调氛围感的提示词可能需要重新调整。

大多数功能已实现向前兼容,特别是 sref(风格参考) 功能在 Niji 7 中表现出色。但 cref(角色参考)暂不支持,官方表示正在开发 “超级神秘惊喜” 来替代。

即将推出的功能

个性化 (Personalization) 与 情绪板 ( Moodboards) 功能即将上线。

设计美学突破

线条之美:线条能传达更多形体、质感和光照信息。Niji V7 在这方面有突破性进展,可使用 “anime screenshot” 提示词体验。

简约风格:AI 艺术的悖论是简单画面最难,元素少意味着无法用其他元素掩盖错误。Niji 7 有意识地追求简洁,支持大面积留白。可使用 “minimalist graphic logo” 体验。

线条与空间结合:精确线条与大面积平涂区域的结合带来更出色的绘画效果。默认风格降低了渲染量(减少 3D 感),呈现更平面化的外观以展示底层绘图的连贯性。

简单说说我个人体验后的感觉:

线条细节更好了,像凌乱线头一样杂乱无序的线条少了很多,看起来更接近手绘或者板绘的感觉了,简单的插画线条勾勒更精确了。提示词控制还是比较随机。动漫人物细节更好了,优化明显,大全景还是会有点糊,但是人物全景有明显优化。–Sref 加持下提示词随便写也都很好看,–Sref 很好用,感觉比在 Midjourney 更好用。

好,话不多说,上图!今天这篇可能内容会稍微长点,但都是用心尝试的。

首先是不带 sref code 的原生图。我会优先使用中景构图方便大家查看,当然现在不管是扩图还是放大都很方便了,最重要的还是要基础图好看哈哈哈。

太长了就不方中文翻译了,大家感兴趣可以浏览器打开自动翻译或者手机选择内容翻译哦。

a cheerful anime girl with long pink twintails, sparkling magenta eyes, excited smile showing teeth, cherry blossom hair pins, pink gem earrings, pink lace choker, wearing pink sundress, standing under a blooming cherry blossom tree in a Japanese garden, petals floating in the air, stone lantern and koi pond in background, modern anime style, clean linework, vibrant pink color theme, fresh spring atmosphere, bright natural lighting --chaos 5 --ar 16:9 --stylize 400 
a cool anime boy with messy silver hair, rosy wind-chapped cheeks, confident side glance, wearing navy blue knit beanie with pompom, reflective silver ski goggles on forehead, cream cable knit turtleneck sweater, red plaid wool scarf, holding snowboard, mountain peak visible behind, anime illustration, clean detailed rendering, soft natural lighting, cozy winter atmosphere, nostalgic retro ski aesthetic --chaos 5 --ar 16:9 --stylize 800 --niji 7 
a weathered male dwarf runesmith with wild grey beard with glowing runes braided in, intense orange eyes reflecting forge fire, concentrated gruff expression, wearing heavy leather apron over chainmail with burn marks, holding hammer crackling with runic energy, molten metal floating in magical pattern, underground forge background with rivers of lava and ancient stone carvings, semi-realistic digital painting style, detailed rendering, RPG character concept art aesthetic, mystical industrious atmosphere --chaos 5 --ar 16:9 --stylize 400 --niji 7 

换个风格试一下

twin sisters holding hands, one in pink dress one in mint dress, discovering a hidden door covered in ivy and morning glories, forest clearing scene, children's book illustration style, watercolor texture, soft pastel color palette, whimsical and magical atmosphere, gentle warm lighting, storybook art --chaos 5 --ar 16:9 --niji 7
portrait of barbarian queen with wild dark brown windswept hair, fierce hazel eyes with gold flecks, tribal tattoo on cheekbone, bone and fang necklace, grey mammoth fur draped over one shoulder, battle paint smudges, harsh dramatic lighting, untamed savage beauty atmosphere --chaos 5 --ar 16:9 --stylize 400 --niji 7

不同质感的区分更明显了。

线条细节真的好了很多,我生成的时候都觉得眼前一亮又一亮。

a magnificent white tiger with piercing blue eyes, prowling through ancient wisteria grove, hanging purple flower cascades, surreal deep purple amethyst mountains behind, silver mist rising, midnight blue starry sky, Chinese traditional landscape painting meets surrealism, fantasy dreamscape aesthetic, hyper-detailed 3D render style, cinematic composition, ethereal mystical atmosphere, vibrant saturated colors --chaos 5 --ar 16:9 --stylize 800 --niji 7 

手部的细节也是越来越有模有样了(少一根弦懒得修改了,可以叫 NBP 加上)

a violinist with flowing dark hair cascading over shoulder, eyes closed feeling the music, chin resting on violin, bow poised mid-stroke, wearing simple black dress, concert hall darkness implied around her, loose expressive pencil charcoal sketch linework style, minimal soft watercolor color washes, limited muted color palette, elegant artistic aesthetic, quiet contemplative mood, refined romantic atmosphere --chaos 5 --ar 16:9 --stylize 800 --niji 7 

简约线条的效果:

a baby elephant holding a watering can, tending to colorful flowers, simple garden scene, flat illustration style, kawaii, cute cartoon style, simple bold outline, cheerful and encouraging atmosphere --chaos 5 --ar 16:9 --niji 7 
a cute chibi girl with pink twin tails, sparkling black eyes, winking playfully, wearing frilly magical girl dress with star wand, casting sparkle magic mid-jump, dynamic floating pose, small shadow below, accompanied by cute white bunny mascot with bow, solid bright purple background, retro 16-bit pixel art style, visible dithering halftone shading technique, arcade game character aesthetic, vibrant primary colors, nostalgic video game sprite art --chaos 5 --ar 16:9 --stylize 800 --niji 7 

复杂场景上还是会出现和之前类似的问题,线条有时候会糊在一起,但相比 Niji V6 也有明显进步。大全景整体细节还是差一点点,期待更好。

twin sisters holding hands, one in pink dress one in mint dress, discovering a hidden door covered in ivy and morning glories, forest clearing scene, children's book illustration style, watercolor texture, soft pastel color palette, whimsical and magical atmosphere, gentle warm lighting, storybook art --chaos 5 --ar 16:9 --niji 7

看看发卡、手势、头发线条的交代

a gentle anime girl with long flowing aqua blue hair, soft teal eyes, peaceful content smile, seashell hair clips, pearl drop earrings, wearing flowy white sundress, sitting on beach blanket under striped umbrella, crystal clear tropical water and white sand beach stretching behind her, palm trees swaying, modern anime style, clean detailed linework, soft skin shading, nautical summer theme, bright cheerful atmosphere, warm sunlight --chaos 5 --ar 16:9 --stylize 800 --niji 7 
a cheerful anime girl with short pink bob haircut, bright eyes sparkling with excitement, big happy grin, wearing bright yellow puffer jacket, white fluffy earmuffs, rainbow striped knit scarf flying in wind, catching snowflakes on tongue, snowy park with children playing behind, anime illustration, clean detailed rendering, soft natural lighting, cozy winter atmosphere, playful joyful aesthetic --chaos 5 --ar 16:9 --stylize 800 --niji 7 

下面第一张我整体还算喜欢,但是首饰细节不行,后面一张就是脸稍微有点不够大气:

a elegant anime woman with silver hair in sophisticated updo, refined poised expression, subtle knowing smile beatiful red lips, wearing luxurious white fur coat, diamond earrings sparkling, champagne glass in gloved hand, exclusive ski resort lodge balcony with Alps view, anime illustration, clean detailed rendering, soft golden hour lighting, cozy winter atmosphere, glamorous high fashion aesthetic --chaos 5 --ar 16:9 --stylize 800 --niji 7 

哈哈哈玩得确实挺开心,接下来进入正题。

多角色场景

大场景的话细节问题还是有点多的,场景复杂了线条就开始碎了。

anime screenshot, haunted house reaction, three friends clinging together, brave girl with short hair in front smirking, two terrified boys behind one with tears one screaming, darkness with single flashlight beam, crisp linework, horror comedy atmosphere --ar 16:9 --stylize 750 --niji 7 
anime screenshot, motorcycle sunset ride, leather jacket guy with slicked back hair driving, girl with flowing auburn hair holding his waist eyes closed smiling, coastal road with ocean view, wind effects, bold outlines, freedom journey atmosphere --ar 16:9 --stylize 750 --niji 7 
two snowmen building a tiny snow-baby together, proud parent expressions, all wearing matching striped scarves, snowy backyard with warm house window glow background, wholesome family atmosphere --chaos 5 --ar 16:9 --stylize 400 --niji 7 
dual-wielding rogue sliding beneath the claws of a massive mechanical golem, sparks and debris flying, abandoned clockwork factory interior, cyan light from shattered windows, dark fantasy concept art, painterly brushstroke style, masterpiece, ethereal glow effect, mystical atmosphere, backlighting, dynamic composition --chaos 5 --ar 16:9 --stylize 400 --niji 7 

中式的话有点难形容,那种感觉很难说,还是差不少,有这个需求直接用即梦吧。学了但学得很杂,在中式场景用中文提示词效果会更好(但时不时男女不分):

anime screenshot, night garden lantern viewing, two sisters in layered hanfu walking slowly, elder with updo in deep blue, younger with loose hair in pale pink, red lanterns along path, reflection in still pond, rich dark palette with warm lantern glow, crisp defined lines, sisterly intimacy atmosphere --ar 16:9 --stylize 750 --niji 7 

特写中景

好消息是经测试提示词确实比以前可控,至少红蓝双眼没给我紫的了:

close-up of heterochromia eyes, one eye crimson red one eye ice blue, snowflakes on eyelashes, winter breath visible, ethereal lighting, dreamy atmosphere, masterpiece, ultra-detailed --ar 16:9 --niji 7 

水下质感光影好,如果对材质、形体、物种要求多了,卡就不好抽了。

merman with silver scales sinking into ocean depths, long dark hair floating upward, eyes closed peacefully, arms spread wide, fabric remnants drifting, anime illustration style, masterpiece, ultra-detailed, dramatic underwater lighting, dreamy melancholic atmosphere --ar 16:9 --niji 7 
a fierce female knight with long black hair in braids, wearing silver plate armor with fur cape, holding a battle axe, standing in snowy mountain pass, fantasy RPG character art style, game CG, realistic anime rendering, masterpiece, cinematic lighting, detailed textures --chaos 5 --ar 16:9 --stylize 400 --niji 7 

环境背景

rust belt abandoned industrial zone, red brown oxidized steel structures against grey overcast sky, skeletal crane silhouettes, empty warehouses with broken windows, rain puddles reflecting rust tones, limited palette of oxide red and steel grey, desolate wide landscape shot, anime illustration style, masterpiece, ultra-detailed, flat overcast diffused lighting, industrial decay atmosphere --ar 16:9 --niji 7 
young prince awakening family crest magic circle embedded in palace floor, lion emblem at center with heraldic detail, noble script around border spelling ancient oath, gold inlay in white marble texture, royal robes with cape, throne room, anime illustration style, masterpiece, ultra-detailed, regal golden glow, ancestral power atmosphere --ar 16:9 --niji 7 
glacial ice palace in arctic twilight, structures carved from blue white ice, aurora borealis green as only color accent in purple blue sky, perfect reflections in frozen sea, crystalline geometric architecture, cool palette with single warm accent, extreme wide frozen vista, anime illustration style, masterpiece, ultra-detailed, aurora and twilight mixed ethereal lighting, frozen majesty atmosphere --ar 16:9 --niji 7 

质感纹理

对东方质感有了更深的了解,但大多数时候还是偏向日系。手指细节改善了很多,不过仔细看还是有瑕疵:

eastern princess with black hair in elaborate hanfu hairstyle, golden phoenix hairpin with dangling jade beads, holding silk folding fan with painted peony, wearing layered hanfu robes with cloud brocade patterns, wide sleeves with golden trim embroidery, anime illustration style, masterpiece, ultra-detailed, dramatic rim lighting, magical elegant atmosphere --ar 16:9 --niji 7 

物理质感和光泽感有所提升:

knight commander with blonde hair French braid, silver winged helmet, holding longsword with cross guard, wearing full plate armor with engraved rose patterns, red cape with gold lion emblem, chainmail visible at joints, anime illustration style, masterpiece, ultra-detailed, dramatic rim lighting, magical elegant atmosphere --ar 16:9 --niji 7 

啊,用来做人物设定真是太棒了。结合 NBP 会有非常多玩法。

ice queen with platinum blonde hair in crown braid, diamond tiara with icicle points, holding frozen scepter with snowflake crystal, wearing white fur-trimmed cape over silver gown with frost pattern beading, crystalline shoulder armor pieces, anime illustration style, masterpiece, ultra-detailed, dramatic rim lighting, magical elegant atmosphere --ar 16:9 --niji 7 
noble prince with silver hair in ponytail, platinum crown with sapphire gems, holding ceremonial longsword with dragon motif guard, wearing white military jacket with gold braiding and epaulettes, intricate medal decorations, black leather gloves with silver buckles, anime illustration style, masterpiece, ultra-detailed, dramatic rim lighting, magical elegant atmosphere --ar 16:9 --niji 7 
armored paladin holding radiant shield against a descending fallen angel with tattered black wings, divine light clashing with dark energy, cathedral ruins in background, dark fantasy concept art, painterly brushstroke style, masterpiece, ethereal glow effect, mystical atmosphere, backlighting, dynamic composition --chaos 5 --ar 16:9 --stylize 400 --niji 7 

景深虚化

我个人感觉 Midjourney 系的图片是最有电影感的,Niji V7 的景深效果也很不错。

witch brewing potion, face illuminated by glowing cauldron in focus, cluttered magic shop shelves blurred behind, floating ingredients soft in foreground, shallow depth of field, bokeh effect, anime illustration style, masterpiece, ultra-detailed, soft natural daylight, romantic fantasy atmosphere --ar 16:9 --niji 7 
chef plating dish, delicate garnish placement in sharp focus, busy restaurant kitchen blurred behind, steam wisps soft in foreground, shallow depth of field, bokeh effect, anime illustration style, masterpiece, ultra-detailed, soft natural daylight, romantic fantasy atmosphere --ar 16:9 --niji 7 
anime screenshot --ar 16:9 --seed  --stylize 750 --niji 7 

SREF CODE

Niji V7 和 Midjourney 的 Sref Code 可以共用,但如果是插画和动漫风格我觉得可以优先切换 Niji V7,线条更清晰细节更好。真实风格用 Niji V7 会有一种潮潮的线条不够真实的感觉。

接下来图片的风格差异会比较大,决定它们差异的主要是 Sref code。有很多非常有趣的 Sref Code,获取方式我之前写过,大家也可以去我的同名的 IMA 知识库里搜索。

Medium shot of Balinese dancer mid-pose, elaborate golden headdress with frangipani, dramatic eye makeup and arched fingers, batik sarong in motion, temple stone carvings behind, ceremonial grace captured, bold flat vector style, saffron yellow and lavender tones, decorative ornate detail --ar 16:9 --sref  --niji 7 
Oversized ramen bowl taking up entire table, tiny person climbing noodles like mountain, chopsticks as giant logs, soft boiled egg as boulder, steam clouds swirling dramatically, absurd scale contrast, quick doodle aesthetic, energetic colored lines on cream background, humorous exaggeration --ar 16:9 --sref  --niji 7 
Breakfast table from overhead view, hands reaching for toast, sunny side up eggs on dotted plate, orange juice in cute character mug, monstera leaf in corner, checkered tablecloth, whimsical doodle style, bright blue and yellow dominant, thick black outlines, textured grain finish --ar 16:9 --sref 4280355464 --niji 7 
A young woman with windswept hair standing by the seaside, lighthouse in distance, wild grasses and coastal flowers, soft ocean breeze, vintage printmaking style, muted blue and coral tones, linen texture, hand-drawn linework --ar 16:9 --sref  --niji 7 

总的来说,Niji V7 相比前代还是有明显进步的。杂质和冗余元素控制得更好了,线条更加流畅,风格选择也更加多元。输出的图片质量有肉眼可见的提升。当然,它仍存在一些不够遵循提示词的情况和细节问题,期待后续版本带来更多惊喜。

我的使用建议是,不必执着于单一工具,可以将 Niji V7 与其他 AI 绘图工具结合使用。比如先用 Niji V7 生成风格独特的人物角色和环境设定图,再交给 NBP 做各种分镜和构图延展,再结合视频工具进行动态处理。这样无论是分镜图、场景图还是商用广告图,都能更高效地完成。

好啦本期分享就到这里,如果觉得有趣、有用,期待你的猛猛三连鼓励阿真,下期见~

也给欣欣我点个赞吧喵~

阿真没写的中文翻译我来写!

供参考哦~

一、 基础角色原生图(不带 Sref 风格码)

  • 元气樱花少女

    • 原文: a cheerful anime girl with long pink twintails, sparkling magenta eyes, excited smile showing teeth, cherry blossom hair pins, pink gem earrings, pink lace choker, wearing pink sundress, standing under a blooming cherry blossom tree in a Japanese garden, petals floating in the air, stone lantern and koi pond in background, modern anime style, clean linework, vibrant pink color theme, fresh spring atmosphere, bright natural lighting --chaos 5 --ar 16:9 --stylize 400
    • 翻译: 一个阳光活泼的动漫少女,扎着粉色长双马尾,双眸闪烁着洋红色光芒,露出牙齿的灿烂笑脸。她佩戴着樱花发夹、粉色宝石耳坠和蕾丝颈带,穿着粉色夏日吊带裙,站立在日式庭院中盛放的樱花树下。背景里花瓣漫天飞舞,石灯笼与锦鲤池交相辉映。现代动漫风格,线条干净明快,充满活力的粉色调,洋溢着清新的春日气息与明亮的自然光影。
  • 酷系滑板少年

    • 原文: a cool anime boy with messy silver hair, rosy wind-chapped cheeks, confident side glance, wearing navy blue knit beanie with pompom, reflective silver ski goggles on forehead, cream cable knit turtleneck sweater, red plaid wool scarf, holding snowboard, mountain peak visible behind, anime illustration, clean detailed rendering, soft natural lighting, cozy winter atmosphere, nostalgic retro ski aesthetic --chaos 5 --ar 16:9 --stylize 800 --niji 7
    • 翻译: 一个酷酷的动漫少年,留着凌乱的银发,双颊因寒风吹拂透着微红,眼神带着自信的侧睨。他戴着海军蓝毛球针织帽,额头上架着反光的银色滑雪镜,身穿奶白色粗棒针高领毛衣,围着红格子羊毛围巾,怀抱滑雪板,背景隐约可见巍峨的山峰。动漫插画风,渲染精细,光线柔和自然,营造出舒适的冬日氛围与怀旧复古的滑雪美学。
  • 矮人符文匠

    • 原文: a weathered male dwarf runesmith with wild grey beard with glowing runes braided in, intense orange eyes reflecting forge fire, concentrated gruff expression, wearing heavy leather apron over chainmail with burn marks, holding hammer crackling with runic energy, molten metal floating in magical pattern, underground forge background with rivers of lava and ancient stone carvings, semi-realistic digital painting style, detailed rendering, RPG character concept art aesthetic, mystical industrious atmosphere --chaos 5 --ar 16:9 --stylize 400 --niji 7
    • 翻译: 一位饱经风霜的男性矮人符文匠,狂野的灰色胡须中编织着闪烁微光的符文,炽热的橙色眼眸中映照着锻造炉的火光,表情严肃而深沉。他穿着带有灼烧痕迹的沉重皮革围裙和锁子甲,手握噼啪作响、充满符文能量的锻造锤,液态金属在空中呈魔法阵态流动。背景是遍布熔岩河流与古老石刻的地下锻造场。半写实数字绘画风,RPG 角色原画质感,充满神秘且勤勉的工业氛围。


二、 不同艺术风格尝试

  • 童话绘本风:双胞胎姐妹

    • 原文: twin sisters holding hands, one in pink dress one in mint dress, discovering a hidden door covered in ivy and morning glories, forest clearing scene, children’s book illustration style, watercolor texture, soft pastel color palette, whimsical and magical atmosphere, gentle warm lighting, storybook art --chaos 5 --ar 16:9 --niji 7
    • 翻译: 牵着手的双胞胎姐妹,一个穿着粉色裙子,一个穿着薄荷绿裙子,在林间空地发现了一扇被常春藤和牵牛花覆盖的秘密之门。童话绘本插画风格,带有细腻的水彩质感,柔和的马卡龙色调,充满了奇幻而瑰丽的想象力,配以温柔的暖光。
  • 野性美学:蛮族女王

    • 原文: portrait of barbarian queen with wild dark brown windswept hair, fierce hazel eyes with gold flecks, tribal tattoo on cheekbone, bone and fang necklace, grey mammoth fur draped over one shoulder, battle paint smudges, harsh dramatic lighting, untamed savage beauty atmosphere --chaos 5 --ar 16:9 --stylize 400 --niji 7
    • 翻译: 蛮族女王的肖像,深褐色的长发在风中乱舞,琥珀色的双眼中闪烁着金点,颧骨上刻着部落纹身。她戴着骨头与利齿串成的项链,肩披灰色猛犸象皮,脸上带着战斗后的涂料痕迹。光影强烈且具戏剧感,展现出一种原始、野性且不被驯服的美感。
  • 东方超现实:紫晶白虎

    • 原文: a magnificent white tiger with piercing blue eyes, prowling through ancient wisteria grove, hanging purple flower cascades, surreal deep purple amethyst mountains behind, silver mist rising, midnight blue starry sky, Chinese traditional landscape painting meets surrealism, fantasy dreamscape aesthetic, hyper-detailed 3D render style, cinematic composition, ethereal mystical atmosphere, vibrant saturated colors --chaos 5 --ar 16:9 --stylize 800 --niji 7
    • 翻译: 一只双目湛蓝、气势磅礴的白虎,正穿行在古老的紫藤林间,四周悬挂着如瀑布般的紫色花串。远方是超现实的深紫色紫水晶山脉,银雾升腾,头顶是午夜蓝的星空。中国传统山水画与超现实主义的碰撞,梦幻般的奇境美学,极高精度的 3D 渲染感,电影级构图,氛围空灵神秘,色彩绚丽饱和。
  • 极简主义:小象浇花

    • 原文: a baby elephant holding a watering can, tending to colorful flowers, simple garden scene, flat illustration style, kawaii, cute cartoon style, simple bold outline, cheerful and encouraging atmosphere --chaos 5 --ar 16:9 --niji 7
    • 翻译: 一只小象拎着洒水壶,正在照料五颜六色的花朵。简约的庭院场景,扁平插画风格,走可爱(Kawaii)卡通路线,拥有简洁粗重的轮廓线,氛围欢快且治愈。


三、 氛围感与复杂场景

  • 电影感:巫师炼金

    • 原文: witch brewing potion, face illuminated by glowing cauldron in focus, cluttered magic shop shelves blurred behind, floating ingredients soft in foreground, shallow depth of field, bokeh effect, anime illustration style, masterpiece, ultra-detailed, soft natural daylight, romantic fantasy atmosphere --ar 16:9 --niji 7
    • 翻译: 正在调制药剂的女巫,焦点落在被发光坩埚映亮的脸庞上,背景中凌乱的魔法商店货架被虚化,前景中漂浮的材料呈现柔焦效果。浅景深和大光圈虚化,动漫插画风格,大师级作品,细节极其丰富,配合柔和的自然光,营造出浪漫奇幻的氛围。
  • 复古 16-bit 像素风

    • 原文: a cute chibi girl with pink twin tails, sparkling black eyes, winking playfully, wearing frilly magical girl dress with star wand, casting sparkle magic mid-jump, dynamic floating pose, small shadow below, accompanied by cute white bunny mascot with bow, solid bright purple background, retro 16-bit pixel art style, visible dithering halftone shading technique, arcade game character aesthetic, vibrant primary colors, nostalgic video game sprite art --chaos 5 --ar 16:9 --stylize 800 --niji 7
    • 翻译: 一个可爱的 Q 版粉发双马尾女孩,眨着俏皮的大眼睛,穿着华丽的魔法少女裙,挥舞星形魔杖在跳跃瞬间施展星光魔法。动态悬浮姿势,脚下带有小阴影,身边跟着一只戴蝴蝶结的白色萌兔。纯亮紫色背景,复古 16 位像素画风,可见明显的抖动算法与半色调阴影纹理,充满怀旧街机游戏角色的生命力。


四、 Sref Code 风格实验

  • 复古版画:海边少女

    • 原文: A young woman with windswept hair standing by the seaside, lighthouse in distance, wild grasses and coastal flowers, soft ocean breeze, vintage printmaking style, muted blue and coral tones, linen texture, hand-drawn linework --ar 16:9 --sref 1003864270 --niji 7
    • 翻译: 秀发随风舞动的年轻女子立于海边,远方是孤零零的灯塔,脚下遍布野草与海滨小花。海风徐徐,复古版画风格,采用低饱和的蓝色与珊瑚色调,带有亚麻布纹理,笔触呈现细腻的手绘线条感。
  • 夸张趣味:巨型拉面

    • 原文: Oversized ramen bowl taking up entire table, tiny person climbing noodles like mountain, chopsticks as giant logs, soft boiled egg as boulder, steam clouds swirling dramatically, absurd scale contrast, quick doodle aesthetic, energetic colored lines on cream background, humorous exaggeration --ar 16:9 --sref 1160301490 --niji 7
    • 翻译: 巨大的拉面碗占满了整张桌子,一个微缩的小人像爬山一样攀登着面条,筷子如同巨型原木,溏心蛋好似磐石,蒸汽云剧烈盘旋。荒诞的比例对比,充满活力的速写涂鸦美学,在奶白色背景上交织着动感的彩色线条,极具幽默夸张感。

📌 转载信息
原作者:
StellaFortuna
转载时间:
2026/1/15 10:23:36

把城市名替换成你所在的城市,或者你想去的城市,期待看到你们的作品

第一弹

Present a clear, side miniature 3D cartoon view of [YOUR CITY] tallest buildings. Use minimal textures with realistic materials and soft, lifelike lighting and shadows. Use a clean, minimalistic composition showing exactly the three tallest buildings in Sopot, arranged from LEFT to RIGHT in STRICT descending height order. The tallest must appear visibly tallest, the second must be clearly shorter than the first, and the third must be clearly shorter than the second.
All buildings must follow accurate relative proportions: if a building is taller in real life, it MUST be taller in the image by the same approximate ratio. No building may be visually stretched or compressed.
Each building should stand separately on a thin, simple ceramic base. Below each base, centered text should display:
Height in meters — semibold sans-serif, medium size
Year built — lighter-weight sans-serif, smaller size, directly beneath the height text
Provide consistent padding, spacing, leading, and kerning. Write "YOUR CITY NAME" centered above the buildings, using a medium

第二弹

Create a high-detail 3D isometric diorama of the entire China, where each state is represented as its own miniature platform. Inside each state, place a stylized, small-scale 3D model of that state's most iconic landmark. Use the same visual style as a cute, polished 3D city diorama: soft pastel colors, clean materials, smooth rounded forms, gentle shadows, and subtle reflections. Each landmark should look like a miniature model, charming, simplified, but clearly recognizable. Arrange the states in accurate geographical layout, with consistent lighting and perspective. Include state labels and landmark labels in a clean, modern font, floating above or near each model.

在 cherry studio 的助手配置里面加上自定义参数,关闭流式输出开关,cs 版本升级到最新

{"aspectRatio": "16:9", "imageSize": "4K"} 

4K 高清大图,17M,放在了 cf 的存储桶里

https://img.0rzz.ggff.net/china.png 20M


📌 转载信息
原作者:
Triceratops2017
转载时间:
2026/1/6 12:18:47

阿里云的 无影云电脑

注册就可以领取 200 核时 可以一键部署 ai 绘画


每天签到可以获得 10 核时
点兑换功能 去 B 站搜索找兑换码 再领 200 核时
用 16g 显存部署 每小时消耗 30 核时 领取的 410 核时 可以玩 10 个小时
然后每天签到还可以用 20 分钟左右 可以用 api 调用 如果安全的话可以弄个共享 api 站 集合大家的核时 岂不是可以长期使用?


📌 转载信息
转载时间:
2026/1/6 12:17:28

提示词如下

马年发财手机壁纸设计。主色调为喜庆的红色和金色,背景采用传统的中国风花纹,呈现浓烈的节庆气氛。画面主体为一匹神气十足的骏马,正面视角,马头昂起,眼神坚定,展示出强烈的力量感和速度感。马身的线条圆润流畅,结合中国传统的剪纸风格,形成鲜明的对比,体现出浓厚的中国文化底蕴。马儿背后有金色祥云和锦缎飞舞,象征着财富和吉祥。金色局部点缀,给人一种如同福气降临的感觉,仿佛迎接着新一年的好运。画面左上角以大号书法字体写着“2026”,右下角用小号的手写体“新春快乐”两字,均为亮眼的金色,传递着浓浓的春节气氛。整体风格热烈、吉祥、喜庆,非常适合春节期间的手机壁纸,充满了年味和祝福。```

📌 转载信息
原作者:
LinuxKurt
转载时间:
2026/1/6 11:41:42

(\ _ /)
( ・-・)
/ っ   依然是节气海报,因为就这个最没约束。唯一约束是要符合百货商场。

& 因为离赤道较近上头不准海报用雪元素。。

第①步¦随便想想,然后随手掏来桌面的废纸和笔随意划个大概。

第②步¦把 线稿 + Prompt 丢 AI 随缘炼金 原图保真参数用 low 效果更佳。

虽说 MJ 审美也许更高但给 gpt 写 Prompt 省脑细胞。

第③步¦也把选中的图喂给 AI 要文案

最后套上常规文字 LOGO 模板等即可。

(\ _ /)
( ・-・)
/ っ 然后放在一旁不要发送,该吃吃该摸摸,不要比还在传统素材网找素材的不会科学上网的同事更快交稿 / 等快到截稿期再交稿、但要预留上级想 DIY 文案的时间、但不要预留足够推翻整张图重新设计的时间。


📌 转载信息
原作者:
Qiner
转载时间:
2026/1/4 18:38:14

![[第二弹] Nano Banana 新玩法!附带提示词!(懒人必备...)](https://xiaohack.oss-cn-zhangjiakou.aliyuncs.com/typecho/2025/11/2671742069.png!mark)
Nano Banana 图片生成,又有新玩法,并且非常火爆,这里重新整理了第二波 Nano Banana 神级指令词,希望对大家有用!
第一次:
[bspost cid="5068"]
Nano banana 使用渠道: https://imini.com/nano-banana

玩法一:运动风个人写真 (哄女朋友开心)

运动风个人写真提示词
提示词:

参考我上传的照片,输出一张高分辨率彩色艺术人像摄影,与照片不同的姿势,真实摄影。 主体是一位年轻女性,高马尾造型,几缕鬓发自然垂落,身材高挑,腰臀比例完美,马甲线清晰,双腿修长。她身穿白色高腰紧身运动背心,灰色短款瑜伽裤、白色长筒袜与白色老爹鞋,造型简洁又具力量感。 人物坐在白色桌面的边缘,身体微微向镜头扭转,右手后撑在桌面上保持平衡,左手举着一只切割纹理的玻璃杯,轻轻靠近锁骨位置。左腿弯曲收于身前,右腿自然向前下方伸展,脚尖轻点地面。她的头部微微上扬,眼神柔和自信,唇角轻扬,微笑自然不过分夸张,流露出轻松与优雅。 环境为纯白色摄影棚空间,墙地一体,极简留白。一张白色桌子是画面核心道具,桌面与墙面反射自然光形成高调干净的视觉平衡。玻璃杯与桌面上呈现出细微的高光反射与窗格投影,使画面更具空间感与真实光影层次。 光线来自左前上方的大型漫射窗光作为主光,整体为高调明亮的自然光氛围,皮肤高光细腻且层次分明。右侧以大白板反光轻柔填充,平衡暗部细节;右后方加入极弱的轮廓光,勾勒出发髻与肩背线条,使人物从背景中轻微分离。桌面上斜向延伸的窗格阴影柔和自然,为纯白场景增添节奏与层次。整体对比度中等,白平衡略偏冷,控制高光不过曝,保持通透而克制的质感。 带有轻微的雕塑感与时尚的克制力量。搭配 85mm 定焦镜头;机位略低,与桌面形成 5–10° 的轻微俯视角度。微提对比与清晰度,保持自然与质感的平衡。 能看到微小毛孔与柔细汗毛;颈部与肩膀的体积光顺滑自然;玻璃杯表面的高光折射逼真;窗格阴影的几何形状清晰而柔和。整体叠加轻微胶片颗粒,提升真实肤感与现代时尚氛围。 比例为 3:4 。

玩法二:But love pray for me

But love pray for me*

这个玩法最近蛮火的,非常有创意。并且效果极好。

提示词:

上传图片的人物向前伸出拳头,拳头居于画面中间位置,无名指上戴着一枚金色戒指。戒指左侧有白色手写体英文“But love”,右侧有白色手写体英文“Pray for me”,两段英文与戒指处于同一水平线且紧密挨着。背景呈暖色调,整体风格为写实摄影,画面长宽比协调,营造出一种聚焦于拳头和戒指细节的视觉效果。

玩法三:苹果高管风 工作照

苹果高管风 工作照提示词

“LinkedIn-style executive headshot, half-body (chest-up); face straight to camera, body slightly angled; calm, confident micro-smile. Wavy hair neatly styled; black sleeveless dress; minimalist professional look. Tight framing to emphasize facial features; eyes tack-sharp; natural skin texture. Soft directional lighting with subtle catchlights. Background: light-gray smooth gradient with clean separation. ( Create 4 variations with small pose/expression changes.) --no text, logos, busy patterns, heavy retouching, clutter 。

ps:刚才这个提示词是生成四宫格照片的,如果大家只想要一张照片,把括号里的文字删掉就可以啦~”

玩法四:韩系照片 堪比海马体效果

韩系照片 堪比海马体效果提示词

提示词:(上传图片最好清晰一点)

Studio portrait of a young East Asian woman with long black hair, wearing an off-shoulder cream - colored top. She holds strawberries and grapefruit slices as props. Soft natural lighting, clean white background, fresh makeup with pink blush, 8K ultra - realistic, cinematic composition, aesthetic and minimalist.Professional studio lighting, softbox illumination, off - shoulder cream top, flowing black hair, strawberries and grapefruit slices as props, clean white background, shallow depth of field, 8K resolution, ultra - detailed skin texture, fresh makeup with pink blush and glossy lips, cinematic color grading, aesthetic composition, minimalist photography.

玩法五:Q 版萌萌头像

Q 版萌萌头像提示词

提示词:

把这张照片设计成一个 3D 风格 Q 版 APP 图标,保留人物特征,尤其是精细的五官。采用柔和且鲜明的打光风格,使其呈现出精致的高品质效果。角色应略微超出应用图标的边框,以增强 3D 效果和趣味性。确保人物五官与原照片一致,风格应给人一种值得收藏且萌趣可爱的感觉,类似于迷你手办或黏土人。

玩法六:衣服穿搭

衣服穿搭提示词

提示词:

选择图 1 中的人,让他们穿上图 2 中的所有服装和配饰。在户外拍摄一系列写实的 OOTD 风格照片,使用自然光线,时尚的街头风格,清晰的全身镜头。保持图 1 中人物的身份和姿势,但以连贯时尚的方式展示图 2 中的完整服装和配饰

Nano Banana 使用方法:

1.打开 imini: https://imini.com/nano-banana

2.上传图片+输入指令等待图片生成即可。

Nano Banana 使用方法

课程内容目录:

1-AIGC与课程概述

2-让你未来5年高速增长的Al认知课-摄影人篇1

3-让你未来5年高速增长的AI认知课-摄影人篇2

4-初期问题汇总(如能正常使用可不看!)

5-Midjourney与其他Al制图工具对比优缺点

6-如何注册?与注意事项!

7-生成你的第一个AI图像作品!

8-第一次使用MJ必须设置的地方有哪些?

9-如何让AI听懂你的话?

10-如何进一步提升AI作品质量并优化?

11-如何生成摄影/设计/产品等不同领域的图像?

12-起手-提示词的底层万能写作句式是什么?(上)

13-调整-提示词的底层万能写作句式是什么?(中)

14-丰富-提示词的底层万能写作句式是什么?(下)

15-不同风格的图像如何生成?

16-图像进阶生成方法-垫图如何使用?

17-怎样控制垫图的还原与想象?图像权重功能的使用

18-怎样通过AI软件放大照片?从100万像素到3800万像素

19-人像摄影行业如何落地应用?mj作图+Al换脸

20-AI摄影如何100%还原客人或模特的脸

21-怎样用图片反向推导提示词?-describe命令的使用

22-不会写提示词?几个方法帮你解决!

23-图像尺寸如何修改?隐藏的命令参数都有什么?

24-V5模型改动细节说明-放大器-长宽比-文字描述

25-模型是什么?如何选择并合理使用MJ的模型?

26-用Al合成图像-融图的使用方法?

27-怎样把新元素融合进图像?

28-如何更好的控制AI听你指挥?

29-怎样去掉图像中不想要的元素?

30-如何更好的作出二次元和动漫风图片?niji5模型的使用

31-如何制作平铺背景图?V5-tile命令的使用

32-seed命令是什么?如何使用?

33-怎样合理保存并再次生成图像?如何批量下载?

34-社区规范、版权与账号说明
35......

链接:https://pan.baidu.com/s/1cgZQAA7wUkls9VdNDk_Lhw?pwd=p40m

昨天发布了ChatGPT-Midjourney的初始版本,不过当时只支持imagin/upscale/variation这三个操作,然后便火速将最好玩的describe/blend和图生图也支持了。现在也可以直接一键 docker 部署,方便至极。

开源地址: https://github.com/Licoy/ChatGPT-Midjourney

接下来的计划:

  • 支持界面配置 midjourney-proxy 服务
  • 支持类似于 discord 中的输入体验

? 有需要的小伙伴可以试试,部署一个只需要 3 分钟不到~
? ChatGPT-Midjourney 再更新,支持 imagin/upscale/variation/describe/blend 和图生图,可 Docker 部署
? ChatGPT-Midjourney 再更新,支持 imagin/upscale/variation/describe/blend 和图生图,可 Docker 部署1

MidJourney-Styles-and-Keywords-Reference-WWW
一个包含样式和关键词的参考资料,你可以在 MidJourney AI 中使用。还有一些页面显示了分辨率的比较,图像的权重,以及更多的内容!

A reference containing Styles and Keywords that you can use with MidJourney AI. There are also pages showing resolution comparison, image weights, and much more!

数据来源于: https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference

但我做成了网站,加载更快!

url: https://mj.aitool360.com/

MidJourney 样式和关键词的参考资料
MidJourney 样式和关键词的参考资料1