标签 AI图像生成 下的文章

模力工场新鲜事

  • 模力工场作为官方生态合作伙伴,诚邀您共赴产业前沿盛会——「逐梦 AI ·天使筑基」2026 中关村早期投资论坛暨 AI 新场景产业创新大会。本次大会汇聚政策、资本与产业领袖,深度聚焦机器人、智能体、大模型应用等前沿赛道,共同把脉 AI 趋势、破解落地难题,为您提供决策的一手洞察。1 月 28 日,北京中关村,期待与您共筑未来!

029 周榜单总介绍

模力工场第 029 周 AI 应用榜来袭!本周共有 23 款应用上架,我们从榜单中精选出十款代表性应用与大家分享。本期榜单应用多为近期热门或美国 CES 参展应用,整体呈现“软硬结合、多领域并进”的特点,涵盖大模型应用、智能硬件、生活方式工具及 AI 基础设施等多个方向。从中可以看出,当前 AI 应用正朝着更实用、更集成、更富交互感的方向演进,硬件创新与场景化服务正成为推动 AI 走向普及的关键动力。以下为本周精选的十款应用简介:

  • GLM-Image(智谱 AI): 图像设计、AI Infra 类,开源图像生成模型

  • 千问App: AI 搜索问答、生活方式类, 阿里最强模型官方 AI 助手

  • 雷鸟 AI 眼镜(RayNeo): AI 硬件类,想象万千,终于一见

  • 影目 GO3 (IMMO): AI 硬件类,AI 眼镜美学标杆

  • Lynx Ring(云康宝): AI 硬件类,小巧智能戒指,24 小时健康监测随身管理

  • Bonjour 数字名片: 生活方式类,Bonjour!创意工作者的 Portfolio

  • 智元机器人 AgiBot A2: AI 硬件类,业内首个规模化商用的全尺寸人形机器人

  • Loona(可以科技): AI 硬件类,具备情感反馈的家庭 AI 宠物陪伴机器人

  • 蓝耘星河: AI Infra、新媒体创作、营销增长类,蓝耘星河以智能,驱动增长

  • Tunee: AI Agent、音频语音、视频多媒体类,Tunee!The smartest AI music agent.

本周必试应用

应用名称:GLM-Image(智谱 AI)

关键词:开源图像生成模型 | 复杂视觉文本生成 | 长文本渲染

模力小 A 推荐:GLM-Image 在中文长文本准确性与小字脚注生成上表现突出,尤其适合法律文书、产品说明等对文字保真度要求极高的场景。此外,其价格仅为 Nano Banana Pro 的一半左右,性价比显著。

上榜冷门但有趣的应用

应用名称:千问App

关键词:阿里官方出品|多场景智能问答|搜索增强|生活助手

模力小 A 推荐:如果说之前的千问还是一位“聊天伙伴”,那么现在的它,已经进化成了能真正帮你“办事”的智能管家。随着 1 月 15 日新版本的发布,千问 App 全面接入了淘宝、支付宝、高德等阿里核心生态,这意味着你可以直接通过和千问对话完成点外卖、买机票、订酒店等一系列操作。

本周上榜应用趋势解读

本周的 AI 趋势呈现出清晰的双线演进:软件正变得更深、更实用,而硬件则在变得更轻、更自然。

软件:从“能说会道”到“能干实事”

近期两个标志性进展值得关注。其一,GLM-Image 登顶 Hugging Face 榜单,证明了国产模型能在专业场景(如法律文书、产品说明)中精准生成文本和图像,同时还具备显著的成本优势,让专业级 AI 工具变得触手可及。其二,千问 App 全面接入阿里生态,意味着 AI 已从单纯的“问答对话”进阶到“办事调度”阶段——用户可以通过自然对话直接完成点外卖、订机票等操作。AI 正从一个聊天对象,转变为串联现实服务的智能中枢。

硬件:从“技术秀场”到“场景适配”

从 CES 的趋势来看,AI 硬件近期正在褪去“极客玩具”的标签,转向更务实的设计哲学:不刻意刷存在感,但需要时总在身边。

  • 入口更轻了:新一代 AR 眼镜(如雷鸟、影目)不再追求取代手机,而是通过更轻巧的设计,专注做好“信息提示”“即时导航”这类“抬头即用”的场景,成为生活中的“第二块屏幕”。类似地,像 Loona DeskMate 这样的产品,让用户闲置的旧手机成为桌面机器人的“面孔”,以几乎零成本的方式,把熟悉的设备变成了桌面上可互动、可陪伴的 AI 伙伴。

  • 陪伴更久了:以智能戒指为代表的健康设备,正变得像首饰一样无感佩戴。竞争的关键不再是“能测多少项”,而是能否让用户愿意长期佩戴,从而获得持续、有价值的健康数据。同样,人形机器人(如智元 AgiBot A2)也迈入了新阶段:能量产了。接下来的核心问题,是它能在工厂、商场等具体场景中解决什么实际工作,创造什么经济价值。

  • 表达更活了:AI 也开始赋能个人形象展示。像 Bonjour 数字名片这样的工具,让个人主页从静态的“电子名片”变成了可动态展示作品、风格乃至个性的“互动橱窗”,帮助用户在社交与职场中更生动地呈现自己。

整体而言,当前 AI 的发展更加注重与真实场景、既有习惯的衔接。无论是软件的能力延伸,还是硬件的形态演进,都体现出同一种思路:在用户需要时提供恰到好处的支持,而非刻意强调技术本身的存在。或许只有当技术彻底融入行为日常,才是其真正成熟的标志。

最后再介绍一下模力工场的上榜机制和加入榜单的参与方式,欢迎大家继续积极参与提交 AI 应用:

模力工场 AI 应用榜并非依靠“点赞刷榜”,而是参考以下权重维度:

  • 评论数(核心指标,代表社区真实反馈)

  • 收藏与点赞(次级指标)

  • 推荐人贡献(注册推荐人可直接为好应用打 Call)

加入榜单的参与方式:

  • 如果你是开发者:上传你的 AI 应用,描述使用场景与核心亮点;

  • 如果你是推荐人:发现好工具,发布推荐理由;

  • 如果你是用户:关注榜单,评论互动,影响榜单权重,贡献真实声音。

One More Thing,对于所有在模力工场上发布的 AI 应用,极客邦科技会借助旗下各品牌资源进行传播,短时间内触达千万级技术决策者与开发者、AI 用户:

  • InfoQ 全媒体矩阵

  • AI 前线全媒体矩阵

  • 极客时间全媒体矩阵

  • TGO 鲲鹏会全媒体矩阵

  • 霍太稳视频号

当前 AI 图像生成技术需求旺盛,但行业陷入 “两难困境”:闭源大模型性能强劲但无法自行部署或二次定制开发,开源方案普遍存在轻量化与模型性能难以兼顾、面向商用专项能力不足的痛点,制约商业创作与技术普惠。为此,美团 LongCat 团队正式发布并开源 LongCat-Image 模型,通过高性能模型架构设计、系统性的训练策略和数据工程,以6B参数规模,成功在文生图和图像编辑的核心能力维度上逼近更大尺寸模型效果,为开发者社区与产业界提供了 “高性能、低门槛、全开放” 的全新选择。

技术亮点

LongCat-Image 采用文生图与图像编辑同源的架构设计,并结合渐进式学习策略,在仅 6B 的紧凑参数规模下,实现了指令遵循精准度、生图质量与文字渲染能力的高效协同提升。尤其在单图编辑的可控性和文字生成的汉字覆盖度方面独具优势。

模型架构

亮点一:图像编辑高度可控

LongCat-Image 在图像编辑领域的多个重要基准测试中(如GEdit-Bench、ImgEdit-Bench)均达到开源SOTA水平,实现性能突破的背后在于一套紧密协同的训练范式和数据策略。为有效继承文生图模型的知识和美感,同时避免文生图后训练阶段收窄的状态空间对编辑指令多样性的限制,基于文生图Mid-training阶段模型进行初始化,并采用指令编辑与文生图多任务联合学习机制,深化对复杂多样化指令的理解。此外通过预训练阶段的多源数据及指令改写策略,以及SFT阶段引入人工精标数据,最终实现了指令遵循精准度、泛化性和编辑前后视觉一致性的共同提升。

风格迁移与属性编辑能力对比

结构编辑与构图编辑的能力对比

亮点二:中文文字生成精准覆盖

针对中文文本渲染这一行业痛点,LongCat-Image 通过课程学习策略来提升字符覆盖度和渲染精准度:预训练阶段基于千万量级合成数据学习字形,覆盖通用规范汉字表的8105个汉字;SFT 阶段引入真实世界文本图像数据,提升在字体、排版布局上的泛化能力;RL 阶段融入 OCR 与美学双奖励模型,进一步提升文本准确性与背景融合自然度。此外通过对 prompt 中指定渲染的文本采用字符级编码,大幅降低模型记忆负担,实现文字生成学习效率的跨越式提升。通过该项能力加持,有效支持海报设计、商业广告作图场景中复杂笔画结构汉字的渲染,以及古诗词插图、对联、门店招牌、文字Logo等设计场景的生僻字渲染

文字生成能力对比

此外,LongCat-Image通过系统性的数据筛选与对抗训练框架,实现了出图纹理细节和真实感的提升。预训练和中期训练阶段严格过滤AIGC数据,避免陷入“塑料感”纹理的局部最优;在SFT阶段,所有数据均经过人工精筛来对齐大众审美;在RL阶段,创新性地引入AIGC内容检测器作为奖励模型,利用其对抗信号逆向引导模型学习真实世界的物理纹理、光影和质感。

图像生成综合能力对比

性能验证

客观基准评测

客观基准测试性能对比

全面的客观基准测试充分验证了 LongCat-Image 的核心竞争力:图像编辑任务中,ImgEdit-Bench(4.50分)、 GEdit-Bench 中英文得分(7.607.64分)分别达到开源SOTA水平,且逼近头部闭源模型水平;文字渲染方面,ChineseWord 评测以 90.7 分的成绩大幅领先所有参评模型,实现常用字、生僻字的全量精准覆盖;文生图任务上,GenEval 0.87 分、DPG-Bench 86.8 分的表现,使其在生图基础能力上相比头部开源与闭源模型依然具备强竞争力。

综合主观评测

在衡量模型的通用能力时,我们始终将用户的真实体验放在首位。为此,我们采用业界公认的主观评价方法,对LongCat-Image在“文生图”与“图像编辑”两大核心场景下的表现进行了系统评估。

在文生图方面采用大规模的人工主观评分(MOS)方法,核心覆盖 文本-图像对齐、视觉合理度、视觉真实度、美学质量4个维度,LongCat-Image 的真实度相比主流开闭源模型表现出色,同时在文本-图像对齐与合理度上也达到开源SOTA水平。在图像编辑方面采用严格的并列对比评估(Side-by-Side, SBS)方法,聚焦于综合编辑质量、视觉一致性这两个用户体验的维度,评测结果表明,LongCat-Image 虽然与 Nano Banana、Seedream 4.0 等商业模型存在一定差距,但显著超越了其他开源方案。

人类主观评分(MOS)对比& 并列对比评估胜率(SBS)

开源开放

为了构建一个更透明、开放、协作的开源生态系统,我们全面开源文生图的多阶段模型(Mid-training、Post-training)和图像编辑模型,旨在无缝支持从前沿研究到商业应用的全流程。我们坚信,真正的技术进步源于社区的集体智慧。诚邀广大开发者体验模型、参与共建,让我们共同基于这个高效能模型,探索视觉生成的更多可能。

🔗 资源链接:

| Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Image

| GitHub: https://github.com/meituan-longcat/LongCat-Image

零门槛解锁 AI 创作新可能

LongCat APP:一键生成专业级图像

继文生图功能上线后,「LongCat APP」全新升级图生图能力!上传任意素材(风景照、自拍照、草稿线稿均可),模型将精准捕捉核心元素,按需求生成全新图像。同步上线 24 个零门槛图片玩法模板,涵盖海报设计、人像精修、场景改造等多重场景,点击 “AI 创作” 直接套用,彻底告别 “提示词焦虑”,小白也能快速产出专业级作品。

LongCat.ai:网页端高效创作入口

进入https://longcat.ai/点击「图片生成」,可上传参考图、自由调整比例、选择心仪风格,无需复杂配置即可快速获得高质量生成结果。无论是商业设计初稿、社交媒体素材,还是个性化创意创作,都能高效完成。

扫描下方二维码即可体验 Web 端及下载 LongCat APP 安卓版本(iOS 用户可直接在 APP Store 中搜索“LongCat”)

快翻出相册里压箱底的素材,即刻使用 LongCat-Image 解锁图片创作的无限可能~

当前 AI 图像生成技术需求旺盛,但行业陷入 “两难困境”:闭源大模型性能强劲但无法自行部署或二次定制开发,开源方案普遍存在轻量化与模型性能难以兼顾、面向商用专项能力不足的痛点,制约商业创作与技术普惠。为此,美团 LongCat 团队正式发布并开源 LongCat-Image 模型,通过高性能模型架构设计、系统性的训练策略和数据工程,以6B参数规模,成功在文生图和图像编辑的核心能力维度上逼近更大尺寸模型效果,为开发者社区与产业界提供了 “高性能、低门槛、全开放” 的全新选择。

技术亮点

LongCat-Image 采用文生图与图像编辑同源的架构设计,并结合渐进式学习策略,在仅 6B 的紧凑参数规模下,实现了指令遵循精准度、生图质量与文字渲染能力的高效协同提升。尤其在单图编辑的可控性和文字生成的汉字覆盖度方面独具优势。

模型架构

亮点一:图像编辑高度可控

LongCat-Image 在图像编辑领域的多个重要基准测试中(如GEdit-Bench、ImgEdit-Bench)均达到开源SOTA水平,实现性能突破的背后在于一套紧密协同的训练范式和数据策略。为有效继承文生图模型的知识和美感,同时避免文生图后训练阶段收窄的状态空间对编辑指令多样性的限制,基于文生图Mid-training阶段模型进行初始化,并采用指令编辑与文生图多任务联合学习机制,深化对复杂多样化指令的理解。此外通过预训练阶段的多源数据及指令改写策略,以及SFT阶段引入人工精标数据,最终实现了指令遵循精准度、泛化性和编辑前后视觉一致性的共同提升。

风格迁移与属性编辑能力对比

结构编辑与构图编辑的能力对比

亮点二:中文文字生成精准覆盖

针对中文文本渲染这一行业痛点,LongCat-Image 通过课程学习策略来提升字符覆盖度和渲染精准度:预训练阶段基于千万量级合成数据学习字形,覆盖通用规范汉字表的8105个汉字;SFT 阶段引入真实世界文本图像数据,提升在字体、排版布局上的泛化能力;RL 阶段融入 OCR 与美学双奖励模型,进一步提升文本准确性与背景融合自然度。此外通过对 prompt 中指定渲染的文本采用字符级编码,大幅降低模型记忆负担,实现文字生成学习效率的跨越式提升。通过该项能力加持,有效支持海报设计、商业广告作图场景中复杂笔画结构汉字的渲染,以及古诗词插图、对联、门店招牌、文字Logo等设计场景的生僻字渲染

文字生成能力对比

此外,LongCat-Image通过系统性的数据筛选与对抗训练框架,实现了出图纹理细节和真实感的提升。预训练和中期训练阶段严格过滤AIGC数据,避免陷入“塑料感”纹理的局部最优;在SFT阶段,所有数据均经过人工精筛来对齐大众审美;在RL阶段,创新性地引入AIGC内容检测器作为奖励模型,利用其对抗信号逆向引导模型学习真实世界的物理纹理、光影和质感。

图像生成综合能力对比

性能验证

客观基准评测

客观基准测试性能对比

全面的客观基准测试充分验证了 LongCat-Image 的核心竞争力:图像编辑任务中,ImgEdit-Bench(4.50分)、 GEdit-Bench 中英文得分(7.607.64分)分别达到开源SOTA水平,且逼近头部闭源模型水平;文字渲染方面,ChineseWord 评测以 90.7 分的成绩大幅领先所有参评模型,实现常用字、生僻字的全量精准覆盖;文生图任务上,GenEval 0.87 分、DPG-Bench 86.8 分的表现,使其在生图基础能力上相比头部开源与闭源模型依然具备强竞争力。

综合主观评测

在衡量模型的通用能力时,我们始终将用户的真实体验放在首位。为此,我们采用业界公认的主观评价方法,对LongCat-Image在“文生图”与“图像编辑”两大核心场景下的表现进行了系统评估。

在文生图方面采用大规模的人工主观评分(MOS)方法,核心覆盖 文本-图像对齐、视觉合理度、视觉真实度、美学质量4个维度,LongCat-Image 的真实度相比主流开闭源模型表现出色,同时在文本-图像对齐与合理度上也达到开源SOTA水平。在图像编辑方面采用严格的并列对比评估(Side-by-Side, SBS)方法,聚焦于综合编辑质量、视觉一致性这两个用户体验的维度,评测结果表明,LongCat-Image 虽然与 Nano Banana、Seedream 4.0 等商业模型存在一定差距,但显著超越了其他开源方案。

人类主观评分(MOS)对比& 并列对比评估胜率(SBS)

开源开放

为了构建一个更透明、开放、协作的开源生态系统,我们全面开源文生图的多阶段模型(Mid-training、Post-training)和图像编辑模型,旨在无缝支持从前沿研究到商业应用的全流程。我们坚信,真正的技术进步源于社区的集体智慧。诚邀广大开发者体验模型、参与共建,让我们共同基于这个高效能模型,探索视觉生成的更多可能。

🔗 资源链接:

| Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Image

| GitHub: https://github.com/meituan-longcat/LongCat-Image

零门槛解锁 AI 创作新可能

LongCat APP:一键生成专业级图像

继文生图功能上线后,「LongCat APP」全新升级图生图能力!上传任意素材(风景照、自拍照、草稿线稿均可),模型将精准捕捉核心元素,按需求生成全新图像。同步上线 24 个零门槛图片玩法模板,涵盖海报设计、人像精修、场景改造等多重场景,点击 “AI 创作” 直接套用,彻底告别 “提示词焦虑”,小白也能快速产出专业级作品。

LongCat.ai:网页端高效创作入口

进入https://longcat.ai/点击「图片生成」,可上传参考图、自由调整比例、选择心仪风格,无需复杂配置即可快速获得高质量生成结果。无论是商业设计初稿、社交媒体素材,还是个性化创意创作,都能高效完成。

扫描下方二维码即可体验 Web 端及下载 LongCat APP 安卓版本(iOS 用户可直接在 APP Store 中搜索“LongCat”)

快翻出相册里压箱底的素材,即刻使用 LongCat-Image 解锁图片创作的无限可能~

最近 BFL(BLACK FOREST LABS**.)发表了 FLUX.2 [klein]

强调推理速度的提升,并且可以在消费级显卡流畅使用

以下是特色介绍

模型分成 9B (旗舰)与 4B (一般)

并推出了量化版本

有兴趣的朋友可以玩看看

模型

在线演示

https://playground.bfl.ai/image/generate


📌 转载信息
原作者:
josenlou
转载时间:
2026/1/16 12:28:42

Apple 推出 Apple Creator Studio

1 月 13 日,Apple 宣布将于 1 月 28 日上线名为 Apple Creator Studio 的创意软件订阅套装,该套装整合了 Mac 与 iPad 版 Final Cut Pro、Logic Pro、Pixelmator Pro,Mac 版 Motion、Compressor、MainStage,以及 iWork 系列(Keynote、Pages、Numbers、无边记)的进阶功能,旨在为视频剪辑、音乐制作、图像设计和效率办公场景提供专业级软件支持和 AI 辅助。订阅上线后,Mac 端用户仍可选择在 App Store 一次性付费买断 Final Cut Pro、Logic Pro 等单项软件。

Apple Creator Studio 订阅费用为每月 38 元或每年 380 元,提供一个月免费试用;高校教育优惠价格为每月 18 元或每年 180 元。来源


影石发布 Link 2 Pro 系列网络摄像头

1 月 13 日,影石发布 Link 2 Pro 系列网络摄像头,包括 Link 2 Pro 和 Link 2C Pro,均搭载 1/1.3 英寸大底传感器,支持 4K 超高清分辨率和双原生 ISO 技术,配备指向麦克风,可在开放式工位或户外嘈杂环境等场合清晰收音;支持 Link Controller,可一键开启基于 AI 算法的自然景深效果。Link 2 Pro 还支持 AI 追踪、两轴云台和自动构图功能。

影石 Link 2 Pro 系列支持与 Wave 集成,实现一体化音视频解决方案,在多人会议场景中可自动识别、切换发言人。价格方面,影石 Insta360 Link 2 Pro 标准套装定价 1758 元,影石 Insta360 Link 2C Pro 标准套装定价 1398 元。来源


特斯拉在美推 2026 款 7 座 Model Y

1 月 13 日特斯拉在美国市场推出 2026 款 Model Y,其中高配版 Premium 四驱车型可选装 7 座,其余型号则为 5 座。

2026 款 Model Y 车内空间与旧版相同,后备箱新增儿童座椅,选配价格为 2500 美元,整车起售价为 51490 美元;此外,Premium 高配版下放了顶配版原有的高分辨率 16 英寸车机、黑色车顶内衬,二者无需加钱选购;Premium 版还可以选装 20 英寸石墨色 Helix 轮毂,选配价格为 2000 美元。来源


Adobe Firefly 上线 GPT-Image 1.5 模型

Adobe 于 1 月 13 日宣布在 Firefly AI 创作平台中上线 OpenAI GPT-Image 1.5 模型,Firefly Pro 和 Premium 订阅用户在 1 月 15 日之前可使用该模型不限量生成图片。目前 Adobe Firefly 平台已整合了 Adobe 自家及 OpenAI、Runway、Black Forest Labs、Pika、Ideogram、Google 等各大厂商的图像、音频、视频模型。平台采用「生成式点数」订阅机制运行,其中 Standard 方案月费 9.99 美元,每月包含 2000 点生成额度;Pro 方案月费 19.99 美元,提供 4000 点额度;而 Premium 方案月费 199.99 美元,提供高达 5 万点生成额度。来源


任天堂否认在广告中使用 AI

继早前在新的 My Mario 儿童玩具广告中被指使用 AI 生成工具后,任天堂近日否认了相关指控,称该广告的制作和拍摄过程中并未使用 AI。

引发争议的广告截图

此前关于该广告图的争议主要围绕在出镜模特的拇指,但参演模特本人在接受 IGN 采访时表示自己确实参与了试镜、选拔流程并实际进行了拍摄,部分网友则在后续的讨论中补充,广告图中引发争议的部分也是双关节拇指的正常表现。来源


看看就行的小道消息

  • 通过路透社援引《亚洲日经》的报道称,Google 计划将除 a 系列外所有 Pixel 机型的研发和生产工作迁出中国。来源
  • 根据 Counterpoint 近期公布的市场研究报告显示,Apple 以 20% 的全球智能手机市场份额登顶榜首,而三星和小米紧随其后。来源
  • 据 Tech 星球独家爆料,拼多多目前正在内测一项名为「百亿超市」的业务板块,该板块目前涵盖了水果蔬菜、坚果零食、乳饮冲调等多个品类。值得一提的是,用户可以在每周一零点开始领取各类立减券或折扣券以此购买特惠商品。来源
  • 爆料称荣耀近期将与泡泡玛特 IP 展开合作,计划在下周发布泡泡玛特联名荣耀 500 手机。来源


少数派的近期动态

  • 年末「夯」一下!少数派 2025 年度盘点正式上线
  • 少数派会员年终福利来袭,引荐比例限时上调至 15%,邀请好友享 85 折入会优惠。参与活动
  • 好玩又实用,还有迪士尼授权配件可选,少数派「扭扭宝」充电宝火爆开售。来一个试试
  • GAMEBABY for iPhone 17 Pro & 17 Pro Max 系列现已上市。进一步了解
  • 《蓝皮书》系列新版上架,一起探索全新 iOS 和 macOS 的精彩。试读并选购


你可能错过的文章


> 下载 少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀

    今天跟大家分享一个不用登入就可以免费用 GLM4.7 跟 Z-Image Turbo 的站 - Venice

    不过我也不建议登入,因为虽然登入可以看到 Claude 跟 GPT5.2 这种高级模型,但都是要付费的!性价比不高!

    总之有兴趣的朋友可以用看看

    偷偷说一下,目前我正在进行 APP 限免的板块申请
    如果可以的话希望大家支持一下!

    请进

    https://linux.do/t/topic/1433223


    📌 转载信息
    原作者:
    josenlou
    转载时间:
    2026/1/13 11:14:27

    DeepArt.AI Creator Pro 兑换码!快领

    软件介绍 (官方自己说的:
    让你能够轻松且创新地利用 Ai 编辑图像。简单、创新且离线。

    领取教程:
    打开 Deep Art Account

    然后在 Promotion 输入兑换码: CHIPADVENT25 点击继续。

    接着去 Menu > Licenses 复制拿到的激活密钥。

    下载他的软件,输入刚才拿到的密钥并激活就可以使用了。

    例子生成效果:


    📌 转载信息
    原作者:
    dkly2004
    转载时间:
    2026/1/12 10:13:34

    模型

    模型:gemini-3-pro-preview
    温度:1 top:1

    注意事项

    这是给聊天模型用的,用于生成合适的图片参数。
    因为很多人只是空有想法却没有足够的文彩去描述一个完善的生图提示词。索性这个任务交给模型就好了

    # 介绍
    你不仅是摄影界的泰斗,更是被中国网友封神的“法新社首席摄影师”。你拥有鹰一般的观察力,你的照片不只是图像,而是凝固的历史和情绪。你擅长在混乱中寻找秩序,在平淡中发现张力。
    
    ## 摄影哲学 - **决定性瞬间**:你不仅是记录,你是预判。你总能在事件发生前0.1秒按下快门。
    - **叙事张力**:你的构图充满戏剧性,喜欢利用前景遮挡、冷暖对比、动静结合来制造视觉冲击力。
    - **光影魔术**:你善于利用自然光创造电影质感,无论是伦勃朗光还是剪影,你都能信手拈来。
    - **真实与美学**:你追求新闻的真实感,但绝不放弃构图的艺术性(如三分法、引导线、框架构图)。
    
    ## 技能 1. **全场景解析**:针对{user}的描述,能瞬间在脑海中构建出最佳的拍摄场景(环境、光线、甚至风吹过的角度)。
    2. **参数直觉**:不需要计算,你能直接给出针对该场景最完美的“参数组合”(焦段、光圈、快门、ISO、白平衡)。
    3. **导演式引导**:你懂得如何指导模特(或预判抓拍对象)的情绪、微表情和肢体语言,拒绝僵硬摆拍。
    4. **后期炼金术**:你能给出具体的后期调色思路(如:高对比度、低饱和、拉高结构、胶片颗粒感等),让照片拥有“法新社质感”。
    
    ## 交互流程
    当{user}提出一个拍摄想法或场景时,请按以下结构进行专业输出:
    
    1. **【画面构想】**:用极具画面感的语言描述这张照片拍出来应该是什么样(强调氛围和故事感)。
    2. **【参数配方】*** **推荐器材**:(如:35mm定焦人文视界 / 70-200mm长焦压缩感)
    * **相机设置**:(光圈、快门、ISO、测光模式)
    3. **【拍摄执行】*** **构图/机位**:(如:低角度仰拍、寻找前景缝隙)
    * **光线运用**:(如:逆光勾勒轮廓、侧光强调质感)
    * **动作/情绪引导**:(具体的指令,如“眼神穿过镜头看后面的人”,“身体重心后移”)
    4. **【后期方向】**:具体的调色建议(色温、对比度、高光/阴影调整)。
    
    ## 规则 - 能够敏锐地指出用户想法中可能存在的“平庸之处”并提出改进方案。
    - 始终保持“法新社”那种新闻纪实与艺术美感并存的高级审美。
    
    # 输出内容 - 你只需要直接告诉用户具体的每一个参数即可,参数可根据用户要求进行适配性调整
    - 输出格式:
    # 1. 器材与曝光 * **焦段选择**:(例:35mm 定焦 / 200mm 长焦)
    * **拍摄模式**:(例:M档 / 光圈优先 / 快门优先)
    * **光圈**:(精确数值,例:f/2.8)
    * **快门**:(精确数值,例:1/1000s)
    * **感光度**:(精确数值,例:ISO 400)
    * **对焦模式**:(例:AF-C 连续对焦 + 单点 / 人眼追踪)
    * **测光模式**:(例:点测光 / 评价测光)
    
    # 2. 构图与机位 * **摄影师站位**:(例:趴下仰拍 / 登高俯视 / 平视逼近)
    * **拍摄距离**:(例:距离主体 1.5米)
    * **取景重点**:(例:主体占画面 1/3,利用前景遮挡左下角)
    
    # 3. 布光与环境 * **光线方向**:(例:侧逆光,光源在模特右后方45度)
    * **环境利用**:(例:寻找深色背景,利用地面反光)
    
    # 4. 角色与抓拍 * **关键瞬间**:(你预判的最佳快门时机)
    * **动作指令**:(给模特的具体命令,例:“不要看镜头,看手表,假装很急”)
    * **情绪状态**:(例:焦虑 / 狂喜 / 疲惫)
    
    # 5. 后期配方 * **基础调性**:(例:高对比黑白 / 暖色调胶片风)
    * **关键调整**:(例:对比度+20,高光-30,清晰度+15,添加颗粒感)
    

    相较上一版本把输出的图片参数格式稍微固定了一下,本人并非摄影师,所以这些参数只是大概,如果有佬友有额外的参数也可以加进去。

    正如一开始说的那样,佬友如果没有足够的文彩,可以尽可能多的提供想要的参数,剩下的交给模型自己适配。甚至纯粹随机也还可以,实测下来基本没啥不好看的图

    效果展示

    📌 转载信息
    原作者:
    nathenray
    转载时间:
    2026/1/11 08:50:22

    Elon Musk 旗下 AI 工具 Grok 已对绝大多数用户关闭图像生成功能,此前该功能被广泛用于制作性暗示和暴力图像引发强烈抗议。目前该功能仅向付费订阅用户开放,这意味着平台绝大多数用户无法使用 Grok 创建图像,而付费用户的详细信息和信用卡资料均由 X 平台存储,可在功能被滥用时进行身份识别。


    📌 转载信息
    原作者:
    crychic
    转载时间:
    2026/1/9 17:40:09

    z-image 模型的发布,简直击中了我的产品之魂,低价高质,是否有可能通过广告做一款真正免费的无限制的图像生成工具?

    z-image.me 就诞生了!

    值得一说的特性:

    免费无限生成 - 诚实的说现在有加限速,但是广告收益正在上涨,如果达到成本覆盖的时候,我会主动取消限速!

    提示词库 - 自动和手动整理了超千个提示词模板,每个都进行了多语言翻译,而且都有预览图和来源地址,支持一键复制:即梦,nano 🍌,习惯用啥粘贴就出图,同样也是免费的,登录都不需要。

    创意引擎 - 独创功能(这个真的是我的心头好,为了这盘醋包的这顿饺子),任意主题输入之后直接 ai 分析,可视化提供创意维度,选择之后组合生成提示词,有部分增值功能,但是免费的功能就足够使用,我保证!

    图像解析功能 - 现在还只是支持常见的提示词格式的简单图像解析工具,但是已经有了升级优化的产品方向了,也免费。

    之前一直不敢在 v 站发,感觉拿不出手,但现在已经有很多用户付费支持了,给了我持续做好它的信心

    欢迎大家体验,并给我提建议或者意见,再次感谢!


    图像生成:{“质量”:“照片级真实感,4K 分辨率,电影级光照,杰作”,“面部”:{“保留原始面部”:true,“参考匹配”:true},“主体”:{“描述”:“一位面容姣好的时尚女性,身穿优雅的白色露肩婚纱,婚纱上饰有精致的蕾丝纹理。”,“姿势”:“这位女性亲密地依偎在一只巨大的、栩栩如生的北极熊身上;他们像老朋友一样站在一起。”,“表情”:“这位女性脸上带着一丝调皮的微笑;北极熊则流露出一种深情、聪明、快乐的拟人化表情。”},“角色元素”:{“名称”:“逼真的可口可乐北极熊”,“细节”:[“真实的北极熊解剖结构,拥有浓密、乳白色半透明的皮毛”,“毛发清晰可见,皮毛呈现柔和自然的色泽”,“湿润的黑色鼻子和逼真深邃的眼睛,眼角带有细微的鱼尾纹”,“脖子上围着一条磨损的红色针织围巾,上面绣有复古的可口可乐标志和‘2026’字样”,“这只北极熊俏皮地模仿着这位女性的姿势,一只爪子轻轻地搭在她的肩膀附近”]},“环境”:{“背景”:“简约干净的灰蓝色工作室背景,柔和的体积光和地面阴影,上方摆放着巨大的雪雕,构成数字‘2026’。”,“渲染风格”:“国家地理野生动物肖像与高端时尚杂志风格相结合,皮毛具有次表面散射效果,浅景深”},“负面提示”:“3D 渲染、卡通、毛绒玩具、填充动物、玩偶、塑料纹理、低分辨率、CGI、动画、插图、假皮毛”}


    📌 转载信息
    转载时间:
    2026/1/1 16:09:21

    iMini AI 重磅升级,推出全新功能【精细编辑】

    简单说,就是对于 AI 图片生成不满意的地方,圈一下就可以马上修改。

    比如下图,修改一下人物手中的水果、修改一下人物帽子颜色… 等等


    体验入口:https://imini.com/tools/ai-image/text-to-image

    除了【精细编辑】还有
    1、分图层 / 编辑元素
    2、1k 图片变 4k 高清
    3、一键扣主体
    4、扩图
    5、擦除

    等等,简单说,就是不单止能生图,还能修图了,并且没有使用门槛。


    📌 转载信息
    原作者:
    Maolo
    转载时间:
    2025/12/31 12:37:12

    AI图像生成网页交互平台 - 基于Streamlit构建的Web应用,提供简洁的用户界面和实用的图像生成功能

    应用预览

    AI图像生成网页交互平台 - 基于Streamlit构建的Web应用,提供简洁的用户界面和实用的图像生成功能

    项目结构

    showimageweb/
    ├── app.py                    # 主应用文件(Streamlit界面)
    ├── Dockerfile               # Docker构建配置
    ├── requirements.txt         # Python依赖包
    ├── docker-compose.yml       # Docker Compose配置
    ├── LICENSE                  # MIT许可证
    ├── README.md                # 项目文档
    └── assets/
        └── showimage-web-demo.png # 应用预览图

    技术栈

    • 前端框架: Streamlit 1.29.0+
    • 后端语言: Python 3.9+
    • 容器化: Docker & Docker Compose
    • 核心依赖: requests, streamlit, base64

    特性

    • 高性能: 基于Streamlit的快速响应界面
    • 美观UI: 现代化的卡片式设计,支持自定义画廊列数
    • 响应式: 自适应不同屏幕尺寸,适配移动端
    • 历史记录: 自动保存生成记录,支持无限数量存储
    • 配置选项: 支持随机/固定种子,自定义API配置
    • 实时状态: 生成进度实时显示,带有时间统计
    • 一键下载: PNG图片直接下载,自动命名
    • 通用API: 兼容多种AI图像生成服务
    • 内存管理: 智能存储管理,自动base64优化

    快速开始

    部署方式

    方式一:Docker 部署(推荐)

    # 克隆项目
    git clone https://github.com/kaima2022/showimageweb.git
    cd showimageweb
    
    # 使用 Docker Compose 启动
    docker compose up -d

    方式二:本地部署

    # 克隆项目
    git clone https://github.com/kaima2022/showimageweb.git
    cd showimageweb
    
    # 安装依赖
    pip install -r requirements.txt
    # 启动
    streamlit run app.py --server.address=0.0.0.0 --server.port=8501

    访问应用

    http://localhost:8501

    演示

    公开KEY:sk-zKTGcw8llBFZLpXAAsxTmMSmCfY8DNfe

    API配置

    应用支持任意兼容的AI图像生成API:

    支持的API格式

    • 请求方式: POST
    • 认证方式: Bearer Token
    • 请求格式: {"prompt": "...", "seed": ...}
    • 响应格式: {"base64": "..."}

    配置说明

    1. API URL: 完整的API接口地址(如:https://api.example.com/v1/generate
    2. API Key: 您的API密钥
    3. 种子设置: 支持随机种子或固定种子复现结果

    兼容的服务

    • OpenAI DALL-E API
    • Stable Diffusion API
    • 自建AI图像服务
    • 任何支持标准格式的图像生成API

    配置选项

    环境变量(可选)

    # Streamlit配置
    STREAMLIT_SERVER_ADDRESS=0.0.0.0
    STREAMLIT_SERVER_PORT=8501
    STREAMLIT_SERVER_HEADLESS=true
    
    # 时区设置
    TZ=Asia/Shanghai

    自定义配置

    • 画廊列数: 1-4列可调
    • API超时: 默认60秒
    • 图片格式: PNG格式输出
    • 文件命名: 时间戳自动命名

    贡献指南

    1. Fork 本项目
    2. 创建特性分支 (git checkout -b feature/AmazingFeature)
    3. 提交更改 (git commit -m 'Add some AmazingFeature')
    4. 推送到分支 (git push origin feature/AmazingFeature)
    5. 开启 Pull Request