移动αρρ -底部中间 ai
给灵犀发送:四月的青团真香

領到后去移动αρρ -我的-我的咔劵-去使用。
例如領到 7 亓加赠劵,沖 20 实到 27 。

当前情况:

  • iphone 12
  • 系统版本 18.7.2
  • 运营商:移动
  • 非省电模式(省电模式好像会关闭 5G)
  • 电池健康度:76(不知道有没有关系)

问题描述:

打开手机网络 4G,必须开关飞行模式才显示 5G,才有网。

导致我现在买早饭,坐地铁,拿快递,付停车费(从锁屏状态打开)都得切一下很烦,等他自己反应过来很慢

从想法到上线,我几乎不再需要团队

一、我现在是怎么做开发的

我是一个独立 iOS 开发者。

没有团队。
没有设计师。
没有产品经理。

但最近,我连续做了多个 App,而且速度比过去快很多。

原因只有一个:

AI 改变了整个开发方式。


二、过去 vs 现在

以前开发一个 App:

  • • 反复切换角色(开发 / 设计 / 产品)
  • • 写代码慢
  • • 上线周期长(动辄几周甚至更久)

现在变成:

想法 → 开发 → 上线 → 迭代

整个过程被极大压缩。


三、我实际在用的 AI 工具

我日常的组合是:

  • • Claude:写代码 + 架构设计
  • • ChatGPT:问题分析 + 产品思考
  • • Cursor / Copilot:加速编码

AI 在我这里,不是“辅助工具”,而是:

一整个虚拟团队

四、AI 在开发中的真实作用

1. 写代码(核心)
  • • 生成 Swift / SwiftUI 代码
  • • 重构复杂逻辑
  • • 解决 bug

很多以前要查半天的东西,现在直接问 AI。


2. 产品思考

我不再纠结“这个功能要不要做”。

而是问:

  • • 这个产品的核心价值是什么?
  • • 最小可用版本是什么?

👉 AI 帮我把想法“压缩”。


3. UI / UX

以前要开 Figma,现在基本不需要了。

流程变成:

描述 UI → AI 给方案 → 直接转 SwiftUI → 调整

效率非常高。


4. App Store 上架

AI 帮我搞定:

  • • 描述文案
  • • 关键词(ASO)
  • • 截图文案

原来要花半天,现在 10 分钟搞定。


5. 内容与增长

这一步很多人忽略,但其实最关键。

我用 AI 来做:

  • • 推特内容
  • • 技术博客
  • • 产品介绍
  • • 营销文案

开发 + 增长,合成一个闭环。


五、我的真实开发流程

现在基本固定为:

Step 1:想法压缩

用 AI 快速搞清楚:

  • • 用户是谁
  • • 核心问题是什么
  • • 最小版本是什么

Step 2:快速做 v1
  • • 只做核心功能
  • • 不追求完美
  • • 忽略边界情况

目标是:

几天内上线

Step 3:尽早上线

只要“能用”,就上线。

不是完美,而是:

可验证

Step 4:持续迭代

上线之后再:

  • • 优化体验
  • • 增加功能
  • • 修复问题

全部继续用 AI 辅助。


六、真实案例

我最近做了两个产品:

  • • 一个语音记录 App(SpeechNote)
  • • 一个订阅管理工具(DueSight)

它们的共同点是:

快速做 v1 → 快速上线 → 持续优化

如果没有 AI,这个速度几乎不可能。


七、AI 做不到的事情

AI 很强,但也有边界:

  • • 不懂产品品味
  • • 没有长期判断
  • • 不知道什么不该做

这些,仍然是开发者的核心价值。


八、最重要的一点

AI 并没有让我变成更强的程序员。

它让我变成了:

一个更快的执行者

而在今天:

速度,比完美更重要

九、这对普通开发者意味着什么?

如果你是独立开发者:

你不再需要:

  • • 团队
  • • 完美代码
  • • 长周期开发

你真正需要的是:

  • • 清晰的思考
  • • 快速执行
  • • 持续迭代

AI 给的是:

杠杆

你怎么用,是关键。


十、最后

我们正在进入一个新的时代:

一个人,可以完成过去一个团队的工作

不是因为工具变了。

而是:

效率被彻底放大了。


👇 我正在做的事情

我正在持续做:

  • • AI + App 出海
  • • 独立开发实践
  • • 一人公司探索

如果你也在做类似的事情,可以一起交流。


📱 我的产品

语音记录 App(SpeechNote)
美区:
https://apps.apple.com/us/app/jingnote/id6759850635

订阅管理工具(DueSight)
美区:
https://apps.apple.com/us/app/duesight-subscription-tracker/i...


2026.04.21 17:56
沪·嘉松中路

今天,OpenAtom openKylin(以下简称“openKylin”)社区正式推送openKylin 2.0 SP2第三次更新升级。本次更新重点针对近期用户反馈较多的软件商店部分软件安装报错、磐石架构-用户模式下装包体验等问题进行优化,涉及系统更新、开明软件包格式、KARE兼容环境、软件商店、不可变系统等多个系统关键模块。另外,在保障系统整体安全和稳定的前提下,为尽量满足用户便捷装包的诉求,磐石架构本次新增了在用户模式下通过dpkg直接安装软件包的功能,将有效提升装包速度。

系统安装与升级方式
方式一:从openKylin官网下载最新镜像进行安装(适用于新用户或想重新安装系统的用户);
方式二:前往系统设置—“更新”界面,按提示完成系统更新(适用于已安装旧版本的用户);
方式三:打开维护模式(设置-关于-点击5次UKUI Logo-侧边栏找到维护模式并打开),通过终端运行以下命令进行更新,升级后退出维护模式(适用于开发者):
sudo apt update
sudo apt upgrade

主要功能优化及缺陷修复
功能优化
【磐石架构】针对dpkg进行改造,在保障安全和稳定的前提下,支持在用户模式通过dpkg命令直接安装或卸载软件包等操作。

【开明软件包格式】新增对固定浏览器插件目录的处理,确保插件能被正确加载;新增对离线包导出功能的支持;优化了Kazam、Gnote、SMPlayer等多个开明版应用在安装后无法启动或运行异常的问题;通过设置GTK_THEME环境变量优化了在不同系统和环境下的界面显示。
【KARE运行环境】新增跨环境文件映射机制、kare试安装(try-install)支持、旧目录迁移等特性;优化终端交互体验、应用覆盖安装后文件拷贝逻辑、软件更新失败处理机制、宿主机驱动挂载时序、应用自更新流程、tini更新机制等。
【系统更新】优化数据迁移功能,提升磐石架构-系统更新的稳定性和用户数据安全性。

主要缺陷修复
【软件商店】修复用户模式下安装分区编辑器失败,报错0003,日志提示依赖解析失败的问题【软件商店】修复用户模式下安装字体管理器提示依赖解析失败0002的问题【软件商店】修复用户模式下安装gimp,报错 0003的问题【软件商店】修复部分用户反馈的在商店更新wps办公软件失败的问题【软件商店】修复用户模式下安装迅雷失败的问题【软件商店】修复用户模式下安装奇安信浏览器报错失败的问题【软件商店】修复用户模式下安装 battle软件失败的问题【软件源】修复无法安装texlive-full论文排版软件的问题【软件源】修复安装tauri font-manager等软件时提示缺少依赖libwebkit2gtk4.1.0的问题【外设支持】修复已安装扫描仪驱动后扫描应用无法识别扫描仪的问题

除了首页时间流和侧栏的精选展位,少数派 Matrix 社区还有很多优秀内容因条件所限无法得到有效曝光,因此我们决定重启 Matrix 周报,并在此基础上添加更多社区内容、作者投稿新玩意呈现给大家。

上周社区速递:派友挑战不沉迷手机的周末、未来视野显示器与 MT6000 路由器


💬一派热议

在第 271 期一派讨论《别让它吃灰:你为家里的「淘汰设备」找到了哪些新用途?》中,共有 467 名派友热情参与,十分感谢!

只有1/4的派友出二手

Alsosent(+31) 旧手机改了供电,做了电车导航车机;旧平板改了供电,做了电子相册,配合旧的音响做音乐播放器🥹根本舍不得扔掉。

Keyluces(+30) 变成电子日历。

啊權權權兒(+13) 把 iPhone 6 塞在了相框裡顯示時間,就是一直插著電,電池很容易鼓包,不過換電池倒也便宜和方便。

云中的小白(+13) 文石小白马被我捏爆了,找来了十年前的 KPW3,刷了安卓,装了微信读书。只要下载离线内容,翻页很快,也不怎么卡顿,目前已经作为文石替代品了。比用网页微信读书效果好太多了。

棉花老闆(+10) 用 iPod 听播客。好处有两个方面:一是可以不去碰手机,二是可以玩手机的同时播客声音不被其他软件打断。

碱水结(+7) 现在感觉一开始就得少买,出售和处置(像移动电源就是)也是成本……特别老旧的带屏设备的话有点难强行找用途,眼睛就两只。新的场景也跑不太动或者不太稳定。

噼哩啪啦砰(+4) 初中攒饭钱买的 GBA,最近决定买点套件改个锂电 + 高亮屏。昨天拿出来在太阳底下玩了会儿,决定只改锂电了。

原装的那个 TFT 反射屏才最有味道,哈哈。

记得喝岩浆(+4) 去年家里收拾东西把老豆 20 多年前配的电脑翻了出来,把机箱翻新改造成了 NAS,还有一套不知名的音箱,搭配同样是被翻出来的一台 vivo X9 实现了 AirPlay。

瑞士伯尔尼(+2)

  1. XPS 9360,八代 U,现在装了 Ubuntu 很流畅,基本应用也都有。
  2. Touch 5 降级到 iOS 9,装个网易云音乐,底部装个底座蓝牙连接音响,可以听个小音乐。
  3. 旧手机慢慢的都出了,毕竟新手机也不少。
  4. 13 年装的 ITX 电脑,升级到 i7 给父亲看球用,CNTV 很流畅。17 年左右配的台式机给母亲上网用。自己的台式机,从 2600 升级到 5600,显卡从 1060 升级到 6650,现在不打游戏了也很够用。
  5. 还有旧硬盘和内存、电源,淘宝买了个支架装了个裸装的 NAS(飞牛),配合极空间使用,极空间不想当下载机纯备份。

HarryQin(+1) 两部 iPhone 4 拆掉做了装裱。

别的电子产品最后几乎都去了闲鱼,很少有能再重新利用的说法。

📢:下一期的一派讨论是数码圈日经话题《周末挑战赛:来一场春季赛博大扫除》,欢迎来聊。

🔥一周热评

来自文章 《派早报:低空司回应无人机「起飞难」》

↳ 💬 关于「7 家电商平台因幽灵外卖被罚没 35.97 亿元」的热议:

宽松回不去(+0) 现在点外卖就找在线下吃过的店/大品牌连锁了,每单价格提升到 17-25 之间 ,都能保证干净,省下的医药费就约等于收入了,毕竟有些外卖那个条件,实在是……

噼哩啪啦砰(+0) 买了摩托以后,看到没环境照片但是想吃的外卖店我都会过去瞅一眼(用练车作为理由驱动自己出门)。很遗憾,大部分店都不太干净……

↳ 💬 关于「Claude Opus 4.7 token 消耗量显著提高」的热议:

Alei(+0) 文言文该复活了。

↳ 💬 关于「谷歌 IPv6 流量占比首次过半」的热议:

HarryQin(+0) 感觉用户端几乎没 IPv6 的说法,倒是商业和运营商方面已经铺开了。

来自文章 《AI 输出中的 ** 是怎么来的:谈中文 Markdown 强调标记的渲染问题》

haper(+5) 个人感觉加粗、斜体这些文本格式影响还好,代码块、引用等等更是重灾区,经常出现给的回答一半正文一半引用,阅读和复制都是灾难。

话说回来有没有好办法能约束一下🤔,尝试过在 GPT、Gemini 等模型里加自定义 Rule,效果也一般。

来自文章 《你好,我是一名「火腿」》

dawncold(+2) 核准码不在有效期不要紧,生产设备时那个码是有效的就行。

斯迪(+2) 看到妈妈以为在偷听敌台忍不住笑出了声

来自文章 《「新人报到」手冲咖啡入门指北:如何建立兴趣、建立信心》

写小黑文的Alex(+6) 1、「当然我也见过拼配罗豆的,美其名曰复古怀旧」,这话有误,其实意式拼配豆配罗豆是基操,增加意式风味,罗豆和阿拉比卡并不是非黑即白的关系,风味不同罢了,不是说有罗豆就是不好。

2、不知道喜欢什么风味的咖啡豆可以从两个极端出发,一个埃塞,就是常见的酸味咖啡,一个曼特宁,就是偏苦的风味,可以试了之后往中间靠。

3、磨豆机比较重要,别贪便宜买砍豆机或者是陶瓷研磨芯的。

4、C40 作为标杆不是因为单一产品有多好,当然也是最早的优秀磨豆机,后来的都是摸着 C40 过河,C40 有先发优势。C40 最大的优势是品控好,就像一把尺子,不同的 C40 磨出来的豆子粒径分布非常接近,这样你买了豆子之后可以按照豆子商家给的推荐刻度和水温得到最佳风味。

5、细粉决定了咖啡风味的感觉是对的。

6、厨房秤最大的问题是没有计时功能,或者有计时的时间不够,一分多钟自己关机了,就很尴尬。

7、xBloom 在火起来之前国内最低的时候两千出头,确实非常出色,甚至可以取代一般咖啡师。

短叶丝兰(+2) 新豆先做冷萃,然后就知道自己手冲冲得有多歪了🥹。

来自文章 《派早报:Canva AI 2.0 发布、Anthropic 发布 Claude Opus 4.7 模型等》

↳ 💬 关于「OpenAI 升级 Codex,新增多项实用功能」的热议:

xuchunyang(+0) 第一次用 computer use,很惊艳。估计不能有太多交互步骤,不然太费 Token 了,因为每次都需要截图。

keleus(+0) 新版的 Codex 支持纯聊天,不指定项目和工作台的模式了,相当于是 GPT 客户端但工具调用版。

↳ 💬 关于「大疆发布 Osmo Pocket 4 云台相机」的热议:

keleus(+0) 这一代的续航和过热表现提升了,然后智能追踪能力提升了。其他的和 Pocket 3 变化不大,有 Pocket 3 的可以不用升级(虽然其实画面效果也有提升,直出的程度感觉高了)。

星海之心(+0) 等 4 Pro 吧,感觉 Pocket 4 和 Pocket 3 没啥太大区别。

↳ 💬 关于「Apple 钱包支持用支付宝开通 NFC 交通卡」的热议:

HarryQin(+0) 地府通依旧坚挺。

至尊宝宝(+0) 难道兄弟们没有点开看,你添加有几个城市的全国交通卡都是支付宝的选项么……其实只是把原来的充值付费模式更改为支付宝授权委托代扣,先乘车再付款……本质还是 NFC 的交通卡,只是改变了付款方式而已……

来自文章 《城市漫步指南:在沿海宜居小城,过一段不赶时间的日子》

kitlorovers(+6) 北海强行吃波士顿龙虾也是抽象行为,想起被华强捅的摊主:你瞧瞧这现在哪有瓜呀?这都是大棚里的瓜。

Morris_Xxx(+2) 看到吃波龙有点蚌埠住,堪比在厦门吃海南大金芒。

来自文章 《众测 | 让通勤路上的你「重装简行」:邀你一同体验 tomtoc T77 双肩包》

诺维好茨基(+7) 我算是一个包包收集爱好者,我现在用书包有以下几个场景:

1. 如果只是上班带饭为了应付安检,我会用一个透明 PVC 包,里面也可以装一点其他东西。

2. 上下班需要背电脑,我会用那种束口的简易双肩包背一个电脑,包里面有多个分隔用于装不同的东西,这个束口袋周末爬山徒步也能用,2-3 天的短途出行也够用了。

3. 3 天以上的出行,2 中的束口包不够用,我会再加一个折叠圆筒包,基本够装 1 个星期的东西。

4. 出门超过 2 天,我会在包里放一个折叠胸包,这样主要行李放在酒店的时候,我可以把随身用品放在这个胸包里。

5. 如果需要带行李箱,我会同时把 2 中的简易双肩包和行李箱一起随身使用,同时把 3、4 中的包放在行李箱里作为拓展和不同场景使用。

6. 同时我还有一个双肩+圆筒两用的包,这个包是众筹的某台湾品牌,但是我基本没怎么使用过。

目前 1、2、3、4 基本覆盖了我 100% 的场景,所以我基本不怎么用行李箱,还是以 2 中的简易束口包为主。我感觉你们可以出一个包含 1、2、3、4 甚至加上 5、6 的一整个箱包解决方案。

anchorrose(+2) 我做过 11 年外勤,每天背双肩包超五小时。最后我留下的是小鹰光线,背板非常舒服,特别是夏天。当然一天就 1-2 小时场景,什么都行。

Taki(+2) 自费购买用户来了。之前用过 T64,对于短途室内通勤场景没什么问题,但是工作性质导致全年超过三分之二的时间都在出差,T77 这包真的极大地缓解了我的容量焦虑。后仓笔记本电脑+iPad+掌机,前仓小件衣物+NuPhy 键盘,tomtoc 自家的配件包+随行小包全部塞进去还绰绰有余,其余零散的配件放在前袋,移动电源和需要快取使用的物件放在左侧口袋。背感也很舒适,塞满东西之后拎着十分重,但是背上后扣上胸部锁扣,长时间背负也不会累。最后就是面料了,这个不用多说了,防水性能一流,也很耐脏。

来自文章 《译文|Tahoe 的图标令人难评》

鼓手高(+36) 没想到设计教材中所有的禁忌都能完美地在苹果公司推出的最新系统中找到典型。

苹果去年推出的 3 类主要操作系统(iOS 26、iPadOS 26 以及 macOS Tahoe)在我看来,都是用一块液态玻璃,遮住了系统级的交互和设计地狱。

iOS 26,我最明显的感受就是最开始的版本极其粗糙。虽然曾经 iOS 7 和 iOS 11 由于大面积改版也有许多不成熟,但实际体验下来我觉得 iOS 26 的粗糙程度前所未有(我手上有一台 iOS 7.0.4 的 iPod 和一台 iOS 11 的 iPhone X),因为除了 Bug 层出不穷,系统的 UI 和圆角是非常混乱随意的。当然迭代到 26.2 之后稳定性还是值得肯定的。

2013 年,Jony Ive 大刀阔斧推进的扁平化贯穿了 iOS 7-9 时代,极细的字体营造了轻盈的视觉美感。但可读性差成了讨论的焦点,之后苹果不断加大字重,虽然一定程度上影响了美感,却真正解决了易读性问题。iOS 26 呢?超粗的 SF 字体叠加液态玻璃,弱化甚至取消选项栏间的分隔线,成功让易读性重新成为摇摆不定的难题。

iPadOS 26,解放了生产力,窗口自由调整,明面上是这样的。如今 iPad 给了你三个选择:要么用前台调度和多窗口模式激发生产力,要么简单模式别想分屏。可当你拿走键盘鼠标,为触控而量身定制的分屏和 Slide Over 操作设计却忽然不翼而飞了。之前一步到位的拖拽和切换,如今由于「自由」的窗口尺寸,你还得二次调整(Slide Over 虽然回来了但是比以前麻烦多了)。分屏时,由于窗口间 R 角增大,牺牲了很多全屏显示的面积。

此外,把 Mac 的红绿灯和菜单栏加入看起来确实不错,但比小拇指还小的操作界面似乎告诉你:iPad 触屏体验不重要,键鼠才是重点。那要生产力+便携性,我买 MacBook Air 不就好了?作为普通用户,在日常使用场景下,最影响我们的不是窗口大小,而是操作的易懂和便利性。我到现在都搞不懂,为什么那个朴素而优美的旧分屏逻辑没被苹果作为一个选项保留?

macOS Tahoe 在这篇文章中更是把「要打磨的东西不细节,要细节的东西不打磨」体现得淋漓尽致。Mac 作为生产力的代名词,系统居然做成如此混乱不堪,各自搭建 UI 擂台,更别说依旧不统一的窗口 R 角了……

乔布斯在 1983 年的设计大会(IDCA)上曾提到:「我们的设计目标是让产品变得 Intuitively obvious(仅靠直觉也易用)」

苹果多年来也的确开创了一个个先例,深刻影响着设计界语言。

但这一次的「苹果风」,我不敢苟同,我不会希望未来充斥这种视觉大于一切的设计语言。我更倾向于觉得,这一次苹果的尝试,只是走上了自己的独木桥。

来自文章 《开局收获上万差评的游戏:《红色沙漠》为何能这么快翻身?》

天天忽悠(+7) 虽没玩过红沙,但慢节奏的大世界游戏很难上手这种情况我是深有体会……大表哥 2、巫师 3 这俩游戏买来好几年了,第一章都没打过去。但我也不会轻易给这俩游戏差评。因为很多游戏就是有这么一个先苦后甜的过程,曾经玩死亡搁浅,我背着快递翻山越岭,耐心几乎达到极限,此时终于看到节点城,同时响起 BGM,心态立刻就变了,这种心灵上的冲击无以言表。现在我知道……并不是有些游戏本身有问题,有问题的是我自己,长期快节奏的生活,让我非常难静下心慢慢细品这些慢节奏的游戏。

vevan(+7) 坏消息:付费测试

好消息:测完了他们真改

克莱德(+4) 这应该是今年第一款我想给好评但觉得自己词穷无法完整概括游戏体验的作品。

前面 20 个小时:这什么垃圾剧情主角这句「嗯」真的太搞笑了。

目前 120 个小时了:什么是剧情?我一刀五附伤一拳烈劲法开天辟地……诶等等你看这里有个密室!

评论图片

来自文章 《一日一技|Liquid Glass 液态变磨砂》

EVA丫(+8) 打开减弱动态,然后在桌面单独关闭。

真是天才想法。

既减少了动态,又保留了程序切换,返回桌面的效果。

来自文章 《从一夜无眠到夜夜香甜:睡个好觉并不难》

aaa果女士(+2) 读过类似的书籍《睡眠革命》,对我大有帮助的同时也会定期爆发一些「帮助」失效的时刻。看了作者的睡前 Routine 倒排法我才意识到,我没有把睡前 Routine 这个流程适己化,一味空想「睡前冥想、做流体瑜伽、拉伸运动一会」会彻底改变我的生活。而实际是这些事我睡前根本不会做,导致我真实睡前做的事情和规划完全天上地下两样。难以实施计划导致破罐子破摔熬夜刷手机,从而恶性循环下去。

📒有趣文章

🆕作者的新玩意

为了让作者的投稿尽快与广大读者见面,我们调整了《新玩意》栏目中作者投稿部分的呈现方式和周期,作者投稿的「新玩意」后续会迁移至本栏目。投稿渠道与奖励方式仍与以往完全一致,详情参见文末。我们相信新鲜火热出炉的分享更能赢得大家的喜爱,也欢迎广大读者朋友们踊跃投稿。

@bakamio:DJI Mic Mini 二发一收套装

  • 购买价格:500 元
  • 购买渠道:京东

我平时拍视频主要用到三台设备:iPhone 15 Pro、DJI Osmo Action 4 和 Sony ZV-1 II。我发现 iPhone 和 Action 4 的内置收音表现其实蛮不错的,声音清晰,而且能捕捉到较远处的声源。但 ZV-1 II 的收音就有些差强人意了:声音听起来非常单薄,一旦人离远一点,音量就会变得非常小,几乎听不清(不确定是不是我自己的设置问题,我尝试过把麦克风增益调高一点,但这样杂音也会有很多)。因为我要拍那种 Top-down 视角的桌面内容,这种场景下 ZV-1 II 最合适,所以我就想着买一个外接麦克风。

虽然考虑过专业的机顶麦,但我平时只是随便拍拍,没必要大材小用。看到 DJI Mic Mini 一套只要 500 元,果断入手。

我一般只有一个人录制,其实买一发一收也够了,但考虑到收纳整齐和续航,还是买了两发一收的套装。毕竟丢进充电盒就能随时补电,比起单发版本要放到小底座上才能充电要省事不少。

拿到手后,还没开始用呢,没想到最惊喜的竟然是随附的收纳袋 —— 做工精致厚实,有缓冲的夹层,大小竟然刚好能装下 Action 4 和它自带的电池盒。其实这个麦克风我买来也不会经常带出门去用,但 Action 4 是随身携带的,这下相当于「白赚」了一个运动相机收纳袋。🤣

放 Action 4 和电池盒刚刚好。

套装里面还包含一个充电盒、两个发射器(TX)、一个接收器(RX),还有一个 USB-C 转接头和连接相机用的 3.5mm 音频线。这个转接头主要是给那些支持 USB-C 麦克风输入的设备用的,比如现在大多数的手机和电脑。

充电盒方方正正的,比想象中大一些,因为是磨砂质感,握起来很舒服。收纳设计也很用心:接收器即使装上转接头,也能直接放进盒子里,不需要每次拆上拆下。3.5mm 音频线倒是还没找到完美的收纳方式,要么只能堆在收纳袋里,但我的袋子里已经给 Action 4 用了。至于防风毛套,直接安装在发射器上也能收进盒子里,不会挤压变形。毛套附赠了灰色和黑色各一对,如果单独购买白色的发射器,应该会是白色的毛套。

接收器即使装上转接头,也能直接放进盒子里,不需要每次拆上拆下。

配对的时候我发现,虽然发射器能够通过蓝牙直接连接支持 Osmo Audio 的设备和手机,但蓝牙连接模式存在一定的功能限制。而且,如果发射器已经在蓝牙模式下,想要切回与接收器配对,就需要断开重新配对,放回充电盒并不会自动触发重连。所以其实买「两发一收」还挺好的:可以让其中一个发射器通过蓝牙连接,另一个则专门跟接收器配对。这样切换使用场景时,就不用在那儿反复重连了。

由于 Mic Mini 为了追求轻便去掉了屏幕,所有的详细设置都需要通过手机上的 DJI Mimo App 来调整。如果接收器配对了两个发射器,那么 App 里可以同时调整三个设备的状态。不过什么都要在 App 上面改,有时候就没那么方便。比如虽然发射器上有灯光显示降噪状态,但降噪等级(标准或强降噪)必须在 App 里修改,无法在机身上快速切换。而且如果我想把它当作电脑麦克风使用,必须先插到手机上调好设定,再拔下来连电脑。

音质方面,我不懂太深厚的技术参数,但实际听感明显比设备自带的要出色,尤其是比我那台 ZV-1 II 自带的麦克风好太多,声音很干净,也不用怕我动来动去离相机太远了。

也试过把它接在 PS5 上作为 USB 麦克风使用,表现也完全没有问题。虽然连着转接头插到 PS5 的 USB 接口上时,因为 PS5 的外壳是凸起来的,看起来似乎没有完全插到底,但实际上是能正常收音的。不过有个小提醒:如果你玩游戏时声音是外放的,录制之前要检查一下是不是开启了降噪模式,否则麦克风过滤背景音的算法会让说话声变得很奇怪。

总之,以 500 元的价格来说还是非常满意的😆

@Cleo阿直:MUJI 桧木香味蜡烛

  • 入手渠道:MUJI
  • 入手价格:28 元

MUJI 有什么值得入的平价小物?香味蜡烛应该是其中之一,28 元一大罐,属于 MUJI 最低价的区间,主要是还有一些比较特别的香型,比如我这次入手的「桧木」,由于太冷门了,市面上的蜡烛品牌几乎都没人做这个味道。

桧木是一种扁柏植物,盛产于日本。别说蜡烛了,连香水都很少人做,桧木味道的香水最出名的还是只有川久保玲的「Hinoki」。MUJI 这个蜡烛就当是 28 元买个川久保玲的超平替,这么一想之后 CP 值直接拔地而起。

香味蜡烛的外观就是典型的 MUJI 风格,一个很有重量的咖色玻璃罐子,简洁又不失质感,里面的膏体由大豆蜡、棕榈蜡和香精制成,净含量 85 克。打开玻璃盖子就能闻到明显香味了,再看这款蜡烛的香味描述:

  • 前调:柳丁 / 日本青柚 / 海盐
  • 中调:桧木 / 薰衣草 / 铃兰
  • 后调:雪松 / 零陵香豆 / 白檀香 / 浅琥珀

这是 MUJI 官方写的香调,不过现实中很难闻到那么多层次,虽然我个人对香水略有研究,但老实说这罐蜡烛我也只能闻出混合的木质调和柑橘调,整体是沉静的木质香味,其中青柚的味道像一种初夏未熟的青橘,夹杂了清凉的绿意和草本的辛香,莫名让人想起柠檬叶或香茅的味道,喜欢热带风情又不想要太浓郁的朋友有福了,闻起来像到了热带小树林。

使用方法:

静置: 我夜晚放在床头柜上,只是把盖子打开,就可以闻到香味了。

加热: 之前在小红书看到一个说法是香味蜡烛不能点燃,要用融蜡灯,如果没有融蜡灯,可以尝试别的方法达到加热效果:

  1. 用暖宝宝贴在蜡烛罐外围加热。
  2. 用电吹风直接给膏体吹热风加热。
  3. 放在加热杯垫上加热。

我感觉前两个方法有点麻烦,就试了第三个方法,放在加热杯垫上加热。说说使用效果,由于加热杯垫是从底部开始加热,可以看到底部的蜡融化时,上部的蜡还没有反应,不确定这是否影响了发挥,我感觉香味扩散并没有小红书上说的那么神奇。

点燃: 回归传统方法,直接点,既然它叫蜡烛,那我们就点它。点蜡烛的香味扩散我感觉比放在加热杯垫上还要好一些,而且省电,只是有一些小小的注意事项:

  1. 熄灭蜡烛时不用吹,直接把盖子盖上就好,可以避免黑烟。
  2. 首次燃烧最好烧够 2 小时,这样可以避免蜡烛芯因为首次燃烧不足出现凹洞,凹洞会让蜡烛之后每次烧都只会烧中间那个洞里的蜡,很难烧到边缘的蜡了。
  3. 睡觉或人走开后不要忘记熄火,避免安全隐患。

 

其实,所有香味蜡烛我都觉得自然状态比点燃状态好闻,所以总的来说香味蜡烛更适合比较有仪式感的人,如果是像我这样的懒人,同价位还是更推荐芳香喷雾。顺便提名这款蜡烛另外几个我觉得好闻的味道吧:

  • 「葡萄柚」:最好闻的柑橘花香调,清新但不甜腻,适合夏天。
  • 「罗勒」:绿意更浓的草本调,有点提神。
  • 「秋梨」:很甜很甜的果香调,适合喜欢甜的人。


如果你也想分享「新玩意」🔉:

  • 获取 Matrix 社区写作权限并签署 Matrix 共创计划
  • 在少数派独家发布一篇文章,在标题中标注「新玩意」前缀;
  • 用至少 800 字介绍产品,并配上 2-3 张产品的实拍图片;
  • 在网站个人信息中补充支付宝账号。

成功入选本栏目还可以得到 108 元的「剁手红包」🧧。如果你有兴趣参与,就赶紧来稿吧!

> 下载少数派 客户端、关注 少数派公众号,了解更多的新玩意 🆒

> 特惠、好用的硬件产品,尽在 少数派 sspai 官方店铺🛒

    最近,我们的全新文生图开源模型——ERNIE-Image正式与大家见面了。它基于 8B 参数的 DiT 架构,在复杂指令跟随、文字渲染和结构化图像生成方面表现突出,覆盖了从写实摄影、设计感图像到风格化表达在内的多种视觉风格,因此尤其适合海报、漫画、多面板布局等需要较强控制能力的内容生产场景。

    • ERNIE-Image - SFT 模型:更强的通用能力和指令忠实度,推理步数 50 步
    • ERNIE-Image-Turbo - 极速模型:通过DMD和 RL 优化,仅需 8 步即可实现更快的速度和更高的美学质量

    今天,我们带来一篇​超友好的ComfyUI实战教程​,手把手带你完成 ERNIE-Image 的部署与使用。即使是新手,也能轻松上手!

    致谢​:感谢 ComfyUI 官方对 ERNIE-Image 适配的大力支持。

    ComfyUI 相关仓库:

    安装 ComfyUI 与权重下载

    1.1 网页版安装

    • 网页版安装需要拉取最新版本的 ComfyUI 仓库并配置相关的 Python 环境。
    ### 拉取最新的ComfyUI仓库:
    git clone https://github.com/Comfy-Org/ComfyUI.git
    ### 配置ComfyUI运行的环境并安装最新的包含有ERNIE-Image的template:
    cd ComfyUI && pip install -r requirements.txt && pip install comfyui-workflow-templates==0.9.56

    1.2 客户端安装

    下载 ComfyUI 最新版本 v0.19.1

    https://www.comfy.org/zh-cn/download
    640.png

    1.3 模型权重下载

    让 ERNIE-Image-Turbo 在服务器端/本地顺利运行,你需要在 ComfyUI 中正确配置四个核心组件:扩散模型、文本编码器、PromptEnhancer和变分自编码器(VAE)。从 HuggingFace 下载 ERNIE-Image 核心模型权重文件,模型地址:

    https://huggingface.co/Comfy-Org/ERNIE-Image

    模型权重放置在 ComfyUI 的相应目录下:

    • 扩散模型(Diffusion Model)
    • 文件:ernie-image.safetensors/ernie-image-turbo.safetensors
    • 路径:ComfyUI/models/diffusion\_models/
    • 文本编码器(Text Encoder)
    • 文件:ministral-3-3b.safetensors
    • 路径:ComfyUI/models/text\_encoders/
    • Prompt 优化器(Prompt Enhancer)
    • 文件:ernie-image-prompt-enhancer.safetensors
    • 路径:ComfyUI/models/text\_encoders/
    • 变分自编码器(VAE)
    • 文件:flux2-vae.safetensors
    • 路径:ComfyUI/models/vae/

    将上述四个文件分别放入 ComfyUI 的对应目录后,即可开启 ComfyUI 工作流实践。

    标准流工作

    当前 ComfyUI 新版本已经支持了 ERNIE-Image 的标准工作流,用户可以直接使用官方推荐工作流来获得最佳画质和速度。

    2.1 加载模型节点

    在 ComfyUI 中,从左侧模板库选择“Ernie Image Turbo:文生图”或者“Ernie Image:文生图”,系统会自动加载已放入对应目录的核心组件。

    640 (2).png

    如果前述文件已经放入正确位置后,相关模型会自动加载,无需手动配置,直接输入 Prompt,即可启动生图。
    640 (2).png

    需要特别关注的是:当前 PE 节点作为 ERNIE-Image 的默认选项,其使用的加载器和 Text Encoder 加载器都是使用的 CLIPLoader 来加载模型权重。

    • Text Encoder 节点加载的权重文件:ministral-3-3b.safetensors 或者 ernie-image-prompt-enhancer.safetensors
    • Prompt Enhancer 节点加载的权重文件:ernie-image-prompt-enhancer.safetensors

    2.2 PE 设置

    ERNIE Image 最适合长、详细、结构良好的提示——更丰富的描述往往会产生更好的生成质量、更精确的教学保真度,以及更忠实地呈现复杂的布局或叙事内容。在实践中,非常建议用户开启 PE,官方节点默认是开启 PE。
    640 (3).png

    PE 节点的参数设置可以通过点击节点图右上角打开子图进一步设置,关键参数配置如下:

    • 最大长度(max\_length):设置为 1536~2048,如果设置过小,可能会导致长文本输入信息存在遗漏的风险,但也不建议设置太大。
    • 采样模式:开启。
    • 温度系数(temperature):设置为 0.6。
    • top\_p:设置为 0.8。
    • thinking mode: 关闭。
      640 (4).png

    2.3 采样器设置

    打开子图后,同样可以看到采样器的相关配置项,具体配置推荐如下:

    • 步数(steps): ERNIE-Image-Turbo 版本建议设置为8,ERNIE-Image 版本建议设置为50。
    • 引导系数(CFG):ERNIE-Image-Turbo 版本建议设置为1.0,ERNIE-Image 版本建议设置为4.0。
    • 采样器(Sampler):推荐使用euler。
    • 调度器(Scheduler):推荐 sgm\_uniform 或者默认的simple。

    640 (5).png

    2.4 分辨率设置

    ERNIE-Image/ERNIE-Image-Turbo 模型在下列分辨率优化效果比较好,当前避免直接生成 2k+ 分辨率。

    • 1024x1024
    • 848x1264
    • 1264x848
    • 768x1376
    • 896x1200
    • 1376x768
    • 1200x896

    GGUF量化版工作流

    如果你使用是低显存设备,则需要采样Unsloth给出的 GGUF 量化方案,Unsloth 的 GGUF 量化权重可以从 Huggingface 中下载。

    GGUF(Unsloth)相关仓库:

    • ERNIE-Image GGUF(扩散模型):

    https://huggingface.co/unsloth/ERNIE-Image-GGUF

    • ERNIE-Image-Turbo GGUF(扩散模型):

    https://huggingface.co/unsloth/ERNIE-Image-Turbo-GGUF

    • Text Encoder GGUF:

    https://huggingface.co/unsloth/Ministral-3-3B-Instruct-2512-GGUF

    首先,你需要在 ComfyUI 中通过 ComfyUI Manager​安装 ComfyUI-GGUF 插件​。
    640 (6).png

    安装后需要重启服务并刷新页面,从前面的网页中下载需要的的量化模型,放入到 ComfyUI/models/unet/文件夹下。然后双击空白处-> 搜索 GGUF-> 点击 Unet Loader(GGUF),即可使用本地的量化模型;使用 CLIP Loader(GGUF)节点加载文本编码器。

    说明:Prompt Enhancer 的 GGUF 版本当前暂未提供。

    随着大模型技术的普及,企业搜索正从传统的“关键词匹配”向“智能体交互式搜索”演进。如何在不牺牲稳定性与成本可控的前提下,实现搜索能力的智能化升级,成为企业数字化转型的关键命题。

    2026年4月18日,由 Elastic 主办、阿里云作为钻石赞助商支持的 “Unlock the Power of Search AI —— Elastic 中国 AI 搜索技术大会” 在北京成功举行,参会人数近400人。阿里云智能集团计算平台事业部多位AI搜索技术与产品专家出席,围绕 Agent Native架构、向量混合检索实战、云端存算分离与降本增效、Agentic RAG 等核心议题,与企业客户深入探讨了 Search AI 的技术落地与商业价值。

    一、 产品进阶:定义 Agent 时代的搜索新范式——从“人找信息”到“知识记忆湖”

    阿里云智能集团计算平台事业部 AI 搜索负责人邢少敏在《从企业搜索到AI搜索Token化:阿里云 Elasticsearch 的云产品进阶之路》中指出,随着大模型应用进入 Harness Engineering 阶段,搜索的核心价值已从服务于人类查找信息,转变为服务于 Agent 获取上下文,成为Agent上下文工程(Context Engineering)与记忆管理的核心组件
    d0f92767f3244ad9aef314423bf4782c.png

    1. Agent 原生的搜索体验

    传统搜索引擎为人类设计,图形界面,搜索结果列表用于点击浏览,而阿里云 Elasticsearch 正在重构搜索体验,为 Agent 重新设计搜索引擎

    • 原生 Agent 支持: 阿里云Elasticsearch原生支持Agent创建,编排和使用,可以创建各类Agent 用于ES的运维管理、数据检索和分析。
    • Agentic Search: 阿里云Elasticsearch 原生支持Agentic Search,将原来面向人的搜索结果转变为面向Agent,搜索结果为JSON、Markdown 等适合AI阅读的格式,让 Agent 能高效读取与执行,同时节省token消耗。
    • Agentic数据处理: 阿里云Elasticsearch 将原生支持Agentic 多模态数据离线处理,内置的多模态数据处理Agent会将用户可以以自然语言描述的多模态数据处理需求转化为 离线任务运行,处理完成后再构建索引。
    • 全生命周期 Skills:将阿里云Elasticsearch的实例创建、集群配置、集群运维、健康诊断、监控和告警等全生命周期抽象为 通用Skills,允许不同的Agent使用阿里云Elasticsearch,比如悟空、QoderWork,Dataworks Data Agent,还有开源的OpenClaw等。阿里云Elasticsearch 成为 Agent 连接数据世界的统一网关,支持Agent直接创建实例,管理索引,运维集群、数据分析等,大幅降低使用门槛。

    2. 构建企业级“知识记忆湖”

    邢少敏提出,阿里云 Elasticsearch 应演变为 Agent 的长期记忆、技能和知识库存储引擎。通过 Agentic Search 架构,阿里云 Elasticsearch 不仅能存储交互日志,用户偏好与 Skills,还能沉淀企业知识。这种“越用越懂你”的记忆机制,能有效减少 LLM Token 消耗,提升任务成功率,并依托全模态数据湖仓架构打破企业信息孤岛。
    254ed28794ff48a4bda29fb6842e4768.png

    3. 高性能底座支撑

    底层依托自研 FalconSeek 引擎,实现向量查询性能提升 50%-300%,并结合 GPU 加速与 BBQ 量化,确保在千亿级数据规模下,仍能为 Agent 提供毫秒级的上下文检索响应。

    二、 最佳实践:千亿级 AI 搜索的效能突破与架构演进

    面对 AI 搜索大规模落地中的效果瓶颈与高昂成本,AI搜索成为Agentic产品的关键组件 ,阿里云智能集团计算平台事业部 AI 搜索产品负责人汤祯捷在《搜索即智能体:千亿级 AI 搜索的效能实践》中,分享了客户实践中的三大核心突破:

    1. 混合检索 2.0:原生一体化融合检索,解决“召回不准”难题

    针对传统向量检索在过滤场景下的失效问题,阿里云推出 智能混合检索(Hybrid Retrieval 2.0)

    • 原生一体化联合检索:多路召回 + RRF 融合的统一架构。不再是两个独立引擎拼在一起,而是在一个统一的检索框架内做多路召回。
    • 边检索边过滤:在 KNN 搜索过程中直接应用过滤器并设定相似度阈值,彻底解决“过滤后结果为空”的工程痛点。
    • 动态 RRF 融合:通过语义感知的动态权重调整与学习型稀疏检索(LSR),无需手动调参即可实现多路召回的高质量融合,显著提升长尾知识的召回准确率。

    a37b6102405d4c4e9e97a91588035e53.png

    2. 极致效能:逻辑冷热索引分层与存储降级,TCO 降低 40%-70%

    为打破千亿级数据下的算力瓶颈,阿里云创新提出 “逻辑冷热索引分离” 策略:

    • 资源精准分配:仅对 10% 热数据构建高性能 HNSW 索引,90% 冷数据采用低开销存储,使单节点内存需求暴降 70%,计算规格减半。
    • Ingest Pipeline 实现智能流量路由: 根据文档的更新时间、访问频率、业务重要性等维度,自动路由标记为热索引或冷索引。
    • 存储介质降级: 牺牲一部分冗余 IOPS,换来的是 50% 的存储降本和吞吐量的提升。
    • 存算分离升级:依托自研内核 FalconSeek 与云端存算分离架构,实现云原生 DSL 查询加速 3 倍以上,整体拥有成本(TCO)降低 40%-70%。

    3. 搜索即执行:知识库 RAG 全面拥抱 Agentic RAG

    汤祯捷指出,AI 搜索正经历从“信息获取”到“智能体自主执行”的范式转移。借助阿里云ES的基础底座,结合Search Agent核心能力与Agentic RAG引擎,搭建Agentic Search + 阿里云ES的全新AI智能体产品。支持多模态检索与结构化索引,为企业构建可度量、可调度的多 Agent 协作体系, 实现DeepResearch, 联网搜索,知识库RAG,自主执行等AI典型任务。

    Agentic RAG——AI搜索即智能体的实践应用。Agentic RAG引擎实现三位一体索引库(文本/向量/结构化索引目录)能力,应用在AgenticSearch 知识库内。并支持Agentic Search持续学习:检索结果的质量反馈回来,用于优化索引;索引的更新反过来提升检索效果。这是一个闭环。
    600a450f3b1a41508218851acb238ebe.png

    三、 技术深潜:破解 AI 搜索“效果与成本”双重难题的最佳实践

    阿里云智能集团计算平台事业部 AI 搜索高级技术专家吴作栋在《向量混合检索最佳实践》中,分享了从算法优化到架构升级的系统性解法:
    a25a8bdfeeaa452ab6b58be81bd38704.png

    1. 成本效益:BBQ 量化与存算分离

    针对百亿级向量场景,阿里云推出 BBQ(Better Binary Quantization)量化技术,通过非对称量化将向量数据压缩至极致。实测显示,100亿向量数据的存储节点可从 225 台缩减至 11 台,资源节约高达 95%。结合 OpenStore 存算分离架构,整体 TCO 降低 40% 以上。

    2. 性能提升:自研 FalconSeek 引擎

    基于 C++ Native 构建的 FalconSeek 云原生引擎,消除了 JVM GC 抖动,实现 DSL 聚合查询加速 6.8 倍、带过滤向量查询吞吐提升 3-5 倍。同时,通过 Retrievers 声明式检索框架,一键编排 BM25、kNN 多路召回与 RRF 融合排序,兼顾关键词精确匹配与语义理解。

    3. 落地路径:三步走策略

    吴作栋建议企业采用 “快速搭建(BM25+kNN+RRF)→ 效果优化(接入百炼 Embedding/Rerank+BBQ 量化)→ 极致性能(FalconSeek 引擎+存算分离)” 的三步走路径。该方案已成功支撑 金山文档千亿级语义搜索 及某大模型公司大规模 C 端实时检索。

    四、 生态协同:构建 Agent Native 的开放搜索底座

    本次大会不仅是技术的交流,更是生态的聚合。阿里云与 Elastic 深度协同,通过 官方ES Skills、云原生架构增强、全链路可观测 三大维度,共同构建面向 Agent 时代的开放搜索生态系统。

    1. 首发 ES Skills,赋予 Agent 原生执行力
      阿里云 Elasticsearch 正式发布 ES Skills 功能,将实例管理、集群诊断、索引管理、数据查询等核心能力封装为标准化工具集。多种主流AI Agent 都可通过自然语言直接发现并调用这些ES Skills,实现从“被动检索”到“主动执行”的跨越。
    2. 云原生架构增强,实现极致弹性与合规
      在兼容 Elastic 最新特性(如 Vector Search、ML Nodes)的基础上,阿里云增强了 OpenStore 存算分离架构 与 Serverless 能力,支持按需付费与秒级扩缩容。
    3. 全链路可观测,降低运维复杂度
      通过集成 CloudLens For ES,实现了从基础设施层(CPU/内存/磁盘)到应用层(慢查询、健康事件、向量检索延迟)的全链路监控。结合智能告警与根因分析功能,帮助运维团队从“被动救火”转向“主动预防”,保障 AI 搜索业务的高可用性(SLA)。

    五、 未来演进:从 RAG 到 Agentic Search,重塑企业知识资产

    随着 AI 技术从“ Prompt Engineering”, 到“Context Engineering”, 向长时间运行的“Harness Engineering”演进,阿里云 Elasticsearch 的战略重心已从单纯的“搜索引擎”转向 “Agent 的智能记忆与AI搜索基础设施”升级。未来,我们将持续深化以下三个方向的投入:

    1. AI搜索演进:打造“知识记忆湖”Agentic Memory

    未来的搜索系统将不再仅仅是信息的检索入口,而是企业专属的包含智能记忆库的Agent智能体。

    • 记忆沉淀:自动从交互日志中提取用户偏好、对话上下文与执行 Skills,形成结构化与非结构化统一的“知识记忆湖”。
    • 越用越聪明:通过记忆机制减少 LLM Token 消耗,提升任务成功率,让 Agent 具备“个性化”与“连续性”的服务能力。
    • Lake Search: 阿里云ES打造基于阿里云OpenLake的全场景联邦搜索。

    2. 效能突破:FalconSeek引擎升级与存算分离云架构

    • Serverless 与存算分离:进一步屏蔽底层资源管理细节,实现真正的按需计费与极致弹性,让开发者专注于业务逻辑而非集群运维。
    • GPU 加速向量化:深化 GPU 在向量索引构建、重排序(Rerank)及推理环节的加速应用,结合 BBQ 量化技术,在千亿级数据规模下保持毫秒级响应与极致低成本。

    3. 行业深耕:专属化与一体化解决方案

    • 行业专属实例:针对金融(高合规)、电商(高并发)、媒体(多模态)等行业,推出预置最佳实践参数的专属搜索实例。
    • 搜推问一体:推动搜索、推荐与问答能力的融合,构建支持多模态(文本/图片/视频)检索与复杂工作流编排的一体化平台,助力企业从“数字化”迈向“智能化”。

    阿里云致力于通过 稳定、高效、智能且成本可控 的AI搜索基础设施,成为企业构建下一代 AI Agent 应用的最坚实底座,助力客户在 AI 浪潮中实现业务的可持续增长。


    关于阿里云 Elasticsearch
    阿里云 Elasticsearch 是基于开源 Elasticsearch 构建, 支持 Elasticsearch 企业版的全托管AI搜索云服务,提供高可用、高性能、高安全的搜索与数据分析能力。深度融合阿里云 AI 技术栈,支持向量检索、机器学习节点、Serverless 架构及 MCP 协议,助力企业轻松构建新一代 AI 搜索与 Agent 应用。

    了解更多:

    阿里云Elasticsearch:https://www.aliyun.com/product/bigdata/elasticsearch

    阿里云AgenticSearch: https://help.aliyun.com/zh/open-search/search-platform/product-overview/agentic-search-ai-driven-next-generation-enterprise-search

    1. 楼主新房,媳妇怀孕 8 个月。

    2. 楼上放租,年前搬来一伙合租的年轻人。年后媳妇总是说半夜两三点有人在不停说话放音乐,感觉像是直播,吵得她睡不着。我先是问物业与楼栋群,没有人说在做直播。于是我半夜蹲守,发现就是我家楼上在吵,拍照报物业,物业上门规劝。后续对方半夜再次吵闹,我就报物业保安,大概三次之后,终于消停了一会。

    3. 三月份楼上又开始吵闹了:每天晚上两三点准时开始,一直到早上四五点结束。声音变成了高跟鞋的嗒嗒声和男女讲话声、怪叫声。
      这段时间工作比较累,媳妇晚上睡得比较沉,一直没有被吵醒,我也实在不想起床,只好戴降噪耳机睡觉。(不过高跟鞋的声音还是能穿透降噪耳机进来)。
      白天向物业管家投诉,管家说楼上现在是合租户,她先去帮忙跟对方协商。之后管家说对方道歉态度很诚恳,知道自己影响到了其他人(期间应该也有其他住户投诉),说以后动作会小心点。

    4. 之后依旧被吵醒,继续向管家投诉,管家直接到人家家里沟通,楼上租户解释说他们在附近某家公司上晚班,每天半夜两点才下班,到早上七八点睡觉。现在已经尽量减少生活噪音了。之后还听物业说他们跟管家诉苦了很久,说找工作不容易云云、晚班很累云云,每天唯一的盼头就是下班之后开 party ,现在由于投诉也不敢开了云云。结果就是物业给我来了一句邻里之间应该互相体谅。当时看对方道歉态度好,我也不好发作。

    5. 问了豆包和 chatgpt 楼上半夜噪音如何维权,根据豆包推荐花几百大洋买了个录音笔,关闭主动降噪,打开增强,插天花板上贴着楼板直接录声音。
      第二天听声音,发现楼下半夜狗叫能录到,隔壁邻居半夜回家开锁也能录到,就是录不到楼上的声音,以至于楼主精神都有点恍惚了,质疑自己是不是真的是被楼上给吵醒的,心脏部位紧得慌。

    6. 有一天 1 点多就开始出现硬底鞋嗒嗒声,持续了半个多小时,期间还有拖动重物的声音。我反复确认不是幻觉后决定起身硬刚楼上。上楼拍门后开门的是一个老太太。

    • 我:你们能不能动静小一点
    • 老太太:我没有听见任何声音啊
    • 我:你们刚刚没有穿硬地鞋吗?没有听见硬底鞋踏地板嗒嗒的声音吗(看了一眼老太太穿的棉拖鞋,但是边上放了一双带跟的皮鞋)
    • 老太太:我什么都不知道,我也没有发出任何声音,我不知道你说什么。

    后面老太太的儿子回来了,说他妈刚过来照顾他不久,他会跟他妈说注意点的。但是他们平常生活已经很小心了,因为我们的投诉,他们生活也受到了很大影响,互相能不能谅解下。我看他这样说也不知道说什么,只能回一句以后注意一点。

    1. 期间我爸妈过来住了一个周末,走的时候跟我吐槽说楼上半夜真吵,他们俩每天晚上都被吵醒了;

    现在是自己调理了一段时间(其实就是每天提前到十点就睡觉,中午在公司吃完饭就睡,周末也是有空就补半小时觉;然后找医生开了一点养神经的药),感觉自己都适应了楼上的作息了:

    • 每天半夜 1 点多老太太开始给她儿子做饭搞卫生;
    • 两点多男的回家噼里啪啦一顿;
    • 两点半女的回家又是霹雳啪啦一顿;
    • 男的打三角洲死了就会怪叫一声;
    • 时不时传来拖椅子的声音、东西摔地下的声音;
    • 男的女的说话声和笑声;

    换了支录音笔,能录到一些楼上的声音(仅限搬东西等直接接触楼板引发震动的声音,录不到说话声与叫声这类通过空气传播的声音)。现在对方每次意识到发出比较大的声响后就会安静一段时间。
    用 ai 写了个程序,根据波形图粗略统计了一下,差不多每半个小时就有一个比较高的声音。
    问了 chatGPT ,这种情况下就算报警也很难处理,给出的建议是要对方换作息。。。豆包更离谱,要我请公证半夜来家里听噪音,然后和楼上打官司。。

    现在楼主还能勉强忍住;媳妇因为孕晚期倒是睡得挺香。不知道以后孩子出生了该怎么办。家长过来带娃肯定是没法睡好觉的。。。

    LTRD;

    福利在下面,直接用就行。

    介绍

    Mirrorstages 是从 V2EX 开始一点点做起来的,最开始做的时候不知道还有 sub2api\newapi 这些开源项目,所以就是自己从头手搓,搓了大概三个多月,期间走了不少弯路。随便给大家唠唠。

    一开始我只是想做类似 Openrouter 这样的路由平台,在官网的价格上加点赚个鸡腿钱。把模型和协议解耦,让用户可以在不修改代码的情况下去使用任意的模型。等我手搓完才发现原来还有中转这个市场,就顺水推舟入了行。发现里面门门道道真的挺多的。

    大部分中转都是二道贩子的二道贩子

    刚入行的时候我以为号池是基本需求,凭着之前积累的技术功底开始研究,也算有了自己的独家。等和同行交流的时候才发现很多人其实是随便接的同行的中转站。他们的工作是去找同行谁的渠道做的不错、价格低,就过去谈价格,转手再卖一点,等这个同行价格上涨了,他再找下一家。如此循环往复。如果有个不长眼的同行来问他,他就再加个几毛钱倒卖一手

    对于用户来说,一天稳一天不稳,其实就看老板今天聊到的渠道怎么样。

    见过最离谱的是:几个站炸了去对帐,对来对去发现调用链路成环了= =,A 接了 B ,B 接了 C ,C 的渠道不稳之后又去对接了 A ,用户的一个请求就在 ABC 三个站来回打转。( 90 年代的网络风暴以另一方式重出江湖)

    这样其实也可以理解,毕竟一个小站维护一两个号池就很麻烦了,每个渠道都自建的话,真的顶不住。

    虚拟卡已经是上个版本

    一开始我以为搞号池就拿虚拟卡批量白嫖免费试用,但实际用起来发现大部分卡头其实都被平台封完了。普通网络不行要上家宽,家宽还分真家宽和 IDC 伪家宽。最后拿卡开号变成了非常玄学的事情。所以现在有些平台的号基本是通过官方的 BUG 搞定的。

    比如最近的 Codex Plus 号,应该是从上一年开始出现的。原理大概是 OpenAI 对通过 Google (还是 Apple 忘记了)这样的第三方支付的时候,没有做充分的验证。导致只要有一个支付记录,通过模拟请求可以将一个号的权益复制给另一号。

    但因为某些原因,这个 BUG 被人捅到了 OpenAI 脸上,导致 BUG 在今早修复了(

    写点软文

    Mirrorstages 一开始就自己做 Claude 的号池,目前为止已经两个月没宕机,稳定跑了。最近 GPT 也搭了新号池出来,所以送点福利给大家,请大家帮忙看看转发和调度写的怎么样。

    最近和老挝那边的朋友也有了联系,我们自营的纯血家宽和 KYC 认证服务也在路上了,等跑起来之后也要开始自己搭 CCMAX 的号池了

    最后放点福利

    地址: https://mirrorstages.com

    • 注册送 5 元额度
    • Claude 模型 0.6
    • GPT 模型限时免费( 0.01 )过段时间恢复到 0.5 左右

    说出来你可能不信,虽然大厂技术都是985高校计算机博士,写推荐算法写得行云流水,但是我见过很多人在算法备案这件事上硬是折腾了将近一年,愣是没搞定。

    这是客户亲身经历,今天这篇文章,就是把大家踩过的坑总结出来,让你知道为什么“填个表就能过”这种想法会让你死得有多惨。

    生成式人工智能 #大模型备案 #算法备案 #网络安全 #AI产品安全应用

    算法备案比你想象的更卷

    2025年,累计有748款生成式人工智能服务完成备案,435款完成登记。

    这是什么概念?平均算下来,每天至少有1.2个算法或大模型通过备案。你以为这是个蓝海市场?不,这是个修罗场。

    更扎心的是,2025年算法备案已经进入“双轨监管深化期”。双级审核流程使平均备案周期延长40%以上。 也就是说,以前可能三个月能搞定的事,现在可能要四五个月;以前可能被退回一两次,现在可能被退回三五次。

    你以为你是在和同行竞争?不,你是在和整个监管体系博弈。

    核心原则:建立正确的认知框架

    在讲具体流程之前,我觉得最最重要的事情,是先帮你建立一套正确的认知框架。因为我见过太多人,在错误的认知上拼命努力,越努力越惨。

    原则一:懂代码≠懂表达

    博士代码写得漂亮,思路清晰,逻辑严谨。但他写的第一版备案材料,审核人员的评价是:“这不是算法描述,这是论文摘要。”

    你看,问题来了。他懂算法吗?太懂了。但他懂怎么把算法“翻译”成审核人员能理解的语言吗?

    算法备案材料不是技术文档,它需要的是:用通俗语言说清楚你的算法“怎么工作的”“做什么决策的”“可能有什么风险”“你怎么控制风险”。

    审核人员不是算法工程师,他们看不懂你的矩阵分解、注意力机制。他们只想知道:你这个算法会不会害人。

    原则二:懂算法≠懂政策

    很多技术出身的人会有一个误区:只要我的算法合规,备案就是走个流程。

    这个想法有多危险?危险到你可能因此不断吃闭门羹。

    算法合规和政策合规是两码事。算法层面,你的推荐算法可能确实没有任何歧视性输出,没有任何隐私泄露风险。但政策层面,你可能需要公示算法备案号、可能需要提供用户关闭推荐的入口、可能需要在用户协议里写明算法使用的目的和范围。

    《互联网信息服务算法推荐管理规定》第二十四条明确要求,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内履行备案手续。 《互联网信息服务深度合成管理规定》第十九条也规定,具有舆论属性或者社会动员能力的深度合成服务提供者必须依法备案。

    这些政策要求,不是技术问题,是合规问题。你不懂政策,就像开车不懂交通规则——技术再好也是马路杀手。

    原则三:懂产品≠懂审核重点

    产品经理可能是最了解自己产品的人。但问题来了:你了解的东西,是审核人员想了解的吗?

    举个例子。产品经理描述产品时会说:“我们采用基于协同过滤的矩阵分解算法,结合用户行为数据和内容特征进行个性化推荐,提升用户留存和转化。”

    这段话有什么问题?看起来没什么问题,对吧?但审核人员看到的是:你们在用用户数据做精准推送,可能会影响用户决策,需要说明如何保护用户权益。

    算法备案到底要怎么做

    好,认知框架建立完了,现在我们来看具体流程。

    1 判断你需要哪种备案

    算法备案不是只有一种,它分好几类:

    •算法备案:针对推荐算法、搜索排序算法、调度决策算法、检索过滤算法等。

    •深度合成备案:针对使用深度合成技术(AI换脸、虚拟形象、自动生成内容等)的服务。

    •大模型备案:针对自主研发的生成式AI大模型。

    这三者的适用范围不同,材料要求不同,审核流程也不同。 你需要先搞清楚自己的产品用的是什么技术、面向什么用户、有什么功能,然后判断你需要做哪种备案。

    2 准备材料

    根据2026年的最新要求,算法备案材料已增至8项核心模块。主要包括:

    1.主体信息:公司营业执照、法人身份证明、安全负责人信息等(需要盖公司公章)。

    2.算法信息:算法类型、应用领域、基本原理。

    3.算法安全自评估报告:这是重中之重,需要详细说明算法可能存在的安全风险及防控措施。

    4.算法负责人承诺书:需要有算法安全负责人的签字和公章。

    5.用户权益保护机制说明:包括如何提供关闭推荐的选项、如何保护用户个人信息等。

    6.内容安全机制说明:特别是生成式算法,需要说明如何防止虚假信息传播。

    7.数据安全保护措施:说明数据存储、使用、传输的安全性。

    8.其他证明材料:根据具体业务可能需要补充。

    材料准备是最花时间的环节。我的建议是:宁可多准备,不要少准备。你以为自己用不上的材料,可能恰恰是审核人员想看的。

    3 提交材料

    材料准备好了,下一步就是提交。目前算法备案通过互联网信息服务算法备案系统进行(https://beian.cac.gov.cn)。

    提交时需要注意几点:

    •所有材料需要加盖公章,电子版需要清晰可读。

    •法人、安全负责人需要本人签字,不能代签。

    •填写信息要与实际业务一致,不能有任何虚假。

    提交后就是等审核。正常情况下,审核周期约2个月。但如果材料被打回修改,周期可能延长到3-4个月。

    4 整改与补充

    别指望一次通过。根据我的经验,大多数企业的首次提交都会被退回,需要修改。常见的退回原因包括:

    •材料描述与实际产品功能不符

    •风险评估不够详细

    •缺少具体的防控措施

    •用户权益保护机制不完善

    被退回不要慌,这是正常流程。认真看退回意见,一项一项改,改完再提交。记住:审核人员的每一条意见,都是在帮你完善材料。

    注意事项:这些坑千万别踩

    最后这部分,说说我见过的别人踩过的坑。希望你能避开。

    1 不要用通用模板

    这是最容易犯的错误。网上有太多“算法备案通用模板”,很多企业为了省事,直接下载模板改一改就提交。

    审核人员一眼就能看出来。轻则打回修改,重则被认定为“敷衍了事”,后续审核会更加严格。

    2 不要忽视“舆论属性”判定

    并不是所有使用算法的产品都需要备案。《互联网信息服务算法推荐管理规定》明确要求的是“具有舆论属性或者社会动员能力”的算法推荐服务提供者需要备案。

    但问题是,“舆论属性”和“社会动员能力”的判定标准是什么?这个边界其实比较模糊。很多企业以为自己的产品不属于这个范围,结果被监管机构发现在这个范围内,直接吃了罚单。

    我的建议是:如果你的产品有一定用户规模,有内容分发功能,最好主动咨询一下专业机构,确认是否需要备案。别等被查了再后悔。

    JS中this关键字详解(面试必背+错题复盘+bind/call/apply用法)

    本文整合JS中this关键字的核心知识点、记忆口诀、易错点复盘,以及bind/call/apply三大方法的用法,结合经典面试题和个人错题,适合整理成博客存档,助力面试备考,彻底吃透this指向问题。

    一、this核心记忆口诀(背会直接破题)

    核心总纲:this不看书写时,只看运行时;谁调用,指向谁(箭头函数除外)

    • 普通函数:谁调用,this是谁
    • 直接调用:无调用者,this→window(浏览器)/undefined(严格模式/Node)
    • new调用:this→新创建的实例对象
    • call/apply:临时手动指定this,仅当前调用生效
    • bind:永久手动绑定this,生成新函数,不可修改
    • 箭头函数:无自身this,继承外层第一个普通函数的this;无外层普通函数则指向window
    • 补充坑点:对象{}不产生作用域,不绑定this

    优先级口诀(从高到低):new绑定 \> bind硬绑定 \> 对象方法隐式绑定 \> 普通调用默认绑定 \> 箭头函数继承绑定

    二、bind、call、apply 用法详解(重点区分)

    三者核心作用:手动改变函数的this指向,区别在于调用方式、传参形式和是否永久绑定。

    1. call 方法

    • 语法:函数名\.call\(指定的this, 参数1, 参数2, \.\.\.\)
    • 核心特点:立即执行函数,临时绑定this(仅当前调用生效),参数以列表形式传递
    • 示例:
    function foo(a, b) {
      console.log(this.name, a + b);
    }
    const obj = { name: "张三" };
    foo.call(obj, 1, 2); // 输出:张三 3(this临时指向obj,立即执行)
    foo(); // 输出:undefined/global (this恢复默认,绑定失效)
    

    2. apply 方法

    • 语法:函数名\.apply\(指定的this, \[参数1, 参数2, \.\.\.\]\)
    • 核心特点:立即执行函数,临时绑定this(仅当前调用生效),参数以数组形式传递
    • 示例:
    function foo(a, b) {
      console.log(this.name, a + b);
    }
    const obj = { name: "李四" };
    foo.apply(obj, [1, 2]); // 输出:李四 3(参数是数组,其余和call一致)
    foo(); // 绑定失效,this恢复默认
    

    3. bind 方法

    • 语法:const 新函数 = 原函数\.bind\(指定的this, 参数1, 参数2, \.\.\.\)
    • 核心特点:不立即执行函数,返回一个新函数;新函数的this被永久绑定,不可修改(硬绑定)
    • 关键注意:即使再用call/apply/bind修改新函数的this,也无效;可重复调用新函数,this始终不变
    • 示例:
    function foo(a, b) {
      console.log(this.name, a + b);
    }
    const obj = { name: "王五" };
    const newFoo = foo.bind(obj, 1, 2); // 生成新函数,this永久绑定obj
    newFoo(); // 输出:王五 3
    newFoo.call({ name: "赵六" }); // 依然输出:王五 3(绑定不可改)
    

    4. 三者对比表

    方法是否立即执行this绑定特性参数传递方式核心特点
    call临时绑定,仅当前生效列表形式(逗号分隔)临时借用this,单次使用
    apply临时绑定,仅当前生效数组形式参数较多时更便捷
    bind永久绑定,生成新函数列表形式(可预传参)可重复使用,绑定不可改

    三、个人错题复盘(箭头函数+bind易错重点)

    以下是之前做题时出错的题目,重点分析错误原因,对应this核心规则,彻底避免再错。

    错题1:对象中的箭头函数(第7题)

    var a = 100;
    var obj = {
      a: 200,
      foo: () => {
        console.log(this.a);
      }
    };
    obj.foo(); // 我的答案:200 → 正确答案:100
    
    错误原因

    误以为“obj调用foo,this就指向obj”,忽略了箭头函数无自身this,且对象{}不产生作用域

    正确解析
    • foo是箭头函数,没有自己的this,需继承外层作用域的this;
    • 箭头函数写在obj里,但obj是对象,不是普通函数,不产生作用域;
    • 外层无其他普通函数,this指向全局window,this.a = 100。

    错题2:bind永久绑定(第9题)

    var a = 10;
    function foo() {
      console.log(this.a);
    }
    var obj = { a: 20 };
    var fn = foo.bind(obj);
    fn(); // 我的答案:window → 正确答案:20
    
    错误原因

    忘记bind的“永久绑定”特性,误以为fn()是普通调用,this会变回window。

    正确解析
    • bind会生成一个新函数(fn),并将新函数的this永久绑定到obj;
    • 无论新函数怎么调用(即使再用call),this都不会改变;
    • fn()调用时,this=obj,this.a=20。

    错题3:对象中箭头函数的this(第10题fn2)

    var name = 'global';
    var obj = {
      name: 'obj',
      fn1: function() { console.log(this.name) },
      fn2: () => { console.log(this.name) },
    };
    obj.fn2(); // 我的答案:obj → 正确答案:global
    
    错误原因

    和第7题错误一致,混淆了“对象调用”和“箭头函数的this继承规则”,忽略对象不产生作用域。

    正确解析
    • fn2是箭头函数,无自身this,继承外层作用域的this;
    • 外层无普通函数,this指向window,window.name = \&\#39;global\&\#39;;
    • obj.fn2()只是调用箭头函数,不会改变箭头函数的this指向(箭头函数不看调用者)。

    错题4:setTimeout中箭头函数与普通函数(第5、6题对比)

    // 第5题(普通函数)
    var obj = {
      a: 10,
      foo: function() {
        setTimeout(function() {
          console.log(this.a); // 我的答案:window(正确),但理解不透彻
        }, 100);
      }
    };
    obj.foo();
    
    // 第6题(箭头函数)
    var obj = {
      a: 10,
      foo: function() {
        setTimeout(() => {
          console.log(this.a); // 我的答案:obj(正确),但分不清和第5题的区别
        }, 100);
      }
    };
    obj.foo();
    
    错误原因

    能选对答案,但未彻底掌握“普通函数vs箭头函数”在异步回调中的this区别。

    正确解析
    • 第5题:setTimeout的回调是普通函数,有自身this;普通函数由window调用,this=window,this.a=全局a(无则undefined);
    • 第6题:setTimeout的回调是箭头函数,无自身this;外层是foo(普通函数),foo的this=obj(被obj调用),所以箭头函数继承this=obj,this.a=10。

    四、this经典易错面试题(10道,含解析)

    以下题目覆盖所有核心场景,结合前面的知识点,可自行先做题,再看解析巩固。

    第1题:普通函数直接调用

    var a = 10;
    function foo() {
      console.log(this.a);
    }
    foo(); // 答案:10(浏览器)/ undefined(严格模式)
    

    解析:普通函数直接调用,无明确调用者,this指向全局window(浏览器),window.a=10。

    第2题:对象方法调用

    var obj = {
      a: 20,
      foo: function() {
        console.log(this.a);
      }
    };
    obj.foo(); // 答案:20
    

    解析:obj调用foo,谁调用this指向谁,this=obj,obj.a=20。

    第3题:对象方法单独调用

    var obj = {
      a: 20,
      foo: function() {
        console.log(this.a);
      }
    };
    var fn = obj.foo;
    fn(); // 答案:10(浏览器)/ undefined(严格模式)
    

    解析:fn接收的是foo函数本身,并非obj调用;fn()是普通直接调用,this指向全局。

    第4题:new构造函数调用

    function Foo() {
      this.a = 30;
      console.log(this);
    }
    var f = new Foo(); // 答案:Foo { a: 30 }
    

    解析:new调用构造函数,this指向新创建的实例对象(f),函数内部this.a=30,打印实例。

    第5题:setTimeout普通函数回调

    var obj = {
      a: 10,
      foo: function() {
        setTimeout(function() {
          console.log(this.a);
        }, 100);
      }
    };
    obj.foo(); // 答案:10(浏览器)/ undefined(严格模式)
    

    解析:setTimeout回调是普通函数,由window调用,this=window,window.a=10。

    第6题:setTimeout箭头函数回调

    var obj = {
      a: 10,
      foo: function() {
        setTimeout(() => {
          console.log(this.a);
        }, 100);
      }
    };
    obj.foo(); // 答案:10
    

    解析:箭头函数无自身this,继承外层foo的this(foo被obj调用,this=obj),obj.a=10。

    第7题:对象中的箭头函数

    var a = 100;
    var obj = {
      a: 200,
      foo: () => {
        console.log(this.a);
      }
    };
    obj.foo(); // 答案:100
    

    解析:箭头函数无自身this,外层无普通函数,this=window,window.a=100(对象不产生作用域)。

    第8题:call临时绑定

    var obj1 = {
      a: 1,
      foo: function() {
        console.log(this.a);
      }
    };
    var obj2 = {
      a: 2,
    };
    obj1.foo.call(obj2); // 答案:2
    

    解析:call临时将foo的this绑定到obj2,立即执行,this=obj2,obj2.a=2。

    第9题:bind永久绑定

    var a = 10;
    function foo() {
      console.log(this.a);
    }
    var obj = { a: 20 };
    var fn = foo.bind(obj);
    fn(); // 答案:20
    

    解析:bind生成新函数fn,this永久绑定obj,fn()调用时,this=obj,obj.a=20。

    第10题:综合题(箭头+普通函数+对象调用)

    var name = 'global';
    var obj = {
      name: 'obj',
      fn1: function() {
        console.log(this.name);
      },
      fn2: () => {
        console.log(this.name);
      },
    };
    
    obj.fn1(); // 答案:obj
    var fn = obj.fn1;
    fn(); // 答案:global
    obj.fn2(); // 答案:global
    

    解析:

    • obj.fn1():obj调用普通函数,this=obj,输出obj;
    • fn():fn是普通函数直接调用,this=window,输出global;
    • obj.fn2():fn2是箭头函数,外层无普通函数,this=window,输出global。

    五、总结

    this的核心难点在于“运行时绑定”和“箭头函数的继承规则”,记住口诀+分清场景,就能避开90%的坑:

    1. 普通函数看调用者,箭头函数看书写位置(外层普通函数);
    2. call/apply临时绑,bind永久绑;
    3. 对象不产生作用域,箭头函数写在对象里,this不指向对象;
    4. 优先级顺序记牢,new和bind优先级最高。

    收藏本文,面试前快速过一遍口诀和错题,就能轻松应对this相关面试题~

    (注:文档部分内容可能由 AI 生成)

    截至 4 月 20 日,Hermes Agent 已斩获 100k+ Star,持续霸榜 GitHub,成为近期开发者社区最受关注的 Agent 之一。技术大佬更是直言它是"OpenClaw 上线以来第一个真正意义上的竞争对手。"

    过去大家往往在意 Agent 会不会调用工具、能不能接更多入口、做不做得完任务。而对 Hermes 的讨论更进一步触及 Learning Loop、自我反思,以及 Skill 自进化这类更底层的能力机制。

    Hermes 是什么

    Hermes Agent 由 Nous Research 在 2026 年 2 月开源发布。官方的定义很直接:"The self-improving AI agent"。它最大特点是内置学习环路(learning loop),能从任务中提炼 Skill,在使用中持续改进,主动沉淀知识,搜索过往会话,并在跨会话过程中逐步形成对用户的长期理解。

    简单说,它试图成为一个会持续积累经验的个人 AI Agent。

    OpenClaw 与 Hermes

    提到 Hermes,不可避免地要和 OpenClaw 一起讨论。它们都不只是单点脚本、聊天 bot,而是把模型、工具、会话、记忆、Skill 和运行环境包在一起的通用 Agent 系统。目前,Hermes 与 OpenClaw 都已越过所谓"模型包装器"的阶段,区别不在"是不是 Agent",而是"厚度长在什么地方"。

    两者在系统重心上有所区别:OpenClaw 管入口和秩序,更像控制面,重点是把入口、会话、权限、路由和秩序组织进系统;Hermes 管执行和经验,更像学习循环,重点是把执行中的方法沉淀下来,并在后续任务里复用。

    此外,这两个工具的差异还体现在 Skill 上。OpenClaw 的 Skill 更像团队里的 SOP 库,强调来源、加载、优先级和治理;Hermes 的 Skill 更像任务完成后沉淀下来的工作笔记,强调把成功路径保存成可复用的方法。也就是说,前者更强调把能力组织起来,后者更强调把方法留下来,进行后续的迭代加强。

    再往下拆,两者的差异还可以概括成下面这几个维度:

    Skill 自进化:Hermes 最值得聊的东西

    这不是设计师画的,也不是程序员写的——这是 Hermes Agent 调用自己创建的 Skill 生成的。

    Hermes 的 Skill 不是插件,不是扩展,而是 Agent 在完成复杂任务后自动生成的操作手册——一个名为 SKILL.md 的文件。

    格式很简单:YAML 头部(名称、描述、标签、版本)加 Markdown 正文(使用场景、操作步骤、常见坑、验证方法)。文件则保存在 ~/.hermes/skills/ 目录下。

    一句话概括:OpenClaw 存储你说了什么(memory),Hermes 存储它学到了什么(skill)。

    需要注意的点,Skill 不是 Hermes 的私有格式。agentskills.io 是 Skill 的开放标准规范,已经被 Claude Code、Cursor、Kiro、VS Code 等 16 个 AI 产品采纳。无疑,Skill 是目前 AI 行业采用最广泛的事实标准。

    自进化是怎么发生的?

    过程拆解开,如下:

    1. 第一次执行复杂任务
    2. 完成(5+ tool calls 成功)
    3. Agent 自动抽象步骤 → 生成 SKILL.md
    4. 第二次遇到类似任务
    5. Agent 调用已有 Skill → 速度更快、步骤更少
    6. 如果有新发现 → Agent 自动 patch SKILL.md
    7. Skill 越用越精准

    当中关键点:

    • 生成 SKILL.md 的触发条件是完成 5 次以上复杂任务的工具调用(tool call),像是你和 AI 之间的简单问答并不会生成 Skill
    • 自进化方式是 LLM 驱动的 Markdown 改写
    • 高级玩法:hermes-agent-self-evolution 用 DSPy + 遗传算法做 Skill 变异优化,单次进化开销在 $2-$10 之间

    实战:用 architecture-diagram 走一遍全流程

    相信不少人对"自进化"的说法保持怀疑,现在我们来简单验证一下:

    第一步:让 Hermes 画一张架构图

    给个常见需求:"画一个 React + Node.js + PostgreSQL + Redis + S3 的系统架构图。"

    Hermes 调用内置的 architecture-diagram Skill,接着 7 步:

    1. 分析需求
    2. 规划布局
    3. 计算坐标
    4. 生成 SVG
    5. 包装成 HTML
    6. 输出一个独立 HTML 文件
    7. 浏览器打开

    简单讲解下色块,它十分清晰,Skill 以对应技术产品的 logo 色作为参考。像是前端 React 的青色、后端 Node.js 的翡翠、PostgreSQL 数据库的紫色、云服务 S3 的淡黄、Redis 数据库的淡橙。我们不需要指定配色,Skill 文件里默认这套配色设计,你可以按需自行修改对应的配色。

    第二步:Skill "操作手册"长什么样

    打开 ~/.hermes/skills/creative/architecture-diagram/SKILL.md,里面有完整的 Workflow、Design System、连线规则、间距逻辑。这是 Hermes 在反复执行架构图任务后积累形成的。

    第三步:用 Anthropic 官方工具验证这个 Skill

    skill-creator 来自 anthropics/skills 仓库,是 Anthropic 官方出品的 13 个标准 Skill 之一。它的定位很特别——Meta-Skill:专门用来创建、测试、迭代其他 Skill。

    它能自动生成 eval 测试用例、跑 benchmark、给出质量评分、建议改进方向。把 Hermes 生成的 architecture-diagram SKILL.md 喂给了 skill-creator,结果很有意思:它指出了几个真实问题。

    比如:8 个以上组件时布局会乱、连线路由在密集场景下会重叠、验证步骤不够完整…

    第四步:按建议改进 → 再验证 → 分数提升

    根据 skill-creator 的反馈,我们来改进下 Skill:补充组件数量警告、增加布局验证步骤、完善边缘场景处理。再跑一次验证,分数上去了,图片也更美观了。

    这就是自进化,一个可重复的、有方法论的闭环:

    Hermes 创建 Skill → Anthropic 官方工具验证质量 → 发现问题 → 改进 → 再验证 → 能力提升

    不止于此:正在成型的 Skill 生态

    Hermes 绘制架构图只是开始,Hermes 的 Skill 已初具生态规模:

    • 官方开箱即用: 官方 optional-skills/ 目录下已沉淀 28+ 个 Skill,覆盖了 DevOps、代码研究、安全审计等 13 个常见开发场景
    • 拥抱开放标准: 采用 agentskills.io 规范,这意味它生成的 Skill 可以与 Claude Code、Cursor 等其他 10+ 种主流 AI 工具互通
    • 极客的高阶玩法: 开发者社区已经开始出现基于 DSPy 和遗传算法的衍生项目(hermes-agent-self-evolution),通过程序让 Skill 自行变异、跑测和择优

    当然,赞叹之余,我们还需要客观认清其能力边界:

    • 触发有门槛: 简单的日常闲聊无效,只有成功完成复杂任务(5+ tool calls)才会触发总结机制
    • 是"记笔记",而非"微调训练": 官方宣称的 "Self-improving" 有夸大成分。它没有在底层微调大模型,只是让 Agent 写了一份高质量 SOP 留给下次参考
    • 仍需人工审核: HN 极客曾吐槽传统 Memory 流是一团乱麻("a complete mess")。Hermes 的 Skill 虽高度结构化,但在极端复杂场景下,依然离不开开发者的人工微调
    • 验证的是规范: 本文工具验证的是 Skill 文档的逻辑与格式完整性,并不是在给 AI 测智力

    即便我们罗列一些槽点,但这不影响核心结论:凭借这套可复用的经验沉淀机制,Hermes 已经是目前开源框架中最接近"越用越强"的实现。它不完美,但方向对了。

    让"自进化"飞轮持续转下去

    Hermes 的"自进化"依赖于真实任务的反复试错与积累。跑通只是第一步,长线运行才是让它"越用越强"的关键。

    如果你已经跨过了本地尝鲜阶段,希望专属 Agent 能 7x24 小时在线待命,并随时随地复用它积攒下来的 SKILL.md,可以借助七牛云的现成基建快速落地:

    • 七牛云 LAS: 10 分钟轻松部署,免折腾环境,实现 Agent 的云端常驻与能力持久化
    • 七牛云 MaaS: 无缝接入主流大模型,低成本 Token 足以覆盖 Agent 日常跑 Demo

    无论是开发者们在本地手搓,还是在云端长期挂机,Hermes 都值得每个开发者亲自上手一试。

    👉 [上手专属] 七牛云 LAS 特惠活动:https://s.qiniu.com/IviUfa
    👉 [算力弹药] 邀好友最高领百亿 Token:https://s.qiniu.com/rAzUZ3
    👉【10分钟部署】Hermes Agent 一站式部署教程:[https://mp.weixin.qq.com/s/ugqS0neWETsLEn9sqX2t1g]

    做独立开发有一段时间了,最近上线了一个 AI 音效生成平台 aiwave,用户输入一段中文描述就能生成对应的专业音效。这篇文章聊聊整个项目的技术选型、踩过的坑和一些思考,希望对同样在做音频方向的开发者有参考价值。


    项目是什么

    简单说就是一个 Text-to-Sound-Effect 的平台。用户输入类似"暴风雨中远处传来的雷声,伴随雨点打在玻璃窗上"这样的描述,AI 在 3 秒内生成对应的音效文件。除了 AI 生成,还做了一个浏览器内的音效编辑器,支持裁剪、淡入淡出、混响调节等操作。

    核心用户群是视频创作者、独立游戏开发者和播客主播——这些人经常需要找特定的音效,传统素材库搜不到就没辙,AI 生成正好解决这个问题。


    技术栈选型

    前后端分离架构:

    前端: Next.js 15 + React 19 + TypeScript + Tailwind CSS + shadcn/ui + Zustand

    选 Next.js 主要是为了 SSR 和 SEO,音效平台需要被搜索引擎收录。React 19 的 Server Components 在首屏加载上提升明显。状态管理用的 Zustand,比 Redux 轻量太多,音频编辑器的状态逻辑用 Zustand 管理很舒服。

    后端: Node.js 20 + Fastify 5 + Prisma 6 + Zod

    Fastify 比 Express 快不少,而且原生支持 JSON Schema 校验。Prisma 做 ORM 类型安全很好,配合 Zod 做入参校验基本杜绝了类型问题。

    数据库: PostgreSQL 16 + Redis 7

    AI 引擎: 音效生成接的是底层 AI 引擎,做了 7 天缓存策略减少重复调用成本。


    最难的部分:浏览器内音频编辑器

    这是项目里花时间最多的模块。基于 Web Audio API 实现,支持以下操作:

    • 波形可视化显示
    • 音频裁剪(精确到毫秒)
    • 多段音轨叠加
    • 淡入淡出效果
    • 音量调节
    • 导出 WAV / MP3 / OGG

    踩坑 1:Web Audio API 的 AudioContext 生命周期

    浏览器安全策略要求 AudioContext 必须在用户交互(点击/触摸)后才能启动。如果你在页面加载时就创建 AudioContext,Chrome 会把它置于 suspended 状态。

    解决方案是延迟创建,在用户第一次点击播放按钮时才初始化:

    let audioCtx = null;
    function getAudioContext() {
      if (!audioCtx) {
        audioCtx = new AudioContext();
      }
      if (audioCtx.state === 'suspended') {
        audioCtx.resume();
      }
      return audioCtx;
    }

    踩坑 2:大文件波形渲染性能

    直接用 Canvas 画完整波形在长音频(>10秒)时会很卡。最终方案是对音频数据做降采样,把几万个采样点降到 Canvas 像素宽度的 2 倍,渲染性能提升了 10 倍以上。

    踩坑 3:音频导出格式

    Web Audio API 原生只支持导出 PCM 数据,要输出 MP3 需要用 lamejs 库做编码,OGG 需要 vorbis-encoder。导出过程放在 Web Worker 里跑,避免阻塞主线程。


    AI 音效生成的提示词工程

    接底层 AI 引擎不难,难的是让中文用户的描述能被准确理解。做了一层提示词预处理:

    1. 用户输入中文描述
    2. 后端用 DeepSeek 做语义增强(≤2轮对话),补充音频专业术语
    3. 增强后的描述发给 AI 引擎生成

    比如用户输入"老式收音机调台的声音",经过增强变成更精确的音频描述,生成效果会好很多。


    缓存策略

    AI 生成单次成本不低,所以做了多级缓存:

    • Redis 缓存: 相同描述 7 天内直接返回缓存结果
    • OSS 存储: 生成的音效文件存阿里云 OSS + CDN 加速
    • 前端缓存: 用户最近生成的记录本地缓存

    这样同一个描述的音效,第一个用户等 3 秒,后续用户毫秒级返回。


    和其他方案的对比

    做调研时看了不少同类产品:

    产品定位优势局限
    可灵 AIAI 视频创意大厂生态音效功能是附属
    aiwaveAI 音效生成中文友好+在线编辑器单次最长 30 秒

    我觉得 AI 音效和 AI 音乐是两个不同赛道。音乐生成已经很卷了,但纯音效生成的产品在国内几乎是空白,这也是我选择做这个方向的原因。


    一些数据

    上线到现在的一些情况:

    • 注册用户自然增长中(没做推广)
    • 生成成功率 > 95%
    • 平均生成耗时 3.2 秒
    • 最受欢迎的音效类型:环境音 > 科技界面音 > 动作音效

    总结

    做一个 AI 音效平台,AI 部分其实不是最难的(接 API 就行),真正耗时间的是:

    1. 浏览器内音频编辑器(Web Audio API 坑巨多)
    2. 提示词工程(让中文描述变成高质量的音频生成指令)
    3. 缓存和成本控制(AI 调用成本 vs 用户体验)

    如果你也在做音频方向的项目,欢迎交流。

    项目地址:aiwave.art
    GitHub:github.com/liushafeiniao/aiwave


    如果这篇文章对你有帮助,点个赞 👍 让更多人看到。


    2026年4月20日晚,Kimi-K2.6正式发布,Comate Day 0同步首发,将其上线为IDE及插件端内置模型,支持图片理解,供用户使用。

    Kimi-K2.6 是月之暗面最新发布的模型。Kimi-K2.6 在代码编写、长程任务执行及 Agent 集群能力方面实现了全面升级。据官方披露,Kimi K2.6 在博士级难度的完整版“终极人类考试”(Humanity's Last Exam)、评估真实软件工程能力的 SWE-Bench Pro 以及 Agent 深度检索基准 DeepSearchQA 等测试中,均取得了行业领先的成绩,表现持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。

    Comate持续为用户提供在编程领域最新、表现优秀的模型,成为您的最佳编程伙伴~将Comate AI IDE及插件端升级至最新版本,立即体验全新Kimi-K2.6模型带来的生产力提升!

    一键更新Comate ,来体验长程编码能力显著提升、大幅增强Agent自主化执行能力吧

    更新途径一: 百度搜索“文心快码”,官网下载Comate AI IDE最新版;

    更新途径二: Comate AI IDE 界面点击 “重启以更新”;

    更新途径三: VS Code 或者 Jetbrains 系列 IDE 搜索文心快码插件,点击“安装”或“更新”。

    如果您(或所在机构)对百度文心快码感兴趣,请扫码联系下方微信~

    任何文心快码售前及售后问题
    欢迎添加产品顾问咨询(请带前缀:Comate咨询)
    工作时间:工作日10:00-18:00

    对于iOS开发者和有应用分发需求的企业来说,苹果签名是绕不开的关键环节。它就像苹果系统给应用颁发的“通行证”,只有拥有合法“通行证”,应用才能在iOS设备上正常安装和运行。不同于安卓系统的开放分发,苹果签名有着严格的分类和规范,不同类型的签名适配不同场景,今天就用通俗的语言,带大家认识主流苹果签名类型,避开认知误区。
    最基础的是个人开发者签名,主要面向个人开发者或小型开发团队,用于应用的初期调试和小范围试用。它需要依托苹果个人开发者账号开通,费用适中,操作门槛低,新手开发者也能快速上手。使用时需提前将测试设备的UDID录入账号,单账号最多可绑定100台设备,签名有效期为一年,到期后需及时续签。这种签名的核心价值的满足开发调试需求,不适合大规模对外分发,仅能用于内部测试或少量种子用户体验。
    针对企业需求的是企业签名,专为企业内部分发应用设计,无需绑定设备UDID,也没有设备数量限制。企业只需拥有苹果企业开发者账号,即可生成签名,员工或内部用户下载应用后,简单操作即可完成信任,快速安装使用。它广泛应用于企业内部办公软件、内部培训应用等场景,能极大提升企业内部应用的部署效率。需要注意的是,企业签名仅能用于企业内部使用,若违规对外分发,可能导致证书被苹果吊销,影响应用正常使用。
    兼顾稳定性和便捷性的是超级签名,它基于个人开发者证书优化而来,解决了个人签名设备绑定繁琐的痛点。用户安装应用时,无需手动提供UDID,系统会自动完成设备绑定和签名,操作更便捷。同时,超级签名采用单设备独立签名的方式,大幅降低了掉签概率,稳定性远超普通企业共享签名。它适合对应用稳定性要求高、分发范围较小的场景,比如小众应用测试、精准用户体验投放等,唯一不足是成本随设备数量增加而上升。
    最合规的是TF签名,也就是TestFlight签名,是苹果官方推出的测试签名方式。应用需先通过苹果的基础审核,审核通过后,可邀请外部用户参与测试,最多支持1万名测试用户,测试周期为90天。用户只需下载TestFlight官方应用,即可直接安装测试版应用,无需手动信任证书,零掉签风险。这种签名适合需要公开测试、收集广泛用户反馈的应用,尤其适合对合规性和安全性要求高的行业,唯一局限是审核有一定标准,部分特殊功能应用可能无法通过。
    综上,各类苹果签名没有优劣之分,核心是适配需求:个人调试选个人开发者签名,企业内部分发选企业签名,追求稳定便捷选超级签名,合规公开测试选TF签名。掌握这些核心区别,就能轻松选对适合自己的苹果签名。

    事情经过我就不仔细描述了,之前都发过,上次发的那篇可能因为评论原因进小黑屋了,公司给本地棋牌 APP 做资金结算,又把资金结算卖给了别人,自己干起了四方支付,在这家公司上班了 2 年 10 个月,最后检察院给了相对不诉,退了 3 个月工资。

    历经 3 个月时间,从公安取保到拿到不起诉决定书,刚取保时候每天都活在那种害怕听到电话铃声的状态。前一个月线下找过本地律师,本地律师说小事情。然后就天天在闲鱼找前刑警,在抖音找各种直播律师咨询,也花了不少咨询费。闲鱼上给的答复都是比较乐观,直播律师就一个说的是你出不来了,会进去坐牢,其他基本都是说把工资全退了拿个缓,那段时间真的是焦虑的不行。

    去过 3 次派出所,一次是询问,一次是移送审查前的笔录,一次是把银行流水自己截图拿过去,去过 1 次办案中心,去做的讯问笔录,这 4 次,办案民警每次都是和我说检察院那边不会起诉,就是走个流程,但得退赃。

    后面移送审查后,去过两次检察院,第一次是谈话,比较轻松,没有像去办案中心那样需要进小黑屋坐在固定手脚的凳子,就是问一些有没诱供有没刑讯逼供,然后把办案民警问的话再问了一遍,让我不要狡辩了,肯定会给我从轻处罚,问完让我把工资流水 APP 上截图交给办案民警,我问她能不起诉吗,说的是还没决定需要和领导汇报。

    我们把工资流水交给了办案民警,第二天检察院就电话来了,说退 3 个月工资,工资按扣除社保个人所得税这些算,还给我们一个月减免了 1000 ,可能是为了凑到那个罚金,让我们抓紧筹钱,这样她才好去和领导申请不起诉。后面约了我今天下午过去退违法所得和做认罪认罚,没说会给不起诉。

    今天下午过去,先和我们说,你们先把钱交了,然后一个个进来给你们做认罪认罚,做完你们再等一下,今天把不起诉决定书一起弄了,但后面可能公安还会有行政处罚。

    因为有一个同事还请了律师,那个律师还迟到了很久,律师费真的是白给了他,纯属过来捡钱的,我们就在那等了一会,检察官闲聊时候说以后找工作要注意点,特别是你们程序员互联网行业这些,她们遇到了太多了诈骗啊开设赌场啊,叫我们以后发现不对就赶紧离职。后面同事律师来了,做完认罪认罚,检察官去做不起诉决定书,一会就搞好了,各回各家。中间因为我同事之前提供给公安的流水和我相差了 7 万多,叫他去解释了下。

    现在就等办案民警给我们做行政处罚,不知道会不会罚的很夸张,还有会不会行政拘留,我同事问了他律师,律师说不知道,要看公安那边怎么定了,我也问了检察官助理,他说一般不会超过检察院定的违法所得的钱。

    终于自由了,下周要去上班了,AI 时代也不知道这家公司能干多久,说不定下个月就失业。