纯情 发布的文章

这两个对比下来哪个好用呢,现在楼主用 CC 和 cursor 比较熟,听说 Codex 也很不错,想把 cursor 退订用下 Codex ,听说量大管饱,不知有人都体验过吗?直接官方订阅还是要中转

2025 年 12 月 13 日,VeloxCon China 2025 在北京成功举办。作为 Velox 项目首次在中国举办的线下技术大会,汇聚了来自Meta、IBM、蚂蚁集团、阿里云、腾讯、小米、小红书等企业的数十位核心贡献者与一线工程师。

大会通过 18 场演讲将 Velox 置于真实业务场景之中,系统展示了其在架构演进、AI 数据处理、湖仓加速、流批融合等方向的最新实践。这些分享不仅直面性能、稳定性与兼容性等落地挑战,也反应了开发者社区对构建可靠、可扩展、可协同的数据基础设施的共同探索,彰显了中国开发者在全球高性能分析生态中的工程深度与协作广度。

夯实底座,突破能力边界
会议伊始,Velox 项目联合发起人 Pedro 发表开幕致辞。他回顾了 Velox 开源项目的发展历程,从项目启动、开源发布到建立技术治理结构,展示了 Axiom 架构、GPU 支持、PyVelox 等关键进展,强调了社区协作与工程严谨性是项目持续演进的核心动力。他特别提到,Velox 已建立了正式的技术治理机制,并迎来来自 IBM、Intel、NVIDIA、Microsoft 等多家企业的新增维护者,标志着项目正迈向更加开放和可持续的阶段。

在明确了社区与架构演进的总体方向后,大会议题迅速深入到如何利用 Velox 构建高性能计算引擎的具体实践中。阿里云 EMR Serverless Spark 技术负责人周克勇系统阐述了“可组合性”在数据计算领域的实践。他详细解析了阿里云如何深度集成并贡献于 Apache Celeborn、Paimon、Velox 及 Gluten 等开源组件,通过模块化组装构建出高性能湖仓一体引擎。他指出,基于该架构,阿里云 EMR Serverless Spark 成功创造了 TPC-DS 100TB 规模性能测试的世界新纪录,实现性能翻倍与性价比大幅提升。

接着,Meta 软件工程师 Masha Basmanova 阐述了现有查询引擎在跨语言通信、优化器能力与开发体验上面临的挑战,并介绍了基于 C++ 的统一前端框架 Axiom。该框架将 SQL 解析、逻辑优化与物理执行融为一体,通过内置的强大优化器与 Velox 运行时无缝对接,能够实现更高效、可扩展的查询处理。演讲最后,她积极展示了 Axiom 的开源路线图,并欢迎全球开发者加入,共同推动该项目的演进。

强大的执行框架,最终需要服务于极具挑战性的数据场景,特别是爆发式增长的 AI 数据。Meta 软件工程师孟晓烜则在之后的演讲中,深入阐述了应对AI训练数据规模激增与成本挑战的解决方案。他重点介绍了 Meta 如何通过数据归一化技术剥离重复特征,并构建可索引的序列存储系统。依托 Velox 技术栈,团队在训练数据的加载、生成与探索三大环节实现了端到端优化,显著提升了处理效率与资源利用率。

在 Meta 多位工程师从框架演进、可组合架构、数据标准化等角度深入分享后,蚂蚁集团高级技术专家黄叶伟也从企业落地实践层面分享了基于 Velox 的 Spark 加速实践。他重点介绍了基于 Gluten 与 Velox 构建的向量化引擎如何通过任务级 Fallback、Spill 优化、Shuffle 优化等关键技术,在混合部署场景下显著提升 Spark 性能与稳定性。他表示,该方案目前已实现日均数十万任务覆盖,平均节省资源超30%,并将在算子优化与架构扩展方面持续演进。

作为连接 Spark 生态与原生加速的关键中间层,Apache Gluten 的进展同样备受关注。来自 IBM 的莫芮与周渊聚焦 Apache Gluten与 Velox 的深度集成,阐述了其如何在大数据分析中驱动创新。他们介绍,Gluten 在保持对 Spark/Flink 作业透明加速能力的同时,正逐步增强对多后端引擎和复杂业务场景的适配能力。目前,该方案已在 Pinterest、顺丰科技及多个内部集群完成规模化验证,有效支撑了从日志分析到物流调度等多样化负载的性能提升与成本优化。

随着向量化加速在通用场景日趋成熟,针对特定存储格式的深度优化成为新的效能突破口。腾讯大数据开发工程师陈锦海分享了微信基于 Velox 加速 lceberg 湖仓分析的优化与实践,重点介绍了原生分桶方案。据他介绍,该方案通过动态识别表元信息自动设置分区数,能有效缓解 AQE 引发的写入倾斜,结合空闲资源灰度发布策略,可保障大规模作业的稳定上线。

扎根场景,释放协同效能
午餐后的议程更加聚焦 Velox 在真实业务中的集成深度与生产韧性,回应了开发者们对兼容性、稳定性与端到端效能等规模化落地的核心关切。
小米计算平台计算引擎负责人王胜杰分享了公司在 Spark 向量化升级中的规模化落地经验。面对业务迁移中的兼容性与稳定性挑战,他表示,小米通过自动兼容校验、双跑结果比对及内存异常感知的三级资源升级机制,已成功推动向量化改造在数十万作业中平稳落地。

面对海量数据挑战,全球科技公司也在探索相似的演进路径。Meta 软件工程经理 Stanley Yao 在演讲中分享了公司基于 Velox 推进 Spark 向量化改造的整体策略。他表示,团队通过从定制化方案到开源架构的持续演进,已实现关键业务管线向 Gluten(Flare)的平稳迁移,并获得显著的效率提升。未来,Meta 计划进一步扩大该架构的应用规模。

在 CPU 向量化趋于普及的同时,利用异构硬件挖掘更高性能成为新的前沿。IBM 研究院资深软件工程师 Zoltán Arnold Nagy 展示了基于 Velox 与 Presto 的 GPU 加速数据处理方案。他介绍道,Velox 通过与 cuDF 集成,可在 GPU 上高效执行算⼦,并针对多 GPU 分布式场景优化通信与数据交换。此外,为突破 I/O 瓶颈,团队正在探索结合 GPUDirect 存储与缓存层的加速策略。

对性能与稳定性的追求,也驱动着查询引擎架构本身的融合与创新。Meta 软件工程师谭家梁与大家分享了 Native Presto-on-Spark 的规模化应用。该架构以 Presto 查询优化、Spark 资源调度与容错机制以及 Velox 原生向量化执行为核心,实现了性能与可靠性的显著提升。他表示,目前该方案已在生产环境中取得成效,并将在未来持续推进全栈原生化演进。

对于国内庞大的云上业务,Velox 同样在支撑着关键数据服务平台。 阿里云高级工程师王彬与范阿冬系统介绍了Velox在阿里云日志服务中的深度集成与应用。他们指出,基于 Velox 构建的高性能查询引擎,通过混合执行、表达式下推、自动增量物化视图及免 Schema 分析等核心技术,可显著提升平台在处理海量实时数据时的查询效率与资源利用率。他们还强调,该架构不仅为日志分析、智能运维等场景提供了稳定支撑,也为面向 AI 的云原生数据平台演进奠定了坚实基础。

除了通用的日志与湖仓分析,Velox 也在向更垂直的时序数据场景渗透。腾讯高级工程师李兆龙分享了基于 Velox 构建云原生时序数据库的落地经验。他表示,通过在 Velox 中实现时序数据去重优化与存储写入增强,系统在应对高频写入与实时查询场景时,可显著提升吞吐效率与响应性能。目前该方案已有效支持物联网、实时监控等业务场景,未来还将进一步完善缓存与压缩机制,持续优化时序数据处理的整体效能。

IBM 软件工程师刘平接着分享了 Velox 在 Iceberg 数据写入能力上的突破性进展。他表示,目前 Velox 对 Iceberg 的支持以读取为主,其写入功能的完善将填补该方向的关键能力空白,为基于 Presto 与 Spark 的数据湖架构提供更统一、高效的数据摄入层。这一进展也标志着 Velox 正从查询加速向数据全链路处理拓展。

接着,来自阿里云的毕岩与周滔分享了 Velox 与 Apache Paimon 深度集成的解决方案,为提升引擎与存储的协同效率提供了另一种集成思路。在他们看来,现有方案存在表类型支持受限、缺乏可移植性等瓶颈, 但可以建立 C++ 原生 Paimon 库,通过其统一的数据协议与插件化设计,使 Paimon 能够被 Velox、StarRocks 等多种计算引擎直接高效调用,从而提升数据读写性能,并为湖仓格式的跨引擎协同提供新的基础支撑。

在批处理场景之外,流计算框架的向量化也正成为新的热点。蚂蚁集团技术专家刘勇介绍了基于 Velox 为 Flink 构建的统一向量化执行引擎 Flex。他表示,Flink 作为流批一体架构的核心,其原生向量化能力的补足至关重要。Flex 通过将 Velox 的高性能算子能力引入 Flink,同时结合自动化验证、可视化计划与精细化回退机制,现已实现了作业性能的显著提升,并支撑多条核心业务链路平稳运行。

随着 Velox 赋能的应用场景日益广泛和复杂,确保其在不同引擎和版本间的整体质量与可靠性变得至关重要。Meta 软件工程师 Eric Liu 阐述了在 AI 数据基础架构下,保障 Velox 多引擎版本可靠性的系统化方法。他指出,面对不同引擎与存储格式交织带来的复杂性,关键在于建立跨引擎测试框架与合成数据工厂。这一实践能有效提前发现全栈潜在问题,从而确保底层变更在大规模生产环境中的稳定与高效。

针对向量化引擎中窗口运算符内存溢出的典型难题,来自英特尔的贾柯分享了她的见解。她认为,通过为 Velox 引入流式窗口处理机制,可使计算随数据到达逐步执行并即时释放内存,从而从架构层面化解多数场景下的内存风险,显著提升复杂查询的稳定性。

最后,小红书 Native Engine 团队技术负责人魏秀利也分享了向量化引擎在公司业务中规模化落地的经验。据他介绍,通过将写入异步化并构建原生 Avro 读取能力,小红书在不增加业务复杂度的前提下,成功缓解了端到端延迟,印证了“执行与存储协同优化”在湖仓场景中的关键价值。

从底层执行引擎的持续创新,到日志分析、湖仓写入、流批融合等复杂场景的稳定运行,在本届 VeloxCon China 上,我们看到 Velox 的技术价值已在真实业务中不断被验证和拓展。同时我们也很高兴看到中国开发者成为这一进程的重要推动者。期待未来有更多志同道合者加入 Velox 开源社区,共建高性能分析基础设施。个weibo.com/ttarticle/p/show?id=2309405293205615935595 weibo.com/ttarticle/p/show?id=2309405293205960130614 weibo.com/ttarticle/p/show?id=2309405293206303801698 weibo.com/ttarticle/p/show?id=2309405293206643802219 weibo.com/ttarticle/p/show?id=2309405293207130079429 weibo.com/ttarticle/p/show?id=2309405293207474274370 weibo.com/ttarticle/p/show?id=2309405293207822139421 weibo.com/ttarticle/p/show?id=2309405293208249958472 weibo.com/ttarticle/p/show?id=2309405293208589697061

求大家推荐一些言论自由的日记网站或者软件。

不知道大家有没有写日记的习惯呢?我感觉传统纸质的日记虽然隐私性够好,但是不方便迁移,而且容易损坏,加上一些场景光用文字是无法描述清晰的,就需要插图,类似博客那种,但是博客管控非常严格,各种文字不让发,各种违规,还要提交各种证据去证明这个博客是你的,非常麻烦。

我的需求是要绝对的言论自由,不受任何限制,也不会动不动就因为敏感导致无法阅览、下载这种问题,所以国内的产品全部都可以排除了,毕竟大家都懂得。

想过找开源的项目搞,但是都做的很囊肿,我并不需要那么多内容,也考虑过自己写一个,但是那样又有点脱裤子放屁了,所以还是来问一下大家,看看有没有更好的选择?毕竟当局者迷,旁观者清。如果确实没有类似的,那我就只能自己手搓了。

以前只敢在高速高架上开,慢慢发现在城区处理的也很不错,用得越久越知道智驾的边界在哪里,哪里需要接管,很多地方比我自己处理要好,比如说路口右转和直行电动车的博弈就非常老司机

看到有帖子购买人生第一辆车首选合资油车的(/t/1209326 ),我的感受是,如果是新手不懂操控不懂驾驶感受的,强烈推荐国产新能源,智驾一旦试过就离不开了

JeecgBoot AI专题研究 | 用 DeepSeek V4 几乎完美替代 Claude,唯一卡点就是不收图——这块短板马上要补上

一句话先说结论

DeepSeek V4 系列上线一周多,密集跑下来,Claude Code 接 DeepSeek V4-Pro 已经能完美替代原生 Claude 跑日常开发:写代码、改 bug、跑 Skills、生成报表大屏、自动化部署,全部丝滑。唯一让人难受的短板就是 V4 还不收图——架构图、设计稿、错误截图扔不进去,只能切回 Claude。

好消息是:4 月 29 日 DeepSeek 已经在 Web 端灰度推送识图模式,这块短板很快就要被补齐。如果你和我一样在用 Claude Code + DeepSeek 的组合,再忍两周,体验就会齐活。


这一周用下来:DeepSeek V4 真的能替代 Claude

我之前写过一篇 Claude Code + DeepSeek V4-Pro 真实评测,结论是"除了贵,没别的毛病"。这几天密集再压一轮,结论要更乐观一些——贵的问题随着用量上来已经被摊平了,稳定性反而是最大的安慰

具体替代效果分几条说:

① 代码生成与重构:基本无感切换

跑 JeecgBoot 的 Skills 生态——OA 流程自动搭建、积木 BI 大屏生成、钻取报表、自动化部署、Online 表单——这些场景下 DeepSeek V4-Pro 的输出质量和 Claude Sonnet 4.6 几乎打成平手。长上下文不掉链、工具调用准确率高、JSON 结构稳定,是工程化最看重的三个指标。

② 工具调用与 Skills 执行:兼容性满分

Anthropic 协议兼容层做得很到位,Claude Code 那一套 tools / tool_choice / tool_use 字段不需要改任何代码,直接换个 base URL 就能跑。Skills 执行链路里那些复杂的 nested tool call、多轮迭代修正、stream 模式,全部无缝

③ 账号稳定性:真正的解放

这条本来排不到这么靠前,但最近半年 Claude 账号批量被封的消息一波接一波,身边的同事中招的不少。DeepSeek 是国内主体、计费透明、合规清晰,再不用每天担心一觉醒来号没了——光这一条就值回票价。

④ 成本:日常开销降到 1/5

Opus 4.6 输入价 $15/百万 tokens,DeepSeek V4-Pro 是 ¥4/百万 tokens 左右(折合不到 $0.6),输入端便宜 25 倍以上。一天写 200 万 token 的开发者,月度账单从四位数美金降到三位数人民币,企业用量更明显。


那个让人坐立不安的"唯一短板":DeepSeek V4 不收图

舒服归舒服,但只要任务一旦涉及"看一眼这张图给点意见",DeepSeek 就立刻举手投降。

模型收到截图后,在界面上诚实地打印出一行字:

没错------它看不见图片

V4-Pro 当前版本是纯文本模型,完全不支持图片输入。

Claude Code 在发送图片时,V4-Pro 会收到一个占位符 [Image #1],但对实际图像内容毫无感知。所以你看到的那句"我无法直接查看图片"不是谦虚,是真的看不见。

对于日常编程工作流,这个限制影响面相当广:

  • 截图报错让模型分析 → ❌ 看不见
  • 发 UI 设计稿让模型写代码 → ❌ 看不见
  • 发报表渲染结果让模型诊断问题 → ❌ 看不见
  • 粘贴终端截图 → ❌ 看不见

社区里催识图能力的帖子从去年下半年到现在没断过,DeepSeek 团队也在 GitHub Issues 里多次回复"在做了在做了"。这次灰度上线,算是把欠了一年多的功课正式补上。

4 月 29 日的灰度推送:识图模式正式登场

灰度入口出现在 DeepSeek Web 端聊天框左下角的功能区,多了一个"识图"开关。开启后输入框右侧会出现回形针图标,可以直接拖拽或粘贴图片。API 端目前还没看到对应字段,但根据通常的灰度节奏,预计两周内会同步开放给 Pro 用户——这才是 Claude Code 用户真正等的那一天。

不是凭空出现:那些被忽略的多模态铺垫

很多人以为 DeepSeek 之前一直只做文本,识图能力是凭空冒出来。其实早就有伏笔,只是声量没那么大:

  • 2024 年 12 月 · DeepSeek-VL2:开源 MoE 架构多模态模型,3 个尺寸(3B / 16B / 27B 激活),覆盖通用视觉任务
  • 2025 年初 · Janus:统一视觉理解与生成的双流架构,解耦 encoder,生图与读图共享主干
  • 2025 年 · JanusFlow:引入 Rectified Flow 训练范式,被 CVPR 2025 主会议收录
  • 2025 年 · Janus-Pro:在 GenEval 基准上超越 DALL·E 3 与 Stable Diffusion,进入 SOTA 第一梯队

也就是说,DeepSeek 在多模态这条线上一直在砸论文和开源模型,缺的只是把它装进 Chat 主入口和 API 这一脚。这次灰度推送,本质上是把研究侧的能力正式产品化。

之前为什么迟迟不发?我个人猜测有两个原因:

  1. 算力优先级:V3 → V4 系列的迭代消耗了主力 GPU 集群,多模态推理对显存的额外开销让 PM 优先选了文本侧的提升
  2. 数据合规:图像里包含人脸、车牌、敏感场所等隐私元素,国内合规要求高,安全侧需要更长时间打磨

写在最后

这一周用 Claude Code + DeepSeek V4-Pro 替代原生 Claude 的体验只能用一个词形容——舒坦。账号不会被封、账单看得懂、能力跟得上、Skills 链路无缝。唯一让我难受的就是不收图这一件事,每次切回 Claude 都觉得是退回到了上一个时代。

这次识图模式灰度,不只是 DeepSeek 自己补一块拼图,对 Claude Code 用户来说,这是国产模型替换闭源 SOTA 的最后一道坎。两周后 API 开放、Anthropic 协议兼容层把 image 字段加上,Claude Code 接 DeepSeek 的工作流就真的没有缺角了。

如果你还在为 Claude 账号封禁的事焦虑、还在为多模态切来切去而烦躁——再忍两周。这条路走完,国产替换的故事,才算真正写完。

过去几年,各类企业都用上了协作工具、云存储服务。但有个吊诡的现象:很多企业一边用着SaaS网盘共享文件,一边却在为数据泄露担忧——员工把合同、图纸发到公共云盘,离职时批量下载核心资料,云服务商掌管你文件的密钥,文件有被查看的风险。
听起来不可思议?但这就是当下大量企业的真实处境。
其实绝大多数人根本没意识到:
企业网盘不是“上传下载”的工具,它本质上是一道数据资产的门锁。
锁在别人手里,还是锁在自己手中,天差地别。

一、企业网盘,既是协作工具,又是数据资产的“保险箱”

先撇开技术,聊聊企业网盘到底值不值。
一家年营收过亿的制造企业,研发图纸、供应商合同、财务报表……所有核心数据都散落在员工电脑、聊天记录、邮箱里。一旦硬盘损坏、员工误删、勒索病毒攻击,后果往往是数月的业务停摆,甚至直接威胁生存。
企业网盘的价值,就是把散落的“珍珠”串成一条项链。
它统一管理、集中备份、权限分级、版本追溯,让数据从“个人资产”变成“公司资产”。更重要的是,它让协作不再依赖微信传输——文件共享、多人编辑、审批流、外发管控,一个平台搞定。
但同样叫企业网盘,背后的安全也有差别:
SaaS公有云和私有部署,就像在公共停车场停车和自家独立车库停车。

二、租房子vs买房子:SaaS网盘和私有部署的区别

打个比方。
SaaS公有云企业网盘,就像你租了一间精装修公寓。
拎包入住,水电全包,物业代管,省心省力。但房子是房东的,钥匙在房东手里,房东可以进来看你放了什么东西,甚至哪天房东破产了,你的“家”可能被查封。你唯一能做的,就是祈祷房东讲诚信、不出事、不被黑客攻破。
私有部署企业网盘,则像你有块地(服务器),自己盖房子(装云盘系统)。
装修、水电、安保全按自己的标准来,钥匙只有你自己有,外人进不来。房子是你的,地是你的,哪怕开发商倒闭了,你的房子照住不误。当然,你需要自己维护物业、雇佣保安(IT运维),前期投入更大,但心里踏实。
核心差异有以下三条:

三、什么样的企业,必须考虑私有部署?

不是所有企业都需要私有部署。但如果你符合以下任意一条,那么SaaS很可能不是个好选择:

1、对数据主权有“洁癖”的行业

例如金融、政府、军工、医疗、能源……这些行业的数据不仅涉及商业机密,更涉及国家安全、客户隐私。
合规要求明确规定:
核心数据不得出境,存储服务器必须在国内,且需通过等保三级测评。
SaaS服务商哪怕在国内,其数据存储、访问权限也难以完全满足监管要求。私有部署是唯一合规路径。

2、拥有大量高价值核心技术资产

比如芯片设计、生物医药、精密制造、汽车研发。这些企业的CAD图纸、配方、源代码、实验数据,一份就价值千万。一旦泄露,轻则专利被抢,重则市场份额断崖下跌。
这类企业往往不信任任何第三方——哪怕合同写“我们不看你数据”,但技术上有后门,你无法验证。只有私有部署,物理上就能隔绝第三方访问。

3、 已经或即将自建IT基础设施

有内部IDC机房、自建私有云或使用了阿里云/华为云/腾讯云专有云的企业。既然已经有了基础设施,为什么还要把数据放到SaaS服务商的服务器上?
私有部署可以无缝融入现有IT架构,统一管理、统一运维,甚至可以利用冗余的服务器资源,成本反而比购买SaaS订阅更低(长期看)。

4. 员工规模大、分支机构多、协作链条复杂

总部、分公司、工厂、供应商、经销商……动辄几千人,涉及大量跨地域、跨组织的文件流转。SaaS按人头以及存储空间收费,成本高昂,且外发控制、审批流等功能难以精细匹配复杂组织架构。
私有部署一次性投入后,增量用户几乎零边际成本,且权限体系可以细化到岗位、项目、文件夹级别。

5. 对长期成本敏感

SaaS订阅看似便宜,但按年付费、按用户付费,3-5年累计成本往往超过私有部署的总拥有成本(硬件+软件+运维)。尤其是当企业用户数超过500人时,私有部署的性价比优势显著。

四、私有部署怎么选?老牌、体量、场景,一个都不能少

选私有部署企业网盘,最怕两个坑:一是小厂产品不稳定,数据丢了找谁说理;二是闭门造车,功能简陋,员工用不下去,最后形同虚设。
云盒子企业网盘,在私有部署领域深耕十余年,是真正经过市场验证的老牌选手。

从政府机关、军工院所,到大型制造企业、医药集团、建筑设计院……云盒子累计服务超过200万用户。这个体量本身就说明了一切:它经历过最严苛的安全审查、最复杂的业务场景、最大规模的并发考验。

为什么云盒子企业网盘值得信任?

  • 底层的安全感:支持纯内网部署,物理隔离;兼容主流国产化操作系统(麒麟、统信、鸿蒙)和数据库(达梦、人大金仓),并完成适配认证。数据存在你自己的服务器上,密钥由你自己管理,云盒子团队没有后门也打不开。
  • 场景的丰富性:不只是一个“上传下载”的网盘。它整合了文档预览(100+格式)、在线编辑、版本管理、外发管控、文件水印、安全沙箱、存证确权、流程中台等企业级能力。针对芯片、汽车、医药等高机密行业,实现文件不落地、防截屏、防拷贝,彻底杜绝内部泄密。
  • 集成的灵活性:提供标准API和SDK,可与企业自有的ERP、OA、企微、钉钉、飞书等系统无缝对接。不少客户用它做“统一文档中心”,把多个系统的附件、报表、图纸集中管理,权限统一,告别数据孤岛。
  • 运维的省心感:提供“交钥匙”式部署服务,从硬件选型、系统安装、数据迁移到日常运维,全程支持。对于没有全职IT人员的中小企业,还可以选择“专属托管”模式——服务器放在你公司,云盒子远程运维,你只管用。

一个真实的案例: 某大型汽车零部件集团,超过3000名工程师。以前用某国际品牌的SaaS网盘,每年订阅费几百万,后来全部迁移到云盒子企业网盘,一次性投入不到一年SaaS费用,后续维护成本几乎忽略不计。更重要的是,核心图纸全部存储在集团内部IDC,通过安全沙箱实现“看得见拿不走”,再也没有发生过泄密事件。

最后,企业网盘不是一个“谁便宜用谁”的简单商品,它关乎数据资产的安全归属。SaaS公有云适合快速起步、轻量协作的初创团队;但对于那些视数据为生命、把合规当底线、追求长期性价比的企业,私有部署才是唯一的正确答案。

云盒子,让企业网盘真正成为你的“私人金库”——钥匙自己拿,安全自己控,数据自己管。

你的网站看上去很正规,用户却悄悄离开了——也许只是因为少了一张OV证书。

1. 一个真实的数据

某知名调研机构曾做过测试:两个设计完全相同的企业官网,一个使用DV证书,一个使用OV证书(地址栏显示公司名称)。结果OV证书网站的咨询转化率高出23% ,用户停留时长增加近40%。

原因很简单:当用户看到“某某有限公司已验证”的字样时,大脑会下意识判断——这家公司经得起第三方核实,可以放心联系

2. “小锁”已经不够用了

很多企业主认为:“我的网站有https绿锁就可以了。”
但你可能不知道,黑客现在可以为任何钓鱼网站免费申请DV证书。也就是说,一个假冒你公司的网站,同样能显示小锁图标。用户根本分不清真假。

而OV证书不一样。申请它需要提供营业执照、组织机构代码、授权函等全套企业资质,CA机构会通过国家企业信用信息公示系统逐项核对。没有合法注册的公司,拿不到OV证书。
这等于给用户吃了一颗定心丸:这个网站背后确实有实体的、可追责的企业。

3. 不只是安全,更是品牌资产

想象一下:客户访问你的官网,点击地址栏看到“XX科技有限公司 – 已通过权威CA验证”。这种感觉就像在实体店里看到墙上的营业执照和荣誉牌匾——专业、可靠、值得托付

尤其对于金融、教育、医疗、法律、B2B制造、招商加盟等行业,客户决策重,信任门槛高。一张OV证书是成本最低、效果最直接的信任背书。

直接访问JoySSL,注册一个账号记得填写注册码230970获取免费安装服务

4. 别让“省小钱”误了大事

有的企业主觉得OV证书一年比DV多花几百块,不划算。但请算一笔账:

  • DV证书:免费或几十元/年 → 仅证明域名是你控制的;
  • OV证书:几百到千元/年 → 证明“这个网站归属于一家真实存在的合法企业”。

如果因为用户不信任而流失一单生意,损失可能就是几千、几万甚至更多。用不到一顿聚餐的钱,买全年每一位访客的信任感——这笔账怎么算都不亏。

5. 怎么选?给你三个最直接的场景建议

  • 你是做官网、品牌展示、客户留资的?  → 直接上OV,别犹豫。
  • 你是做电商、会员登录、在线支付的?  → OV是底线,预算充足可以考虑EV(地址栏绿标)。
  • 你只是个人博客、内部测试、临时后台?  → DV足够,别浪费钱。

结语

互联网时代,信任就是流量,信任就是转化。
当你花几小时比较证书价格时,你的竞争对手可能已经用OV证书多接了十几个客户电话。

立即为你的企业官网更换OV证书 —— 让用户看见你的底气。

老帖子: https://v2ex.com/t/1193725?p=1#reply8

Google AI Ultra 计划,目前还有最后一个车位,单月付 $40 ,季付款 $30 ,可以用 antigravity 和 Google One 30TB 的云存储。需要的可以联系我哈

如果你要体验可视化同时比较友好的编辑器,Antigravity 可以试试,Ultra 可以同时使用 Gemini 最先进的模型和 CLAUDE 模型

深圳,非全日制学历,大专本科都是,做了很长时间的外包,一直在一个厂做外包,期间也换了次供应商,零零散散也做了四年多了,最终还是被释放了,都说外包没赔偿,但是我这个还是相对可以,虽然没拿到 n+1 ,还是拿到了一些补偿。

我是 2021 年开始在这个厂做的,2021-2025 年期间也想着找个好的出路,也面试过拿过几个 offer ,这些给的都是没到 20 ,由于我是瞻前顾后的性格,一直没有去入职,想着后面再不济也可以找一份与现在持平的工作,现在回想还是有点后悔的,由于现在人很多,找份工作真的是非常难,投出去的简历就是泥牛入海,现在又结婚有家庭,有点太失落了。

简单说下自身吧:
我是 17 年培训入行,18 年学完项目出来找工作,当时还是很好找工作的,简历只管投,面试电话接不完,不过我学的很差,又没学历就只找到一个 4k 的,后面慢慢跳槽涨到 8-10 再到现在,期间也攒了一点钱,房子装修,买个车子,结个婚也花的七七八八了,现在有了家庭,不像以前想放松就可以放松一段时间,现在感觉有点压力,想找份工作做着攒两三年钱转行了,害就说这么多吧,五一前当个乐子看吧,提前祝大家五一快乐。

[高危] CVE-2026-31431 ( Copy Fail )本地提权漏洞
https://ubuntu.com/security/CVE-2026-31431

一行命令就能从普通用户变成 root ,影响 2017 年至今几乎所有 Linux 发行版( Ubuntu 、Debian 、CentOS 、RHEL 等)

修复方案
执行各发行版 upgrade 命令,应已推送新的 linux-image-*
sudo apt update && sudo apt upgrade

紧急修补策略
echo "install algif_aead /bin/false" > /etc/modprobe.d/disable-algif-aead.conf
rmmod algif_aead 2>/dev/null

该漏洞利用门槛低、隐蔽性强(绕过文件完整性校验),建议优先评估并应用补丁。
注:由于 page cache 内核全局共享,该漏洞可用于容器逃逸

FileZilla是一款免费开源的FTP客户端软件,主要功能是通过FTP、SFTP、FTPS等协议连接到远程服务器,实现本地电脑和服务器之间的文件上传和下载。无论你是做网站运维、服务器管理,还是单纯需要在电脑和服务器之间传文件,FileZilla都是最常用的工具之一。

同领域还有不少FTP工具,来看看它们之间的区别:

FileZilla最大的优势是免费开源且支持全平台,不管是Windows还是macOS、Linux用户都能用。

下载FileZilla

FileZilla最新版下载地址:https://pan.quark.cn/s/d9f733b41623
zip 格式的安装包被官方叫做绿色版,特点是下载即用,不需要安装;exe 格式的是安装包,可以自定义安装。

安装FileZilla

接下来我将一边安装,一边将安装过程截图给大家看,手把手教大家安装 FileZilla。文章创作不易,如果大家安装成功了,麻烦给我的文章点个小赞赞,拜托大家。

我使用的是 Windows x64 系统,可以下载 FileZilla_3.68.1_win64-setup.exe,也可以下载 FileZilla_3.68.1_win64.zip,下面分开给大家演示。

1) 压缩包形式的,下载后解压就能直接用,下面是我解压后得到的文件夹:

双击图中箭头指的 filezilla.exe 文件,就可以启动 filezilla 了,看到的就是下图的 filezilla 主界面:

如果你下载的 zip 压缩包,可以直接跳到【使用 filezilla】的章节了。

2) 下载 FileZilla_3.68.1_win64-setup.exe 之后,双击启动安装:

如果弹出上图的窗口,直接点“运行”。下图中直接点“I Agree”:

下图中,默认勾选的是“为当前计算机的所有用户安装”,还可以改为“只为当前用户安装”,然后点击 Next:

下图中,Desktop Icon 默认是没有勾选的,建议勾选上,这样安装完成后会在桌面上看到 FileZilla 的图标。然后点击 Next:

下图中,建议将 FileZilla 的安装路径手动修改到非系统盘,我这里因为之前安装过 FileZilla,所以默认是 D 盘,如果你们默认是 C 盘,建议手动修改一下:

直接点击 Install 开始安装:

几乎瞬间都安装完成了,看到下图,点击 Finish 就安装成功了:

在桌面上可以看到,新增了一个 FileZilla 的图标:

使用FileZilla

FileZilla 默认安装完成后会自动启动,它的主界面如下图所示:

首先可以熟悉一下 FileZilla 的窗口布局:

刚开始看着有点乱,其实大家知道菜单栏在哪里,初期使用的时候主要用图中标识第 5 的服务器窗格多一些,简单了解就行,用的多了就熟悉了。

接下来是最重要的,用 Filez 连接远程服务器。连接之前,我们必须知道服务器端的以下信息:

  1. 服务器地址;
  2. 登录服务器的用户名和密码;
  3. 协议类型(FTP/FTPS/SFTP)和对应的端口号,通常 FTP 的默认是 21,SFTP 的默认是 22;

三者缺一不可,否则是无法连接的。

我自己租了一台服务器,接下来给大家演示连接的具体过程。连接方式有两种:

1) 在快速连接栏里,在主机处输入服务器地址,接着输入登录服务器的用户名和密码,点击“快速连接”。在服务器信息输入无误的情况下,即可快速连接服务器。

2) 在工具栏里找到下图箭头指向的按钮“打开站点管理器”,也可以依次在“文件 -> 站点管理器” 打开它:

主机处输入服务器的地址,用户处输入用户名,密码处输入用户密码,其他保持默认:

然后点击“连接”,弹出下图的窗口,点击“确定”:

由此,就连接成功了:

连接成功以后,我们将本地文件拖到上图的红框里,就可以上传到服务器上。在服务器指定文件处右键,选择“下载”,也可以将服务器上的文件下载到本地:

由此,大家掌握了用 FileZilla 连接服务器,将本地文件上传到服务器,以及下载服务器上的资源,这就是 FileZilla 提供的全部核心功能了。

FileZilla使用技巧

FileZilla支持文件队列管理,当需要上传或下载大量文件时,可以先通过拖拽把它们加入传输队列,FileZilla会自动按顺序逐个处理。在传输过程中可以随时暂停或取消某个文件,断线后还能自动重试。

FileZilla还支持文件比较功能,在查看远程目录时右键选择"比较目录",软件会自动用颜色标记出两个目录中不同的文件,方便增量同步。另外你可以通过"传输"菜单限制同时传输的文件数,避免上传大文件时占用过多带宽影响其他网络使用。

总结

FileZilla是一款功能扎实的FTP客户端,免费开源、跨平台、操作简单,是服务器文件管理的最佳入门工具。不管你是建站新手还是老运维,用它来上传下载网站文件、管理服务器数据都非常顺手。

Typora是一款轻量级的Markdown编辑器,核心特色是所见即所得(WYSIWYG)——你在编辑的时候看到的就是最终的排版效果,不需要像其他Markdown编辑器那样左右分屏预览。

看看Typora和同领域其他Markdown编辑器的区别:

Typora追求的是一种极致的、沉浸式的写作体验,如果你主要用它来写博客、做笔记、写文档、写技术文章,那种打字即排版的流畅感会让人上瘾。

下载Typora

Typora 免费版安装包下载地址: Typora免费版
这里为大家提供了 3 款安装包,分别对应 Windows x64、Windows x32 和 Mac OS。如果是 Linux 环境的话,不需要额外下载安装包,下面会给出安装过程。

安装Typora

1) 我使用的是 Windows x64 系统,下载安装包双击启动执行。

弹出上图窗口的话,点击运行就可以了。

2) 两个选项,任选一个即可:

3) 默认安装到 C 盘,这里建议安装到其他盘(非系统盘):

4) 建议勾选“Create a...”,这样安装成功后,桌面上就能自动添加 Typora 的快捷方式了。最后点击 Next:

5) 点击 Install 正式开始安装:

6) 等待安装完成:

7) 点击 Finish 完成安装:

在 Mac OS 上安装 Typora,下载 dmg 的安装包,双击启动即可,过程非常简单,和安装微信、qq 这类软件的过程完成一样。

在 Linux 上安装 Typora,直接执行如下指令即可:

# add Typora's key
sudo mkdir -p /etc/apt/keyrings
curl -fsSL https://typoraio.cn/linux/typora.gpg | sudo tee /etc/apt/keyrings/typora.gpg > /dev/null
# add Typora's repository securely
echo "deb [signed-by=/etc/apt/keyrings/typora.gpg] https://typoraio.cn/linux ./" | sudo tee /etc/apt/sources.list.d/typora.list
sudo apt update
# install typora
sudo apt install typora

使用Typora

下面展示的是官方版,大家可以自由选择分享的其他 typora 版本。

1) 首次启动,Typora 会让我们选择是否输入序列号,这个序列号需要通过购买获得。大家可以点击“以后再说”,先试用 15 天,觉得不错之后再购买也不迟。

2) 紧接着,我们就可以看到 Typora 的主界面了:

下表为大家罗列了 Typora 常用格式的快捷写法:

总结

Typora是一款改变了Markdown编辑方式的优秀工具,它用所见即所得的编辑模式让写作变得纯粹和流畅。简单来说,如果你经常写Markdown文档、博客文章或技术笔记,想要一个干净、专注、排版即时的编辑器,那Typora值得一试。

OBS Studio是一款免费开源的直播推流和屏幕录制软件,全称Open Broadcaster Software,简称OBS。

它的核心功能是录制电脑屏幕画面,或者把画面实时推流到B站、抖音、Twitch、YouTube等直播平台。免费、无广告、功能强大,是目前全球使用率最高的直播和录屏软件。

同领域还有其他录屏和直播工具:

OBS Studio目前最新版本为32.1.2,支持Windows、macOS和Linux全平台。它的核心优势在于模块化设计——你可以自由组合游戏画面、摄像头画面、图片、文字、浏览器窗口等多个画面元素,做出一套专业的直播画面。

下载OBS Studio

OBS Studio 安装包下载地址:
https://pan.quark.cn/s/b4b8672fe61b

安装OBS Studio

我用的是 Windows x64 平台,下载 OBS-Studio-32.0.2-Windows-x64-Installer.exe 安装包,双击启动安装,点击 Next:

再点击 Next:

默认安装到 C 盘,建议手动修改到其他系统盘,比如下图中的 D 盘,然后点击 Install:

等待安装完成:

出现下图,表示安装完成:

安装完成后,会看到桌面上增加了 OBS Studio 的图标:

同时 OBS Studio 会自动启动。

配置OBS Studio

1) 首次启动 OBS Studio,会弹出配置窗口:

  • 如果是搞直播,建议勾选第 1 项“优先优化直播,...”;
  • 如果以录制为主,比如录网课、录视频等,勾选第 2 项 “仅优化录制...”;
  • 如果只使用虚拟摄像头,勾选第 3 项。

    2) 设置分辨率分辨率和帧率建议保持默认即可,不需要修改,高手随意。

    3) 完成配置,点击“应用设置”:

OBS Studio常见问题和解决方案

1) 无法启动、黑屏、白屏等问题

  1. Windows:若使用 NVIDIA 显卡笔记本,需在 NVIDIA 控制面板中为 OBS 指定“集成显卡”。
  2. macOS:检查系统权限(屏幕录制、麦克风权限)并更新系统至最新版本。
  3. 缺少DLL文件:安装最新版 DirectX End-User Runtime(Windows)。
  4. 游戏捕获失败:以管理员身份运行 OBS,或切换游戏至“无边框窗口模式”。

2) obs studio的工具选项里为何没有虚拟摄像头?
将虚拟摄像机的插件安装在同一个目录下,然后重启 obs。即可使用虚拟摄像头。

3) obs studio怎么设置画质才好?
首先打开设置面板,切换左侧选项卡至视频,在此调节即可。建议:帧数 25,码率 1100-1500,品质 6 或者 7,其他不要动。视频压缩比 1280x720,开不开直播延迟都没关系。

一句话:PHP 是为 “做网站” 量身定做、最便宜、最快上手、生态最成熟、历史惯性最大的语言,所以到今天仍占 70%+ 市场。

下面分点说清楚(尽量通俗):

    • *

1. 市场占有率确实高

  • 全球服务器端网站中,约 76% 在用 PHP(2026 数据)
  • 对比:Python ≈13.6%、Node.js≈7.9%、ASP.NET≈7%
  • 也就是说:10 个网站里有 7 个后端是 PHP
    • *

2. 最核心原因:WordPress 统治世界

  • WordPress 用 PHP 写的,它一家就占了全球 43% 的网站
  • 个人博客、企业官网、学校、政府、媒体、小电商…… 大量用 WP
  • WP 有几万款免费主题 + 插件,建站基本 “拼积木”,不用从头写代码
  • 只要 WP 不倒,PHP 就永远有饭吃。
    • *

3. 极其简单,新手几天就能干活

  • 语法像 C/Java,但弱类型、不用编译、不用复杂环境
  • 可以直接嵌在 HTML 里写

    php

    运行

    <h1><?php echo "Hello"; ?></h1>
  • 不用管内存、指针、复杂配置;装个 XAMPP,几分钟本地环境就好
  • 对中小企业、外包公司、个人开发者:人便宜、上手快、招人容易
    • *

4. 成本极低,几乎免费

  • PHP 开源免费,服务器用 Linux + Nginx/Apache + MySQL 也全免费
  • 虚拟主机(几百块 / 年)标配 PHP+MySQL,一键部署
  • 对比:Java 需要独立服务器、高配置、贵运维;.NET 要 Windows 服务器,整体贵很多。
    • *

5. 天生适合 “网站” 这件事

  • PHP 从诞生起就是为动态网页、表单、登录、留言板、CMS 设计的
  • 服务器渲染页面,对 SEO 友好(比纯 JS 渲染更容易被搜索引擎收录)
  • 数据库(MySQL)无缝集成,写个留言板就几行代码。
    • *

6. 生态成熟,轮子多到不用自己造

  • 框架:Laravel、Symfony、ThinkPHP 等,企业级开发够用
  • CMS:除了 WordPress,还有 Drupal、Joomla、Discuz(论坛)、Magento(电商)
  • 支付、短信、地图、登录……现成插件一堆,拿来就用。
    • *

7. 历史惯性:老站太多,换不起

  • PHP 从 1995 年火到现在,20 多年积累了海量旧网站
  • 公司运营好好的网站,没必要花大价钱重写成 Python/Node.js
  • 只要能跑、能赚钱,就继续用 PHP,维护成本最低
    • *

8. 现代 PHP 已经不 “弱” 了

很多人印象还停留在 PHP5:慢、乱、不安全。但 PHP7/8 性能翻几倍,有 JIT、强类型、现代框架,跑中小型网站完全够用。

    • *

简单总结

  • WordPress 垄断 + 简单易学 + 极低成本 + 天生适合网站 + 历史惯性
  • 所以:大部分网站(尤其是中小企业、官网、博客、小电商)首选 PHP

为了在长时间运行的智能体系统中保持效率,Slack 工程师放弃了累积聊天记录的做法,转而采用结构化记忆、验证与蒸馏事实的方式来维持长时间运行智能体系统的连贯性与准确性。

 

虽然短时间的 LLM 会话通常不需要显式的上下文管理,但在长时间运行的会话中,要保持会话连贯性,上下文管理就变得至关重要——因为随着消息历史不断增加,每次请求都附带完整上下文会变得不切实际:

智能体框架会在 API 调用之间累积消息历史,以此为用户解决状态管理问题。但这会占用并填满智能体的上下文窗口,而上下文窗口对智能体可处理的信息总量存在硬性上限。即便只是接近上下文窗口的容量上限,也可能降低响应质量。

 

正如 Slack 高级软件工程师 Dominic Marks 所介绍的,Slack 的一款多智能体应用可跨越数百次请求,并生成数兆字节的输出。为应对这类复杂场景,他们采用了由三类互补上下文通道组成的方案:Director 日志(用于存储 Director 的结构化工作记忆)、Critic 评审(用于存储附带可信度评分的注释与结论报告)和 Critic 时间线(用于存储按时间排序、标注可信度评分的关键信息)。

 

Slack 采用了协调器/调度器式多智能体设计,中央协调器作为决策核心,负责接收各类请求,并将任务分派至下游智能体,也就是专家(Expert)与评审员(Critic)。

 

Critic 会对 Expert 的工作进行评估,因为部分结论“可能存在编造或严重曲解了数据”。他们接收 Expert 提交的摘要报告并核验报告中的相关依据。这一个评估工作是创建评分系统的基础,用于筛选出经多方信息交叉验证的结果。

 

Director 日志包含发现、观察、决策、问题与假设,并“提供统一的叙事脉络,确保其他智能体始终保持正确的工作方向”。

 

Critic 评审作为事实过滤器,使用证据核查工具来构建按可信度加权的结论列表。为了降低幻觉风险,Expert 被严格要求“仅针对提交的各项结论作出判断”。

 

最后,Critic 时间线基于 Director 日志、最新的 Critic 评审以及过往时间线内容构建连贯叙事,只保留可信证据,剔除重复信息,并通过优先采信高可信度来源来解决内容冲突。

 

虽然 Slack 的这套方案与其自身系统严格绑定,但它揭示了一个具有普适性的原则:与其在每一步交互中传递全部信息,不如搭建结构化摘要,让智能体能够根据已有内容稳定持续运行。这三个通道:

三者协同配合,在多轮交互之间维持整体连贯性,同时保留各类专业智能体的角色优势。Director 能够做出合理的战略决策,Expert 可以基于先前的理解继续工作,Critic 则能对各项结论进行客观评估。

 

Marks 表示,这种方法已被证实能够有效解决长时间运行的复杂智能体应用所存在的局限。如需了解完整的细节和示例,可查阅原文。

 

【声明:本文由 InfoQ 翻译,未经许可禁止转载。】

 

查看英文原文https://www.infoq.com/news/2026/04/slack-agent-context-management/

Shotcut是一款免费、开源的专业视频剪辑软件,支持SD、HD、4K及更高分辨率的视频编辑,同时内置了完善的音频编辑控制功能。

看看Shotcut和同领域其他软件的区别:

Shotcut的优势在于功能齐全且完全免费,支持Windows、macOS和Linux三大平台。如果你想要一款免费、跨平台、没有水印、功能不输付费软件的视频剪辑工具,Shotcut是一个很实在的选择。

下载Shotcut

这里为大家找到了 Shotcut 官方发布的最新版安装包:Shotcut最新版安装包

安装Shotcut

1、Windows

1) 下载 Windows 版(Installer)的安装包;

2) 双击下载好的 .exe 安装文件,在弹出的安全提示中选择「运行」:

3) 点击“Install of all users...”:

4) 阅读并接受开源许可协议(Shotcut 遵循 GPLv3 协议):

5) 选择安装路径,建议安装到非系统盘,比如下图中的 D 盘:

6) 可以选择是否在桌面创建快捷方式:

7) 点击「完成」,安装成功:

2、Linux

1) 下载 shotcut-linux-x86_64-25.11.2.AppImage 文件。

2) 打开终端,赋予执行权限:
chmod +x Shotcut-*.AppImage

3) 直接在终端运行:
./Shotcut-*.AppImage
由此,就可以快速启动 shotcut,无需安装依赖,避免系统污染。

3、Mac OS平台

1) 下载 .dmg 文件后,双击打开。

2) 将 Shotcut 图标拖拽到「应用程序」文件夹中。

3) 打开「应用程序」文件夹,找到 Shotcut 图标,双击运行。

注意,由于 Shotcut 并非通过 App Store 发布,macOS 可能提示「无法打开应用程序」。这时需要在「系统偏好设置」-「安全性与隐私」-「通用」中,点击「仍要打开」。

开发者朋友们大家好:

这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@鲍勃

01 有话题的技术

1、OpenAI 开源 realtime-voice-component:使用语音控制交互界面

OpenAI 发布了基于 OpenAI Realtime API 构建的开源参考实现 realtime-voice-component。该库专为 React 环境设计,旨在为具有明确预定义工具的应用提供低延迟、状态可感知的语音交互界面

  • 工具受限型(Tool-constrained)交互架构:不同于通用浏览器自动化,该组件要求应用预定义精确的智能体(Agent)动作。工具所有权归属于应用端,由 UI 负责最终的可见状态变更。
  • 原生 React 绑定与控制器:提供封装好的 React Controller 和可选的 Launcher Widget。支持跨多个屏幕共享控制器实例,实现复杂业务流(如多步骤表单、共享状态棋类游戏)的语音控制
  • 可视化确认机制(Ghost Cursor):内置「幽灵光标」功能,为语音触发的 UI 操作提供视觉反馈与二次确认逻辑,降低多模态交互中的指令误判风险
  • 明确的功能分层定界:该组件定位于 UI 渲染层,与底层传输协议(Raw Realtime)和高层编排框架(openai-agents-js)互补。它不负责底层的自定义音频处理,也不涉及复杂的智能体交接(Handoff)或 MCP(Model Context Protocol)流程。
  • 实验性功能集成:在 Demo 示例中集成了基于运行时的可选「唤醒词(Wake-word)」检测实验功能。

https://github.com/openai/realtime-voice-component/

(@OpenAIDevs)

2、HeyGen 开源 HyperFrames:原生支持 AI 智能体的 HTML-to-MP4 视频渲染框架

视频生成平台 HeyGen 开源了 HyperFrames,这是一款专为 AI 智能体(Agent)设计的端到端视频工作空间框架。该工具通过将 HTML/CSS/GSAP 动画转化为逐帧确定的 MP4 视频,允许开发者在 Codex、Claude Code、Cursor 等编码环境中通过自然语言指令完成视频的编写、编辑与渲染

  • 智能体原生(Agent-native)交互模式:不同于基于 React 的传统方案(如 Remotion),HyperFrames 采用原生 HTML 结构作为输入。由于大模型对 HTML 的生成能力远超复杂的组件体系,智能体可通过 /hyperframes 等斜杠命令直接操作 DOM 属性和动画逻辑。
  • 确定性渲染(Deterministic Rendering)架构:集成无头 Chrome 与 FFmpeg,采用帧缓冲(Frame buffering)和 image2pipe 流式传输技术。该架构确保在相同的 HTML/数据输入下,输出的视频帧序列完全一致,适用于自动化生产管线。
  • 框架适配器模式(Frame Adapter):支持 GSAP、Lottie、CSS 和 Three.js 等多种动画运行时。通过「库时钟(Library-clock)」同步技术,实现了帧精确(Frame-accurate)的搜索与预览,解决了渲染时动画与墙钟时间不同步的问题。

https://github.com/heygen-com/hyperframes/

(@HeyGen\@X)

3、开源 AI-HR 招聘平台:集成 TEN Framework 与 FastAPI,实现 < 1s 延迟实时语音面试

AI-HR 发布了基于Python FastAPI 与 TEN Framework 的端到端智能招聘自动化系统。该平台通过 LLM 与实时通信(RTC)技术的深度解耦与重组,实现了从简历语义解析到「无人值守」实时语音面试的全流程闭环,将面试交互延迟降低至秒级

  • < 1s 拟人化交互延迟:通过 TEN Framework 优化 RTC 链路,集成 VAD(静音检测)与语义中断技术,解决了传统 ASR-LLM-TTS 架构中 5-10s 的高延迟痛点。
  • 基于语义的深度技术追问:不再依赖关键词匹配,利用 GPT-4o 或 DeepSeek 等模型对简历进行多维度打分,并根据应聘者回答实时生成针对性的技术细节核实问题
  • 异构环境下的分布式架构:后端 API 采用 FastAPI,实时交互体 ten\_agent 运行于 Linux/WSL 环境,支持 tman 插件管理系统,实现了业务逻辑与实时音视频流处理的解耦。
  • 全自动招聘 Pipeline:系统自动同步 Boss 直聘等平台职位状态,根据 AI 评估得分触发简历状态变更、发起面试邀约及生成面试评估报告。
  • 企业级稳定性设计:内置熔断器 (Circuit Breaker) 与幂等处理机制,通过 Orchestrator(面试编排器)管理会话状态,支持大规模并发场景下的请求监控。

https://github.com/shenlan-ai/AI-HR

( @GitHub)

4、商汤开源 SenseNova U1:基于 NEO-unify 原生架构实现图文理解生成统一

连续性图文创作输出示例

商汤发布并开源日日新 SenseNova U1 系列原生理解生成统一模型。该模型基于自研 NEO-unify 架构,在单一模型架构内实现了多模态理解、推理与生成的深度融合,其轻量化版本在 8B 规模下实现了比肩大型闭源商用模型的生成质量与推理效率。

  • NEO-unify 原生统一架构:彻底摒弃主流的「视觉编码器(VE)+ 变分自编码器(VAE)+ 语言模型」拼接范式,通过构建统一表征空间,将视觉与语言信息融入每一层计算,消除了跨模态转换的信息损耗。
  • 首创连续性图文交错创作:支持在单次模型调用中输出高一致性的图文内容。在多步骤任务(如菜谱、流程图)中,图像间的风格与语义逻辑可保持像素级的视觉保真度与上下文对齐。
  • 高性能轻量化配置:开源 SenseNova-U1-8B-MoT(稠密骨干)与 SenseNova-U1-A3B-MoT(MoE 架构)两个版本。实测在 OneIG、BizGenEval 等图像生成与视觉推理基准中达到同量级 SOTA,生成延迟显著低于同类闭源模型。
  • 物理空间与具身智能适配:针对物理世界布局与精细关系进行建模,旨在实现在单一模型闭环内完成从环境感知、逻辑推演到任务执行的具身智能大脑功能。

GitHub:

https://github.com/OpenSenseNova/SenseNova-U1

Hugging Face:

https://huggingface.co/collections/sensenova/sensenova-u1

(@商汤科技)

02 有亮点的产品

1、Jovida 完成千万级 Pre-Seed 轮融资:上线主动式生活智能体,支持 WhatsApp 触达与跨模态视觉解析

由前字节跳动产品合伙人创立的 AI 公司 Jovida 宣布完成数千万元人民币 Pre-Seed 轮融资(锦秋基金领投,百度风投跟投)。该公司正式发布 iOS 端主动式生活智能体,产品放弃传统对话框交互,采用「后台感知+IM 主动触达」的「人类闭环(Human Loop)」范式,通过跨应用上下文调用与垂直技能生态(Agent Square),接管泛健康等长线个人目标的拆解与执行。

  • 交互去 APP 化与交互式卡片(Interactive Nudges):彻底抛弃长文本对话流。系统通过原生聊天集成(Native Chat Integration)接入 WhatsApp 并结合 iOS 离线 Push 机制,将任务转化为明确的行动卡片。用户无需唤醒 APP 即可在 IM 界面内完成状态打卡、跳过或重新调度。
  • 多维上下文动态触发(Live Context):放弃静态定时提醒。智能体通过端云一体架构(Edge-Cloud Architecture)调用手机端日历、系统时钟与地理位置权限。算法结合实时物理环境计算触发时机(例如:检测到用户处于餐厅位置附近时,自动推送基于该位置的低碳水餐品选项)。
  • 封装垂直场景的跨模态视觉解析:在细分目标下提供深度的图像处理功能。例如「皮肤扫描(Face Scan)」生成成分冲突预警与使用建议;「餐盘分析(Meal Photo Analysis)」通过照片即时估算大卡与营养素;同时支持实体餐厅菜单的 OCR 扫描与健康项自动过滤。
  • 动态挂载的 UGC 技能网络(Agent Square):系统内置官方与社区用户构建的垂直技能模块(涵盖减脂、睡眠优化、英语学习等)。当侦测到用户诉求变化时,主智能体会自动检索、拉取并静默安装匹配的垂类技能组件(Self-Evolving),接管对应的底层执行逻辑。
  • 结构化持久记忆(Long-Term Memory):摒弃单向 Markdown 文本日志。系统将用户的跨平台履约率、体征数据变化(如 Apple Health 睡眠评分)提炼为结构化字段。智能体依赖该状态库而非短期对话上下文,动态平滑后续任务的执行难度。

发布计划 iOS 客户端现已在 App Store 上线;Agent Square 已开放皮肤管理、减脂等数十款垂类技能模块供一键激活。

https://jovida.ai/agents

( @Founder Park)

2、Tin Can 发布儿童 VoIP 座机:硬件摒弃屏幕与电池,建立订阅制语音闭环

初创公司 Tin Can 推出一款针对儿童市场的 VoIP 语音终端。该产品通过彻底移除屏幕、摄像头及短信功能,并强制采用插电使用的非移动设计,配合家长端 App 的白名单过滤,试图在智能手机之外建立一套受控的、去沉迷化的儿童社交通讯系统

  • 硬件参数与交互设计:采用基于 IP 的语音传输(VoIP)技术,通过 Wi-Fi 联网;机身无电池,由 USB-C 接口供电以固定使用位置;配备 4 个可自定义的 Emoji 快捷拨号物理按键及语音信箱提醒灯。
  • 白名单云端管控系统:所有接听与拨出号码均需通过家长端 App 授权,自动拦截非白名单骚扰电话;支持设置「静音时段」(保留紧急呼叫);支持「一号多机」模式,适配离异家庭等跨空间使用场景。
  • 定价与商业模式:硬件售价 100 美元;Tin Can 用户间通过 5 位短号通话免费,拨打普通手机/座机需支付 9.99 美元/月的「Party Line」订阅费。
  • 融资与交付表现:已完成累计 1550 万美元融资(Greylock Partners 领投种子轮);目前由于产能受限及预购量激增,新订单交货期已排至 2026 年 6 月。
  • 技术局限与冗余问题:初代硬件存在 1 秒左右的 VoIP 通话延迟及回声;USB-C 供电接口物理连接稳定性不足;2025 年曾因 100 倍流量峰值导致服务器宕机。

https://tincan.kids/

( @APPSO)

03 有态度的观点

1、Replit CEO:AI 已经能写代码,但它替代不了系统思维

据《商业内幕》报道,AI 编程平台公司 Replit CEO Amjad Masad 昨日在《20VC》播客节目中表示,年轻人不应仅仅因为薪资前景而选择修读计算机科学专业

如果你对它没有那种如飞蛾扑火般的吸引力,就不要因为别人告诉你能在 Google 赚大钱而去读计算机科学,这「相当愚蠢」。

Masad 指出,21 世纪初入行者大多出于真实热情,此后该专业逐渐被「炒热」,各大高校计算机系急速扩张,核心原因只有一个 —— 容易赚钱。而 AI 崛起后,这一逻辑已不再成立。

他同时强调,对真正感兴趣的人而言,机器学习与 AI 方向依然大有可为;数据结构与算法等基础知识不会因 AI 进化而过时,行业始终需要理解底层原理的人才

这一观点在科技界并非孤例。「AI 教父」Geoffrey Hinton 去年也表示,计算机科学是「学习系统思维的绝佳专业」,AI 替代部分编程任务并不意味着相关学位失去价值

Masad 于 2016 年联合创办 Replit,该公司已从在线集成编程环境转型为以 AI 智能体为核心的应用构建平台,与微软旗下 GitHub、Cursor 及 Lovable 等 vibe coding 工具展开竞争。

( @APPSO)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点,仅供参考

类似内燃机的改进带来大量劳动力的需求,让原来处于小共同体的农民放弃土地入厂打工,放弃了原先的封建关系,大学从原先培养神职人员的地方变为了培养科学人才,一夫多妻随着女性劳动力解放进入了一夫一妻,我们现在正是处于时代的交汇,原先的雇佣关系(按工时交付的月薪制),婚姻关系(当代的婚姻关系更像是一种资产分配),政府与国民的关系(打破二战以来的民族国家,以税收,资产,核心价值观重组),我打算模仿卡夫卡,弗洛伊德,你才,陀思妥耶夫这些后现代哲学家创作一本先知书,将建立一套不同于民族主义,美国新教徒,和各个亚伯拉罕教,会着重在什么是人类,人权,ai 智能体赋权,人类目的和永恒这些关系和定义。