百度发布文心 5.0,原生全模态统一建模
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。 本期编辑:@瓒an、@鲍勃 1、百度发布「文心 5.0」正式版:2.4 万亿参数 MoE 架构,实现原生全模态统一建模 在文心 Moment 大会上,百度正式上线「文心 5.0」大模型,采用 2.4 万亿参数的超大规模 MoE 架构。该模型放弃了业界主流的多模态后期融合方案,通过原生全模态统一建模技术,实现了跨模态特征的深度融合,在 LMArena 文本与视觉榜单中位列中国模型首位。 模型已正式上线。个人用户可通过文心一言官网或 APP 体验;企业级用户与开发者可通过百度千帆平台调用 API。 (@智东西) 2、开源智能体「Clawdbot」走红:支持本地 7x24h 运行,具备系统 Shell 权限与长时记忆 开发者 Peter Steinberger 开源的「Clawdbot」通过本地网关架构,将 Claude、GPT 等 LLM 转化为具备 OS 级权限的 7x24h 智能体。它支持通过 WhatsApp、iMessage 等即时通讯工具远程驱动本地环境,实现了从「对话框 AI」到「自主执行器」的转变。 项目已在 GitHub 开源(stars 突破 26k),支持 Mac、Windows、Linux 或 VPS 部署。 官网链接: demo 链接: GitHub: (@新智元) 1、苹果将于 2 月份发布基于 Gemini 架构的 Siri 语音助手 据彭博社报道,由 Google Gemini 技术深度驱动的新一代 Siri 最快下个月开始在 iOS 26.4 测试版上亮相,同时重构多项核心应用的 AI 体验。 彭博社记者马克・古尔曼昨天在《Power On》专栏中指出,苹果在 2025 年中期已开始与多家模型供应商接触,包括 Anthropic 与 OpenAI,但前者报价过高,后者则因积极挖角苹果工程师及硬件布局而存在战略冲突。 最终,苹果选择 Gemini,部分原因还包括去年 9 月美国法院裁定无需拆分苹果与 Google 的搜索合作关系,为双方进一步合作扫清障碍。 具体时间点方面,古尔曼认为,首批由 Gemini 支持的 Siri 功能将随 iOS 26.4 在下月进入测试阶段,并计划于今年 3 月至 4 月间正式推送。 该版本 Siri 将运行在苹果的 Private Cloud Compute 服务器上,内部代号为 Apple Foundation Models version 10,规模约为 1.2 万亿参数。 更大幅度的升级将在今年 WWDC 亮相。苹果正开发代号「Campos」的全新 Siri 架构,将在 iOS 27、iPadOS 27 与 macOS 27 中推出,具备更强的上下文理解、持续对话能力,并深度整合至 Safari、TV、Health、Music、播客等核心应用。 与此同时,苹果内部的 AI 组织也在经历重大调整。随着原机器学习与人工智能战略高级副总裁约翰・吉安南德雷亚离职,软件工程负责人克雷格・费德里吉接管 AI 方向,并推动与 Google 的合作落地。 部分原有项目,如基于内部模型的「全球知识问答」与 AI 版 Safari 升级计划已被缩减或暂停,但仍可能在 WWDC 前重启。 报道还提到,苹果正讨论让未来版本的 Siri 直接运行在 Google 云端的 TPU 上,以提升性能与响应速度。同时,苹果仍在开发更高性能的自研服务器,以支持长期的云端 AI 布局。 苹果自去年推出 Apple Intelligence 以来,新增的 AI 功能相对有限,仅在 Apple Music 与 Apple Watch 等应用中上线少量更新。 随着内部模型研发受阻、人才流失加剧,以及 Siri 延宕多时的升级计划迟迟未能落地,苹果在去年下半年重新评估其 AI 路线,并最终决定与 Google 达成合作,将 Gemini 引入 Siri 与 Apple Intelligence 的底层架构。 随着新一代 Siri 即将亮相,苹果正试图在生成式 AI 竞争中缩小与 ChatGPT、Gemini 等产品的差距。 ( @APPSO) 2、银河通用成为 2026 春晚指定具身大模型机器人 昨天,中央广播电视总台和银河通用机器人共同宣布,银河通用机器人成为 2026 年春节联欢晚会指定具身大模型机器人。 银河通用机器人表示,公司长期聚焦具身大模型与人形机器人研发,已形成覆盖零售、工业、医疗、文旅等多行业的「机器人服务生态」。 公司通过自研具身大模型体系与高可靠人形机器人本体,在复杂场景中展现出自主决策、泛化能力与抗干扰性能,为人机协作提供可规模化落地的技术路径。 近期,银河通用完成 3 亿美元融资,估值突破 30 亿美元,继续位列国内具身智能企业前列。公司表示,将借助春晚这一国家级舞台展示具身智能的前沿成果,并以更具温度的交互体验呈现科技创新的现实价值。 随着春节临近,银河通用的人形机器人已在零售、文旅等场景以多种形式亮相,从太空舱咖啡服务到地方特色舞蹈表演,成为今年「科技年味」的重要组成部分。 ( @APPSO) 3、前 Google 团队创办 Sparkli:已完成 500 万美元融资,用生成式 AI 重构儿童「沉浸式」学习体验 由前 Google Area 120 内部孵化器核心成员联合创办的教育科技初创公司 Sparkli,旨在解决通用大模型在儿童教育场景中文本堆砌的交互痛点。公司已完成由瑞士风投 Founderful 领投的 500 万美元 Pre-Seed 轮融资。 核心产品逻辑与差异化: 安全护栏与教学法融合: 商业化进展与路线图: ( @TechCrunch) 4、Interactpitch:交互式 AI 演示,实时数据追踪 Interactpitch 将静态融资演示文稿转化为由 AI 智能体引导的交互式体验。通过集成自定义虚拟人和实时数据追踪,该工具允许创始人在正式会议前通过 AI 与投资者进行异步沟通,并获取关于观众关注点、参与深度及潜在问题的结构化反馈。 相关链接: ( @Product Hunt) 1、雷蛇 CEO:我们投了 6 亿美元,但玩家还是讨厌生成式 AI 雷蛇 CEO 陈民亮近日在 The Verge 旗下播客节目《Decoder》中谈及游戏行业对生成式 AI 的普遍反感情绪,并回应公司在 AI 方向上的大规模投入。 他表示,雷蛇已在 AI 技术上累计投入约 6 亿美元,但玩家对低质量生成式内容的排斥依旧强烈,这也是当前行业矛盾的核心。 陈民亮指出,玩家真正不满的是「生成式 AI 产出的垃圾内容」,包括角色模型畸形、剧情质量低下等问题。 他强调,雷蛇与玩家立场一致,反对以少量提示词批量生成低质量内容。他认为 AI 的价值应体现在「辅助开发者」而非「替代创作」,例如提升 QA 测试效率、自动记录 Bug、检查拼写错误等,这些都能帮助开发者更快、更好地完善游戏。 在节目中,陈民亮进一步解释了雷蛇的 AI 战略。他透露,公司计划招聘 150 名 AI 工程师,并将 AI 视为一场长期押注,希望借此抵御市场炒作周期与玩家情绪波动。 他同时强调,雷蛇的 AI 布局并非局限于生成式内容,而是贯穿硬件、软件与服务生态,包括智能耳机 Motoko、AI 角色 Ava 等概念产品。 对于外界关注的 AI 安全与情感依赖问题,陈民亮表示,Ava 目前仍处于概念阶段,公司会在正式推出前持续收集反馈并强化安全机制。 他强调,雷蛇不会鼓励用户与 AI 角色建立情感依赖关系,产品的核心目标仍是提供实用价值与更自然的交互体验。 在硬件层面,他提到行业正面临内存与 GPU 成本上涨的压力,雷蛇尚无法确定未来产品的最终定价。 此外,他认为 AI 将成为未来硬件的重要组成部分,但雷蛇的策略是通过开放、多模型支持与自研上下文系统,构建面向玩家的垂直生态,而非与模型提供商直接竞争。 ( @APPSO) 阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么 写在最后: 我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。 对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。 作者提示: 个人观点,仅供参考
01 有话题的技术





https://clawd.bot
https://clawd.bot/showcase
https://github.com/clawdbot/clawdbot02 有亮点的产品


03 有态度的观点



