AI 硬件编排平台 Era 融资 1100 万美元,快速开发 AI 穿戴设备;DeepSeek 正式发布 V4 预览版丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。 本期编辑:@koki、@鲍勃 1、Qwen 开源 Qwen3.6-27B:27B 稠密多模态模型,智能体编程能力超越 397B 前代旗舰 Qwen 团队宣布开源 270 亿参数稠密多模态模型Qwen3.6-27B。该模型采用非 MoE 稠密架构,在参数量仅为前代旗舰(Qwen3.5-397B-A17B)十五分之一的情况下,在智能体(agent)编程及多模态推理基准上实现了全面超越。 (@通义实验室) 2、DeepSeek 发布 V4 系列模型:全系标配 1M 上下文,同步开源 1.6T MoE 权重 DeepSeek 正式发布 V4 预览版大模型,包含主打极致性能的 V4-Pro 与主打低延迟的 V4-Flash 两个版本。本次更新全系标配 1M(百万)tokens 上下文长度,并同步开源完整模型权重与配套工具链。开发者无需修改原有的 base_url 即可接入,直接获取具备增强智能体(agent)与代码能力的基座模型。 1.6T MoE 架构与全系 1M 上下文:V4-Pro 采用总参数 1.6T、激活参数 49B 的 MoE 架构,预训练数据量达 33T;全系列(含 V4-Flash)将上下文长度从上一代 V3.2 的 128K 直接跃升至 1M tokens,支持端到端导入完整代码库或百万字文档。 Flash 版本激活参数 13B,输入低至 0.2 元:V4-Flash 采用 13B 激活参数,并引入全新 token 压缩注意力机制与 DSA 稀疏注意力架构。API 采用阶梯计费,缓存命中输入为 0.2 元 / 百万 tokens(未命中为 1 元),输出 2 元 / 百万 tokens。Pro 版本缓存命中输入为 1 元 / 百万 tokens(未命中 12 元),输出 24 元 / 百万 tokens。 新增参数控制与多格式接口兼容:全系列同时支持思考与非思考双模式,开发者可通过新增的 全量非阉割开源与 Day 0 框架适配:完整保留与云端 API 一致的全量能力(无功能阉割)并开源模型权重。同步提供微调、量化与推理加速全流程工具链,完成 vLLM、TGI 推理框架及 LangChain、LlamaIndex 等智能体框架的 Day 0 原生适配。 (@极客公园) 3、GPT-5.5 正式发布:更聪明、更省 token 今天凌晨,OpenAI 正式发布旗下最强旗舰模型 GPT-5.5 及 GPT-5.5 Pro,核心能力是接受杂乱、多步骤的复杂任务并自主完成 —— 规划路径、调用工具、校验结果、持续推进,无需用户逐步干预。 Cursor 联合创始人兼 CEO Michael Truell 表示,GPT-5.5「面对复杂长期任务时能坚持更久而不中途停下」;Every 创始人兼 CEO Dan Shipper 验证了其能独立给出与资深工程师相同的系统重构方案; 一位英伟达工程师甚至表示「失去访问权限感觉就像肢体被截肢了一样」。 ( @APPSO) 4、Era 获 1100 万美元融资:推出 AI 硬件编排平台,原生接入超 130 个 LLM 由前 Humane 和 Jony Ive 硬件项目(io)核心成员创立的初创公司 Era 宣布累计完成 1100 万美元融资。该公司针对 AI 硬件推出了一套软件编排与智能体调度平台,为硬件开发者提供处理多模态输入与模型推理的底层基础设施。此举将允许开发者无需自建复杂的模型调度后端,即可快速开发脱离传统 App 交互模式的新型 AI 穿戴设备。 开发者套件原型落地验证:今年 4 月,基于 Era 交付的最小化模块化开发套件(Developer Kit),早期开发者已构建出多款实验性终端,包括:播报特定国家文化笑话的实体纪念品、能根据股票数据预测「今日是否适合辞职」的类手机装置,以及空气质量监测仪。 更多原型作品:https\://primavera.era.world/ 原生集成超 130 个 LLM:平台已预置来自 14 家以上模型提供商的 130 多个大语言模型(LLM),为硬件开发者提供开箱即用的推理接口与定制化语音生成能力。 动态路由(Dynamic routing)与环境适配:平台核心引擎支持跨模型的动态请求路由,并专门针对边缘硬件在现实世界中的约束(如网络连接状态、低功耗限制)优化了调度逻辑。 无 App 化(App-less)架构设计:提供独立于手机操作系统的「智能层(Intelligence layer)」,支持向眼镜、戒指、家庭音响等非传统屏幕设备输出环境感知与交互能力。 用户级记忆与隐私解耦:在架构上允许终端用户自主选择记忆存储方式和底层模型提供商,以满足隐私隔离与数据合规需求。 开发者套件(Dev Kit)已向部分创客与艺术家内测,平台后续计划向开源及创客社区开放。 (@TechCrunch) 1、ElevenLabs 联合 Turn.io 启动 2026 健康加速器:整合 TTS/STT 接口与 WhatsApp 基础设施 ElevenLabs 宣布联合 Turn.io 与 Anthropic 推出为期 24 周的「Chat for Health Accelerator 2026」。该项目旨在利用 ElevenLabs 的语音技术栈,将基于 WhatsApp 的医疗服务从纯文本交互升级为语音原生交互,以解决全球低识字率及多语言人群的医疗信息接入障碍。 ( @elevenlabs) 2、GRAI 获 900 万美元种子轮融资:推出实时音频衍生管线,聚焦社交化音乐二次创作 白俄罗斯创业团队 GRAI 完成 900 万美元种子轮融资,由 Khosla Ventures 与 Inovo VC 领投。该公司避开 Suno、Udio 等纯生成式(Text-to-Music)路径,通过构建实时音频系统和权限管理机制,推动基于版权音乐的社交混音与二次创作。 ( @TechCrunch) 1、员工故意删除 AI 训练数据被起诉,北京市检察机关深化知识产权保护 北京市人民检察院发布《北京市检察机关知识产权检察白皮书(2025 年)》。 去年北京市检察机关共办理知识产权案件 1195 件,同比上升 10.34%,其中刑事检察案件 744 件、审查起诉 234 件 420 人,民事检察案件同比上升 2.15 倍,公益诉讼检察案件同比上升 5.5 倍。 在 AI 产业保护方面,北京市检察机关去年共办理涉人工智能产业、数据要素产业知识产权案件 113 件,涵盖 AI 技术侵权认定、模型训练数据法律属性、数据知识产权权属界定等前沿法律议题。 其中,东城区检察院办理的全市首例非法删除 AI 模型训练数据案尤为典型。涉案员工故意删除公司用于训练 AI 模型的大量数据,导致模型训练系统结构性破坏,造成重大经济损失。 检察机关最终以「破坏计算机信息系统罪」提起公诉,推动将 AI 模型训练系统纳入刑法保护范畴。通州区检察院则办理了全市首例利用 AI 生成模型侵犯著作权案,四名被告人均因犯侵犯著作权罪被判处刑罚。 (@APPSO) 阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么 写在最后: 我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。 对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。 作者提示: 个人观点,仅供参考
01 有话题的技术


reasoning_effort 参数自定义思考强度;全量支持 Json Output、Tool Calls 与对话前缀续写能力。API 原生兼容 OpenAI ChatCompletions 与 Anthropic 两种接口格式。
02 有亮点的产品

03 有态度的观点



