标签 语音识别 下的文章

前言

在实际的语音产品开发中,一个常见且令人头疼的问题就是:在安静环境中识别效果良好,但在噪声环境下识别率急剧下降。这种现象在智能头盔、茶吧机、户外设备等产品中尤为突出。

本文将从硬件选型、结构设计、软件配置三个维度,系统性地介绍噪声环境下的语音识别优化方案,帮助开发者打造在复杂环境中仍能稳定工作的语音产品。

一、噪声对语音识别的影响机制

1.1 问题表现

在噪声环境中,语音识别模块可能出现以下异常现象:

现象可能原因影响程度
需要很大声才能识别信噪比(SNR)不足★★★★★
误识别率增加噪声掩盖语音特征★★★★
完全无响应噪声饱和前端电路★★★★★
识别延迟变长算法反复校验★★☆☆☆

1.2 噪声类型分析

不同类型的噪声需要针对性的解决方案:

  • 稳态噪声:电机、风扇持续运转声,可通过算法降噪
  • 脉冲噪声:开关、继电器动作声,需硬件滤波
  • 环境背景噪声:人群、交通噪声,需指向性拾音
  • 振动传导噪声:机械振动通过结构传导,需物理隔离

二、硬件选型:从源头提升信噪比

2.1 麦克风参数要求

配合语音模块使用的麦克风需要满足以下基本参数要求:

参数推荐值说明
灵敏度-32dB \~ -25dB常用值:-27dB
信噪比(SNR)>75dB越高越好,建议选择 >80dB
工作电流≤0.5mA低功耗设计
尺寸Φ6mm × 2.7mm贴片封装,便于 SMT 生产

2.2 指向性麦克风选型

在高噪声环境下,全向麦克风往往无法满足需求,此时应考虑指向性麦克风

6027 驻极体指向性麦克风规格

参数数值
类型单向指向性驻极体麦克风
灵敏度-42dB(典型值)
频率响应20Hz - 16kHz
工作电压2 - 5.5V
长度约 10cm(可定制)
封装6027

指向性特性

指向性麦克风具有心形指向性图案,其拾音特点如下:

  • 0° 方向(正对麦克风):灵敏度最高
  • 180° 方向(背对麦克风):衰减约 12-15dB
  • 90° 方向(侧向):适度衰减

这种特性使其能够有效抑制来自侧面和背面的噪声。

2.3 指向性麦克风安装要点

最佳安装角度

推荐:麦克风受音面与嘴部成90°直角
位置:嘴部上前方

音腔设计

为麦克风设计专用音腔可显著增强指向性效果:

效果提升等级:
无音腔 < 简单音腔 < 优化音腔 < 专业音腔

音腔设计要点:

  • 音腔开口尺寸影响频率响应
  • 合理的音腔深度能提升指向性
  • 建议按照声学设计规范进行专业设计

三、降噪方案对比与选择

3.1 方案对比矩阵

方案优点缺点成本适用场景
软件算法优化成本低、易于升级效果有限★☆☆☆☆室内或低噪声环境
指向性麦克风降噪效果明显需结构改动★★☆☆☆室外高噪声环境
外置降噪模块效果最好成本高、体积大★★★☆☆专业应用场景
组合方案综合性能最优系统复杂★★★★☆极端噪声环境

3.2 软件优化方案

对于室内或中等噪声环境,优先尝试软件优化:

平台配置调整

  1. 提高识别灵敏度
  2. 启用深度降噪或稳态降噪功能
  3. 对于单麦克风模式,启用 AEC(回声消除)功能

注意事项

  • 提高灵敏度会增加误识别风险
  • 需要根据实际环境平衡灵敏度和准确率

3.3 外置降噪模块选型

当软件优化和指向性麦克风仍无法满足需求时,可考虑外置降噪模块。

选型要点

  1. 启动速度:选择通电秒启动的模块,避免影响用户体验
  2. 接口兼容性

    • USB 接口:可作为 USB 声卡使用,方便调试
    • 模拟麦克风输入:支持直插驻极体麦克风
    • 数字麦克风接口:保留原有数字麦克风兼容性
  3. 功能特性

    • 多场景模式切换
    • AI 降噪:支持近/中/远/超远距离四种拾音场景
    • 波束成形:支持 30°/60°/90°/120° 拾音角度
    • SPI 调试接口:实时调节降噪参数

连接方案

麦克风 → 降噪模块 → 语音模块

3.4 双麦阵列方案

对于更专业的应用,可考虑双麦克风阵列方案:

DM4737-223 数字硅麦规格

  • 双麦克风阵列设计
  • 数字 I2S 输出接口
  • 内置 DSP 处理
  • 支持拾音角度切换
  • 近/中/远/超远距离模式

优缺点

  • 优点:更好的噪音分离能力,可调节参数
  • 缺点:需要更大安装空间,成本较高

四、结构设计优化

4.1 麦克风布局原则

核心原则:远离噪声源,靠近用户声源

❌ 错误布局:
[电机] --- [语音模块] --- [用户]
         (麦克风)
​
✓ 正确布局:
[电机]           [用户]
           ↗     ↖
         (麦克风)
         [语音模块]

具体措施

  1. 麦克风尽量远离电机、风扇等噪声源
  2. 避免金属遮挡,使用非金属开孔
  3. 考虑防水防尘设计(如需要)
  4. 在麦克风和噪声源之间增加物理隔振

4.2 电源干扰处理

电源噪声是影响语音识别的隐形杀手,典型案例是:

系统主板连接电机驱动板后,5V 电源出现杂波,导致语音识别模块需要很大声才能识别指令,但用手握住咪头后又恢复正常。

解决方案

  1. 电源滤波

    • 在语音模块电源输入端加装滤波电路
    • 添加 100μF-470μF 电解电容滤除低频纹波
    • 并联 0.1μF 陶瓷电容滤除高频噪声
    • 使用磁珠或小电感构成 LC 滤波器
  2. 信号线屏蔽

    • 麦克风连接线使用屏蔽线,屏蔽层单端接地
    • 让麦克风线路远离电机驱动器和功率线路
    • 避免麦克风线与电机电源线平行走线
  3. PCB 布局优化

    • 语音部分电路远离电机驱动等大功率器件
    • 电源地线采用星形接地,避免地环路
    • 模拟电源和数字电源分离
  4. 独立供电

    • 为语音模块使用独立的 LDO 稳压器供电
    • 或在语音模块电源输入端增加二级稳压

4.3 振动与噪声控制

  • 缓冲设计:结构件之间加入缓冲垫减少共振
  • 动平衡:旋转部件进行动平衡,降低噪声
  • 隔振设计:PCB 与外壳之间增加橡胶垫减小敲击声

五、不同场景下的方案选择建议

5.1 场景识别矩阵

环境条件无降噪指向性麦克风降噪模块组合方案
室内安静(<40dB)✓✓✓✓✓✓✓✓✓✓✓✓✓
室内噪音(40-60dB)✓✓✓✓✓✓✓✓✓✓✓✓✓✓
室外 76dB✓✓✓✓✓✓✓✓✓
极端噪音(>85dB)✓✓✓✓✓✓✓

5.2 方案选择优先级

成本敏感项目

  1. 普通全向咪头 + 软件降噪
  2. 如不满足,升级为指向性咪头

空间受限项目

  1. 单向指向性咪头
  2. 配合结构优化和音腔设计

效果优先项目

  1. 指向性咪头 + 降噪模块
  2. 专业场景考虑双麦阵列

六、调试与验证

6.1 测试方法

  1. 分阶段测试

    • 先测试软件优化后的固件版本
    • 如识别效果仍不满足,再采用指向性麦克风
    • 最后考虑增加降噪模块
  2. 对比测试

    • 保留无降噪版本的测试对比
    • 使用带 SPI 接口的模块便于参数调节
  3. 场景覆盖

    • 在不同噪音等级下测试识别率
    • 验证不同角度的声音衰减效果
    • 测试长时间工作的稳定性

6.2 调试建议

  1. 优先测试软件算法优化效果
  2. 保留无降噪版本的测试对比
  3. 使用带 SPI 接口的模块便于参数调节
  4. 充分测试各种噪声场景下的表现

七、总结

噪声环境下的语音识别优化是一个系统工程,需要从硬件选型、结构设计、软件配置三个维度综合考虑:

  1. 硬件层面:根据噪声等级选择合适的麦克风和降噪方案
  2. 结构层面:合理布局麦克风,处理电源和振动干扰
  3. 软件层面:充分利用平台的降噪和识别灵敏度配置

关键经验法则

  • 室内环境:软件优化可能已足够,无需降噪模块
  • 室外高噪:降噪模块能显著提升识别率
  • 成本考虑:降噪模块增加 BOM 成本,需权衡必要性
  • 集成顺序:按"软件 → 指向性麦克风 → 降噪模块"的顺序逐步验证

通过系统性的优化,即使在复杂的噪声环境中,也能打造出稳定可靠的语音交互体验。

参考资源

  • SmartPi 官方文档:产品结构设计指南
  • SmartPi 官方文档:硬件设计 FAQ
  • SmartPi 官方文档:语音调优 FAQ

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@瓒an、@鲍勃

01 有话题的技术

1、Microsoft 开源 VibeVoice-ASR 语音识别模型:支持 60 分钟单次长音频处理,集成 64K 上下文与热词自定义

Microsoft 发布「VibeVoice-ASR」语音识别模型,突破了传统 ASR 依赖短音频切片的限制,支持单次处理长达 60 分钟的连续音频。该模型通过 64K token 上下文窗口,在单一推理过程中联合完成识别、说话人日志与时间戳生成。

  • 60 分钟单次推理能力:放弃传统的短音频切片模式,避免了因切片导致的全局语义丢失和跨片段说话人追踪失败问题。
  • 64K Token 级长上下文支持:利用超长上下文窗口,实现 ASR、Diarization(说话人日志)与 Timestamping(时间戳)的端到端联合输出,生成包含「Who, When, What」的结构化转录文本。
  • Customized Hotwords 动态引导:允许用户在识别时注入特定专有名词、技术术语或背景词汇,显著提升特定领域或低频词的识别准确率。
  • DER 与 cpWER 综合性能优化:通过联合训练,模型在说话人错误率和带时间戳的字错误率等指标上具备竞争优势。
  • 标准化部署环境:支持 NVIDIA PyTorch Container(验证版本 24.07 至 25.12),核心计算依赖 Flash-Attention 以优化超长序列的推理效率。

已在 Hugging Face 开源并提供测试 Demo,采用 MIT 开源协议。

HuggingFace:
https://huggingface.co/microsoft/VibeVoice-ASR

GitHub:
https://github.com/microsoft/VibeVoice

( @GitHub)

2、FlashLabs 发布 Chroma 1.0:开源原生 Speech-to-Speech 模型,TTFT 降低至 135ms

FlashLabs 推出「Chroma 1.0」开源端到端的 Speech-to-Speech 大模型。该模型跳过了传统的语音识别(ASR)与合成(TTS)阶段,直接在音频 Token 维度完成推理,为开发者提供了一个可私有化部署的 OpenAI Realtime 模型替代方案。

  • 原生端到端语音架构:弃用「ASR → LLM → TTS」的级联管道,采用单一闭环处理音频 Token。该架构原生支持全双工中断,并能完整保留对话中的语调、情感和节奏。
  • 135ms 极低响应延迟:模型 TTFT(首字音频延迟)小于 150ms;在启用 「SGLang」 优化后,TTFT 进一步降低至 135ms,实时系数保持在 0.47–0.51 之间,推理速度达实时语速的 2 倍以上。
  • 4B 参数量与高保真克隆:模型基于 「Qwen 2.5-Omni-3B」 与 「Mimi」 构建,仅需数秒音频样本即可实现高保真语音克隆。其相似度指标 SIM 达到 0.817,较人类基准(0.73)提升约 11%。
  • 集成双层 RAG 架构:内置双层 RAG 机制,可直接挂载向量数据库与知识图谱,实现由智能体驱动的事实检索与语音生成分离,提升对话准确性。

模型权重(Chroma-4B)与推理代码已在 Hugging Face 和 GitHub 全面开源,支持通过 FlashAI 平台直接部署。

相关链接:
https://www.flashlabs.ai/flashai-voice-agents

HuggingFace:
https://huggingface.co/FlashLabs/Chroma-4B

( @flashlabsdotai\@X)

3、Inworld AI 发布 TTS-1.5 语音模型:P90 延迟降至 130ms,推理成本仅为同类产品 1/25

「Inworld AI」正式推出 TTS-1.5 语音合成模型,旨在解决实时语音交互中的延迟与成本瓶颈。通过优化强化学习算法,该版本在显著提升表现力的同时,将 P90 延迟压缩至 250ms 以内,并实现了极低廉的定价策略,直接面向大规模商用语音智能体市场。

  • 生产级实时延迟:TTS-1.5 Mini 模型的 P90 首包延迟低于 130ms,Max 模型低于 250ms,响应速度较前代提升约 4 倍,突破了人类自然对话约 300ms 的感知间隔。
  • 稳定性与表现力优化:通过规模化强化学习训练,词错率降低 40%,大幅减少了长文本合成中的幻觉、断句和杂音;同时语音表现力提升 30%。
  • 极具竞争力的定价结构:交互成本低至 0.5 美分/分钟,每百万字符定价为 $5-$10,对比行业头部方案($120+/百万字符)成本降低逾 25 倍。
  • 扩展功能与部署灵活性:支持 15 种语言(重点优化了印地语);专业级声音克隆功能正式开放 API 调用;并为企业用户提供 On-prem(本地化)部署选项。
  • API 平滑迁移:现有开发者可通过更改 modelId 为 inworld-tts-1.5-mini 或 max 实现快速接入,已整合至 Voximplant 等第三方平台。

已正式上线,开发者可通过 「Inworld AI」 官网 API 或集成合作伙伴平台接入;提供开源/闭源方案及企业级私有化部署。

相关链接:
https://inworld.ai/tts

( @inworld\_ai\@X)

4、DeepSeek 新模型「MODEL1」曝光

1 月 21 日下午消息,DeepSeek 于官方 GitHub 仓库更新了一系列 FlashMLA 代码,在这些更新中,一个名为 「Model 1」的模型 引起了广泛关注。

据悉,目前这个还很神秘的 Model1 不仅出现在了代码与注释中,甚至还有与 DeepSeek-V3.2 并驾齐驱的文件。这也不禁引发广大网友猜测,认为 Model 1 很可能就是传闻中 DeepSeek 将于春节前后发布的新模型代号。

最新消息显示,Model1 是 DeepSeek FlashMLA 中支持的两个主要模型架构之一,另一个是 DeepSeek-V3.2。

据推测,MODEL1 很可能是一个高效推理模型,相比 V3.2,内存占用更低,适合边缘设备或成本敏感场景。它也可能是一个长序列专家,针对 16K+序列优化,适合文档理解、代码分析等长上下文任务。它也可能是一个长序列专家,针对 16K+序列优化,适合文档理解、代码分析等长上下文任务。

另外,MODEL1 的硬件实现跨越多个 GPU 架构。在英伟达 H100/H200(SM90 架构)上有两个版本:model1\_persistent\_h64.cu 用于 64 头配置,model1\_persistent\_h128.cu 用于 128 头配置。在最新的 B200(SM100 架构)上有专门的 Head64 内核实现,而 SM100 的 Head128 实现仅支持 MODEL1,不支持 V3.2,有人猜测 DeepSeek 为适配英伟达新一代 GPU,专门优化了 MODEL1 的架构。

(@雷锋网)

02 有亮点的产品

1、苹果首款 AI 穿戴设备曝光:AirTag 尺寸胸针,双摄、三麦克风

1 月 22 日消息,科技媒体 The Information 发布博文,报道称苹果正在研发一款尺寸类似 AirTag 的「AI 佩戴式胸针」,计划最早于 2027 年发布。

这款设备目前的开发代号尚未公开,但其形态被描述为「类似 AirTag 大小的圆形圆盘」。项目仍处于早期阶段且存在取消风险,不过消息称苹果工程师正全力推进,目标定于 2027 年推向市场。

在硬件规格方面,这款 AI 胸针混合铝合金与玻璃外壳材质,厚度略高于 AirTag。为了实现环境感知,该设备正面集成了两颗摄像头(标准镜头与广角镜头),不仅能拍摄照片,还能实时捕捉用户周边的视频信息。

设备内置了三个麦克风用于精准收音,配备了一个扬声器进行语音反馈,并在边缘设置了一枚实体按键,背部采用了与 Apple Watch 相似的磁吸感应充电接口。

(@IT 之家)

2、苹果首款 AI 智能家居中枢爆料:带屏幕、会转头,最早今春登场

科技媒体 The Information 今天发布博文,爆料称苹果计划最快今年春季发布新款智能家居中枢(Home Hub),采用「机器人旋转底座」设计,根据声音或动作让设备自动转向用户。

消息称这款智能家居中枢不仅配备了小型显示屏和高保真扬声器,更引入了具身智能的关键组件「机器人旋转底座」,让设备能够物理转动,改变传统智能音箱被动静止的交互模式。

尽管爆料未详细阐述旋转底座的技术原理,但科技媒体 MacRumors 认为其核心目的是实现「视觉追随」。结合苹果在传感器领域的布局,该设备预计将搭载阵列式传感器,用于精准识别用户在房间内的位置。

例如用户发出语音指令或移动后,底座驱动屏幕自动转向用户,不仅能提供更好的视频通话视角,还能通过物理动作模拟注视感,赋予 AI 助手一种「视觉人格」,从而提升交互的沉浸感与自然度。

发布日期方面,供应链消息指出,其上市时间窗口将与 iOS 26.4 的发布时间高度重合。硬件上的灵动转向配合软件上的更智能 Siri,苹果有望重新定义智能家居的控制中心。

(@IT 之家)

3、字节 AI 硬件传人事变动:Oladance 创始人李浩乾或离职,新一代耳机与眼镜曝光

据蓝鲸新闻消息,字节跳动 Flow 旗下 Ocean 团队核心骨干、原 Oladance 创始人李浩乾或将离职。知情人士透露,目前内部人事调整仍存变数,不排除转岗等可能。 李浩乾曾任职于 Bose 并带领研发 QC35,后于 2019 年创立 Oladance 主攻开放式耳机。2024 年中旬,字节跳动以约 5000 万美元全资收购 Oladance,李浩乾随团队加入字节,职级定为 5-1,负责代号为「D 线」的 AI 可穿戴设备业务。

在收购完成后,字节跳动迅速整合资源,于 2024 年 10 月推出了首款搭载豆包大模型的智能耳机 Ola Friend,预售价 1199 元。该产品深度集成了豆包的语音交互能力,并于 2025 年 5 月上线了 AI 外教智能体「Owen」,支持英语对话、双语点评及职场模拟等功能,试图通过垂直场景切入教育硬件市场。然而,有消息显示该产品后期的市场反响未达团队预期。

面对硬件赛道的挑战,字节跳动正在加速调整产品布局。供应链信息指出,字节正研发新一代豆包 AI 耳机,由歌尔股份专门设立事业群负责代工,产品核心思路将转向与手机的深度协同。此外,豆包 AI 眼镜(无屏版)预计将于 2026 年第一季度面世,首批规划量约 10 万台,将采用邀请制发售。

(@多知)

03 有态度的观点

1、马斯克喊话「不要让亲人用 ChatGPT」,奥特曼回应:超过 50 人死于 Autopilot

昨天,特斯拉 CEO 伊隆 · 马斯克在 X 转发一则帖子,直言「不要让你的亲人使用 ChatGPT」。该帖子声称 ChatGPT 自 2022 年发布以来,已与 9 起死亡案例相关联。

OpenAI CEO 山姆 · 奥特曼随后对此进行回应,强调 OpenAI 在保护脆弱用户与确保产品可用性之间面临艰难平衡。

他表示「我们需要保护脆弱用户,同时确保所有用户都能从工具中受益」,并指出马斯克此前曾抱怨 ChatGPT 的内容审核「过于严格」。

在回应中,奥特曼还回击了特斯拉汽车的 Autopilot 自动驾驶功能。

他表示,自己曾乘坐搭载该系统的车辆,「第一反应是这远不是特斯拉应该发布的安全产品」,并暗示马斯克旗下 xAI 的 Grok 在内容安全上也存在争议。

《商业内幕》报道指出,围绕 ChatGPT 的安全性,OpenAI 目前已面临至少 8 起与心理健康恶化、自杀或暴力事件相关的诉讼;

而特斯拉 Autopilot 也卷入多起致死事故诉讼,包括一起发生于 2019 年、最终由陪审团裁定特斯拉承担 33% 责任的案件。

这场公开争执发生在双方长期法律纠纷的背景下。马斯克此前起诉了奥特曼及 OpenAI 高层,指控其偏离最初的非营利使命,并称自己曾为 OpenAI 的早期发展投入 3800 万美元。

( @APPSO)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点,仅供参考​

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@瓒an、@鲍勃

01 有话题的技术

1、无界方舟 AutoArk-AI 发布 GPA 语音大模型:0.3B 轻量化架构实现 ASR/TTS/VC 统一建模

在克隆参考音频样本的音色的同时,从文本合成语音。

无界方舟 AutoArk-AI 正式推出通用音频模型「GPA」。该模型基于统一的自回归 Transformer 架构,在单一的大语言模型框架下,集成了语音识别(ASR)、语音合成(TTS)和语音转换(VC)三大核心任务

该模型的设计初衷在于改变传统语音系统碎片化的 Pipeline 设计模式。通过 0.3B 的轻量化参数量级,GPA 旨在实现端侧的高效部署以及跨任务的泛化能力

在技术架构上,GPA 放弃了任务特定的输出头,转而采用统一的离散音频 Token 空间。这一设计将理解、生成与编辑任务收敛至单一自回归模型中,从而减少了跨任务处理过程中的性能损耗。

交互方式上,模型采用指令驱动机制,通过文本指令来引导任务行为。它支持零样本语音克隆,用户无需调整架构或进行针对性微调,即可在 ASR、TTS 和 VC 之间进行动态切换。

针对边缘计算场景,官方提供了优化的 0.3B 参数版本。该版本兼容性广泛,支持 vLLM、llama.cpp、SGLang、MLX-LM 以及端侧硬件框架 RKNN。

在流式推理的延迟指标方面,测试数据显示:在 TTS 任务中,单并发平均 TTFC(首包延迟)为 258.8ms,RTF(实时率)为 0.197;在 ASR 任务中,单并发平均 TTFT(首 Token 延迟)为 157.5ms,能够支持高并发吞吐场景。

在性能对标测试中,针对中文 SEED 数据集的 TTS 零样本测试显示,GPA-0.3B 的 CER(字符错误率)为 0.95%。数据显示,该成绩优于同参数量级的 F5-TTS 模型。

目前,该模型的代码已开源,相关论文与 Demo 即将上线。使用许可方面,模型目前仅供学术研究与个人教育使用。

GitHub:
https://github.com/AutoArk/GPA

( @GitHub)

2、ElevenLabs 洽谈新一轮融资:估值或达 110 亿美元,有望成英国最有价值 AI 初创公司

据英国《金融时报》报道,AI 语音生成公司 ElevenLabs 正洽谈新一轮融资,计划从投资者处募集数亿美元资金。若交易达成,其估值或将在数月内翻倍至 110 亿美元

这一跃升将使 ElevenLabs 超越估值约 80 亿美元的自动驾驶公司 Wayve,成为英国最有价值的人工智能初创公司;同时,也将使其跻身欧洲顶尖行列,逼近法国 AI 模型公司 Mistral 约 120 亿美元的估值水平。

此次融资谈判距离公司上一次二级股份出售仅过去四个月,当时的估值为 66 亿美元。据悉,目前的会谈仍处于早期阶段,具体情况可能存在变数。

ElevenLabs 于 2022 年由波兰企业家 Mati Staniszewski 和 Piotr Dabkowski 在伦敦创立,目前已获得红杉资本(Sequoia)、Iconiq、Andreessen Horowitz、NEA 及 FT Ventures 等多家知名风投机构的支持。为了便于获取美国资本,公司已在美国注册,并在伦敦和纽约设有双总部。

在业务层面,ElevenLabs 专注于利用 AI 生成逼真的语音,广泛应用于客服、文本转语音及多语言配音等场景。公司业绩增长迅猛,去年年度经常性收入(ARR)已达到 3.3 亿美元,较 9 月份公布的 2 亿美元有显著提升。

宏观来看,尽管全球投资者对 AI 初创企业的兴趣持续高涨,但欧洲公司在募资规模上仍滞后于美国。作为对比,美国巨头 OpenAI 据传估值已达 5000 亿美元,并正商谈最高达 800 亿美元的新一轮融资,投后估值可能突破 8000 亿美元。

( @Benchmark Studio)

3、红杉资本「覆盖赛道」押注 Anthropic,新一轮融资目标约 250 亿美元,预计最快今年 IPO

据《金融时报》报道,红杉资本计划加入对 AI 初创公司 Anthropic 的新一轮重磅融资。此举打破了风险投资界通常避免在同一领域支持竞争对手的传统惯例,因为红杉此前已同时投资了 OpenAI 和埃隆·马斯克的 xAI。

本轮融资由新加坡政府投资公司(GIC)和美国投资机构科图(Coatue)领投。 据报道,两家机构各出资 150 亿美元。Anthropic 计划以 3500 亿美元的估值筹集 250 亿美元或更高资金,这一估值较四个月前的 1700 亿美元已翻了一番以上。此外,微软和英伟达据称已承诺共同出资最高 1500 亿美元。

红杉此次的投资时机颇受外界关注。OpenAI CEO 萨姆·奥尔特曼此前曾明确表示,虽然不禁止投资者投资竞品,但若投资者对竞争对手进行「非被动投资」,其接触 OpenAI 机密信息的权限将被终止。

尽管面临潜在的利益冲突,红杉仍选择进一步深化在 AI 领域的布局。 此前,红杉不仅支持了奥尔特曼创立的 Loopt 和其引荐的 Stripe,也通过投资 xAI、X、SpaceX 及 Neuralink 等公司与马斯克建立了广泛联系。

这一策略转变发生在该机构经历戏剧性的管理层变动之后。近期,红杉全球掌门人罗洛夫·博塔(Roelof Botha)离职,由林君睿(Alfred Lin)和帕特·格拉迪(Pat Grady)接手。这种多点押注的策略,与 2020 年红杉因利益冲突而放弃 Finix(Stripe 竞对)投资的历史立场形成了鲜明对比。

此外,报道还透露,Anthropic 正在积极筹备首次公开募股(IPO),最快可能在今年年内进行。

( @Z Potentials、@TechCrunch)

4、NVIDIA 发布 PersonaPlex:基于 Moshi 架构的 7B 全双工对话模型,支持混合 Prompt 定制

NVIDIA ADLR 团队近日正式发布了 PersonaPlex,这是一个参数量为 7B 的原生全双工语音对话模型。该模型通过摒弃传统的 ASR→LLM→TTS 级联架构,实现了超低延迟的实时语音交互,并着重解决了全双工模型在角色与音色自定义方面的局限性

在架构设计上,PersonaPlex 基于 Kyutai 的 Moshi 架构及 Helium 语言模型构建,并采用了 24kHz 采样率的 Mimi 神经音频编解码器。该架构支持模型同时处理音频输入流与输出流,从而具备了实时打断、背向渠道(Backchanneling,如「嗯」、「噢」)以及自然的轮替节奏等全双工特性。

为了提升定制化能力,模型引入了混合提示机制。 该机制包含双路输入控制:通过音频嵌入提取参考音频的声学特征,以控制发音风格与韵律;同时利用文本指令来定义角色的设定、背景知识及交互逻辑。

在训练数据方面,团队采用了脱耦与融合策略。模型使用了 1,217 小时的 Fisher English 真实对话语料来学习打断、情绪反馈等交互行为,并结合了约 2,250 小时由 Qwen3-32B 和 Chatterbox TTS 生成的合成数据,以强化指令遵循能力。

评测结果显示,在 FullDuplexBench 及新增的 ServiceDuplexBench 测试中,PersonaPlex 在顺滑轮替和暂停处理等指标上优于 Gemini 2.0 Flash Live 等商业模型。此外,在未见过的极端场景(如太空紧急状况响应)中,模型也展现出了技术推理与情绪同步能力

目前,该项目的代码采用 MIT 开源协议,模型权重则采用 NVIDIA Open Model License 协议。相关的测试集 ServiceDuplexBench 也将于近期开放。

HuggingFace:

https://huggingface.co/nvidia/personaplex-7b-v1

( @NVIDIA ADLR Blog)

02有亮点的产品

1、飞书发布首款硬件「AI 录音豆」:联手安克创新,争夺更近的上下文入口

据「智能涌现」报道,飞书联合安克创新发布首款智能硬件产品「AI 录音豆」,这也是飞书自 2017 年成立以来的首次硬件尝试。该产品被定义为飞书内部的探索性项目,由飞书团队负责软件部分的研发。

在此次合作中,飞书团队主要负责软件层面的研发。该设备通过极轻量化的设计捕捉物理场景语音,并结合豆包大模型,旨在实现办公上下文的自动化沉淀与结构化处理

在硬件形态上,AI 录音豆单体重量仅为 10g,含充电仓总重 48g,内部搭载了双 MEMS 麦克风阵列。产品采用了豆状设计,支持背夹或磁吸佩戴。这一设计旨在降低录音过程中的仪式感,以便更好地覆盖通勤、拜访等碎片化使用场景。

在续航与存储配置方面,配合充电舱使用,该设备可提供 32 小时的总续航时间,并支持快充技术,充电 10 分钟即可录音 2 小时。机身内置 8GB 存储空间,可存储约 250 小时音频,并支持蓝牙与 Wi-Fi 双模式传输。

核心功能方面,设备内置了豆包大模型,支持实时多模态纪要。具体能力涵盖发言人识别、待办事项自动提取以及柱状图等图例的可视化生成,用户可在录音过程中实时查看 AI 总结。

此外,该产品实现了与飞书生态的闭环打通。录音内容会自动沉淀至飞书知识库,用户随后可通过 AI 助手,以自然语言交互的方式对历史音频记录进行语义检索、提问及二次创作。

目前,该产品被定位为飞书内部的探索性项目,具体定价及正式发售日期暂未披露。

(@36 氪)

2、银河通用发布重载机器人 Galbot S1:50kg 双臂负载突破瓶颈,零遥操切入核心产线

「银河通用」正式发布工业级具身智能重载机器人「Galbot S1」。该机器人实现了 50kg 的双臂持续作业负载,并搭载全自主、零遥操的「具身搬运模型」。目前,产品已成功进入宁德时代等头部企业的核心产线,承担重型物料搬运及部件装配任务。

在负载能力上,Galbot S1 实现了显著突破。它拥有 50kg 的双臂持续负载能力,不仅对标人力搬运的极限,更突破了具身智能机器人普遍低于 10kg 的负载瓶颈,有效填补了轻型协作机器人与大型固定吊装设备之间的重载作业空白。

技术层面,该机器人采用了全自主的具身搬运模型。基于纯视觉感知方案,Galbot S1 无需依赖二维码或反光板等外部标记,即可支持动态光照、局部遮挡及人机混行等复杂工况,实现了零遥操下的端到端作业。

针对工业环境的适配性,整机具备 IP54 防水防尘等级,作业高度覆盖 0 至 2.3 米区间,能够适配从地面物料到高位货架的全场景搬运需求。

在续航与安全性方面,Galbot S1 支持 8 小时单次续航及自主换电功能,可实现 7×24 小时连续运转。同时,系统配备了毫秒级安全响应机制与 360° 全向避障能力,确保作业安全。

此外,银河通用通过在宁德时代、博世、丰田等真实产线的长期运行,构建了场景数据闭环,持续强化具身智能大脑在严苛节拍下的稳定性。

目前,公司已完成 21 亿元融资,估值突破 200 亿元,正积极推进千台级的工业部署。

(@量子位)

3、全球首个全年龄段覆盖,京东京造第二批 AI 玩具上线

近日,京东京造正式宣布上线第二批自研 AI 玩具。此次发布的新品在此前针对儿童开发的陪伴玩具基础上,进一步推出了面向年轻人及老年群体的 AI 玩具,实现了全球首个全年龄段用户需求的覆盖

京东 JoyInside 为硬件注入了「长期记忆」与「情境感知」能力,能够理解对话的上下文,也成为首个根据不同年龄段用户的偏好与习惯进行优化的系统平台。

这项能力被深度应用于不同年龄层的需求设计中:系统能识别婴幼儿的哭声并给予安抚,为儿童提供启蒙引导并识别潜在风险,与年轻人进行有深度的主题聊天,也能用方言陪伴老年人,并关注他们的健康与社交需求。

回顾市场表现,首批 AI 玩具上市后,被用户视为「游戏搭子」、「情绪树洞」及「知识导师」,在帮助儿童减少电子屏幕依赖方面发挥了作用。数据显示,接入 JoyInside 的智能硬件平均对话轮次提升超过 120%,多款产品上线即售罄,且保持了极低的退货率。

截至目前,京东 JoyInside 已携手超过 40 家硬件品牌,涵盖 AI 玩具、机器人等品类。

(@IT 之家、@京东黑板报)

03有态度的观点

1、DeepMind CEO:AGI 5-10 年内实现

日前,Google DeepMind CEO Demis Hassabis 接受了 CNBC 的节目采访,与主持人共同讨论了缩放定律的重要性以及发展通用人工智能(AGI)的持续追求。

Demis 表示,自己依然认为 5 到 10 年内 AGI 能得以实现。

其指出,包括 AI 在内的 AGI 将涉及 LLMs 和世界模型的组合,而不是一个组件取代另一个组件。

Demis 认为,AI 可能需要更好的推理、长期规划和 「世界模型」 的概念,以更好地理解物理学并进行模拟,反映人类科学家的工作。其也强调,除了世界模型之外,AGI 可能还需要其他类型的技术和能力。

同时他也表示,为了使 AI 在科学能力方面取得进步,它需要能够提出新的假设和想法,而不仅仅是解决现有的猜测。

( @APPSO)

04社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、招聘 AI Agent 开发工程师

22-35K·13 薪深圳 5-10 年 本科

岗位职责:

  1. 负责 AIAgent 系统的架构设计与工程实现,包括智能体的任务规划、决策逻辑、工具调用以及记忆管理等核心模块。
  2. 深入集成与优化大语言模型(LLM),通过提示工程、微调等技术路径,持续提升 AI 助手的对话质量、逻辑推理能力及任务执行准确性。
  3. 为 AI 助手连接并管理各类外部工具与 API(如搜索、数据库、第三方服务),构建其实际解决问题的能力,同时确保执行过程的安全与可控。
  4. 建立针对 AI 助手性能的评估、监控与迭代闭环,通过数据分析驱动产品体验的持续优化。5.编写高质量、可维护的代码,并将 AIAgent 系统部署至生产环境,保障其高可用性与低延迟。

任职要求:

  1. 计算机科学、软件工程或相关专业本科及以上学历,具备 3 年以上后端或 1 年以上 AI 应用开发经验。
  2. 熟悉 PyTorch、TensorFlow 等主流深度学习框架,具备扎实的工程能力和良好的编码习惯。
  3. 对大语言模型及 AIAgent 技术栈有深入理解和实际项目经验。
  4. 拥有强烈的产品意识和用户同理心,关注技术落地对用户体验的实际影响,具备优秀的数据分析能力和问题解决技能。
  5. 有成功的 ToC 互联网产品或 AI 产品(如智能助手、对话机器人)开发及上线经验者优先。

联系人:李先生

联系方式:26905841@qq.com

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

作者提示:个人观点,仅供参考

众所周知手机版的豆包输入法很好用,但是阿,没有电脑版~
试了一圈其他的语音工具在 windows 的场景下的适配都不是很好,影响 vibecoding

突然想起用的豆包客户端好像有语音识别功能,试试了一下。但是得自己手动点击或者按回车,文字插入还有点问题。很不方便阿,于是决定手搓一个工具,解放双手。

基于豆包语音识别的增强辅助的工具,帮助实现主流语音输入法效果。
提供两种输入模式(按着说、自由说),可查看实时语音效果,有自动纠正功能,英文支持友好,识别效果不满意支持清空重录

演示效果:
【开源】PC 端 豆包语音输入工具,Windows 豆包语音输入增强工具3
效果还是很 nice 的,现在是我的主力了;约等于 pc 端豆包语音输入法(丐版) ;这里提供给大家多一种选择。觉得不错的帮忙点个 star

项目地址:

想要使用的话要先安装豆包的客户端,同时启用两个软件。(但对于我这种豆包客户端一直挂后台的人来说就没什么区别,他的一些划词还有实时对话、翻译功能确实还挺好用。)

最后坐等官方出 PC 版。


📌 转载信息
原作者:
xiaohu31
转载时间:
2026/1/19 18:07:04

除了首页时间流和侧栏的精选展位,少数派 Matrix 社区还有很多优秀内容因条件所限无法得到有效曝光,因此我们决定重启 Matrix 周报,并在此基础上添加更多社区内容、作者投稿「新玩意」呈现给大家。


💬一派热议

在上期第 253 期一派讨论《聊聊你用的语音输入工具?》中,共有 352 名派友热情参与,十分感谢!

微信和系统输入法的占比:霸占入口真是强势。

小胡小胡 0009(+21) 我的观察,拥有独立工作空间的人会更加推崇语音输入,比如独立开发者,可以没有顾忌地说话。

比起语音输入的便捷性,我更介意被他人听到,并且长文本的语音输入能力,需要锻炼才能获得,并没有那么简单。

Karrdiyas(+10) 微信聊天输入框右边那个麦克风图标就挺好用的,一键语音转文字,识别准、速度快,主要 iOS 设备上使用还不用跳转,体验很流畅,已经是日常高频使用的功能了。

GabrielleS(+8) 不得不推荐讯飞拼多多买的 50 块钱的语音鼠标,搭配 Windows 的客户端,识别准确成功率可以覆盖 90% 以上,而且还可以自己加标点符号,写文章、battle、理论起来效率更高了。遇到很气的时候可以拿着语音鼠标一顿输出,转成文字之后还可以再润色,删掉不理智的话,有助于疏通情绪、缓和同事关系。50 块钱拍烂了也不心疼,已经成功安利好多身边同事了。

小杨爱捣鼓(+8) 苹果自带的语音输入准确率太低,App 的又得跳转,硬伤。

少数派 11695987(+6) VoiceSnap 语闪,刚出的开源离线语音输入,非常不错。

danghb(+6) 电脑上用的「闪电说」,本地端模型,也可以使用 API 进行 AI 纠正和调整。

zixr365(+6) 一直不太习惯用语音输入。第一我是个 i 人,在外面说话还是有点放不开,虽然可能并没有人注意。第二是输入总会有个思考过程,文字输入慢,在打字过程中思路就基本理清了,语音输入快,常常输入出错需要删除后重新输入,没有一个完整的输入过程,语音输入的便捷性好像就变低了。此外就是输入不是百分百准确,遇到错别字,还需要光标定位后修改,修改过程比键盘输入更麻烦。

Eric_du(+4) 我们自己做了一款 Mac 端的,叫「秒言 AI 语音输入法」,识别速度快,精度高,超级好用,有需要的真的可以了解试用下。

不隔山(+4) 最近用上了「说点啥」(原名「言犀」,https://github.com/BryceWG/BiBi-Keyboard ),本地模型 + 自动录音,一点即说,非常舒适!☺️☺️☺️

晓 5687(+3) 理论上来说。使用语音输入法,最需要的是「语音输入环境」,比如独立办公室。

面具熊(+3) 每次使用听写功能时,一旦文本中出现了错字,手机上就要移动光标去修改,非常烦。所以不爱用听写。

张立行(+2) 本地隐私上:极致准确用 Whisper Large 3,平衡速度和性能一般都是使用 Sherpa ONNX 量化,具体模型可以是 Paraformer-zh(中英,体感上 SOTA),SenseVoice Small(中英粤日韩)。但最好是加一个 AI 校对,可以结合屏幕 OCR 来做。

消费级设备上追求速度成本平衡的情况下,转录准确率到达一定阶段就可以了,剩下的提升性价比不高。不如引入 LLM 校对处理最合适。

云端转录:豆包,也就是火山引擎 API 中英体感很准确。LazyTyper 适合。

少数兀(+2) Spokenly 加 Qwen ASR 加口语化提示词。终结一切。

raulpepsi(+2) 原先是不用语音输入的。因为口语表达跟书面表达总是会有些差别。用口语表达出来的文字总是有点奇怪。一个是断句,一个是标点,一个是语气词,一个是中英文的混合内容,所以一直很少用。但是豆包语音在这方面表现很好。所以最近就豆包的语音输入就用的比较多了。前几天微信也对语音输入做了升级,试下来感觉还是豆包好一些。所以现在输入法就留了 2 个,微信和豆包。豆包只用语音输入。切换就用小地球的键盘切换。

努力好脾气(+1) 没人提 Typeless 啊,那我来提一下,极致好用,除了要付费以及在 iOS 端不可避免跳转之外。

東雲閑_Alter(+1) Product Hunt 上看到一个叫做 Typeless 的软件,是我见过目前来说最好用的 AI 语音输入工具了。唯一的缺点是贵,年付都要 12 刀一个月。打算 1 个月试用完了直接溜。

碱水结(+1) 预装什么输入法用什么,感觉都差不太多……日常听写现在都比较准了,主要是在外面简单回消息。

单纯大量录音需要 ASR 有很好的便宜新模型,比如 GLM-ASR,Doubao Seed ASR 等等,用 Buzz 之类的客户端直接接入 OpenAI 兼容 API,对于会议主要还是现场设备收音质量和结合多角色声纹识别,真用得上还是一站式收费应用得了,就是贵了点。

xiang_meng(+0) 我就说大模型使得语音输入变得舒服常用,语音输入会不会使得键盘越来越少用?

Jason_4393(+0) 这两年学习了五笔,虎码输入法,对什么语音输入法的话不是很中意。

twrp(+0) 豆包输入法,自动 AI 校准,还有记忆。

Futii(+0) 百度输入法的离线语音,识别准确率还不错。我禁止了百度输入法的联网,发现它真的是离线实现的。

📢:下一期的一派讨论是数码圈日经话题《你用超广角镜头拍出过什么好片?》,欢迎来聊。

🔥一周热评

来自文章 《人生的“拥挤季” | 2025年度回顾》

Badjoe(+0) 艾玛总算回来发文了,上次年度总结貌似还是 24 年,26 年一起加油💪

Jin丶X(+0) 除了拿 30% 的钱投入到投资账户外,其余的观点都赞同。

来自文章 《它长得像古董,跑起来像闪电:海贝思磁盘SSD硬盘盒是种什么体验?》

ivxzhao(+1) 确实好看,这情怀真不错,我家里还特意收藏了一整套软盘+软驱在。

小红书也在给我猛推这个,不过想来这东西对我没啥场景,先看看吧。

来自文章 《修复一台 ThinkPad E40》

牛肉面(+0) 这个电脑是我当年给老婆买的第一台,那时还不是我老婆。

起名什么的最烦人了(+0) 看不懂,要是能用浏览器看 B 站 4K 不卡的话,100 收。

lhb5883(+0) 感觉是老机器和新系统不匹配,可能需要装一个 XP 之类的系统,因为我刚工作的时候用的是 IBM 的 R51,预装的是 XP 系统,不知道到你这个 E40 是什么时候的机子,不过看起来已经是联想时代的产物了说不定是出厂就是 8.1+ 的,装 Win7 可能没有驱动。

查了一下,好像预装的是 Win7 32bit 系统,估计是用 64bit 有硬件不支持,目前大部分的 PE 和安装盘应该都是 64bit 的了。

来自文章 《派早报:国务院开展外卖市场竞争调查评估》

↳ 💬 关于「看看就行的小道消息」的热议:

FC8E(+0) UOS(指 Uniform(制服) OS)

来自文章 《CES 2026 盘点:你可能错过的新奇花活》

Enjisi(+2) 看着看着,有种愚人节特辑的感觉。

↳ 💬 关于「联想这屏幕,把「带鱼屏」塞进笔记本」的热议:

sgricky(+0) 广告词都起好了:“卷到极致!”

PB1010(+0) 如果是二等座,估计空间不够大,两人并排坐,显示器搞不好要打架。

louissenny(+0) more like 炒股模式。

↳ 💬 关于「我的 house 不算大,但清扫工作立体化」的热议:

八分(+0) 感觉螺旋桨的吹灰能力,比原来的吸灰能力要强的多。

↳ 💬 关于「杀鸡不用牛刀,但我做饭需要超声波」的热议:

写小黑文的Alex(+0) EVA 直呼内行。

一介浪子与草生(+0) 假设这个刀真好用,开膛手杰克和汉尼拔狂喜。

↳ 💬 关于「CES 终极异类:Light Saver 反 AI 灯」的热议:

louissenny(+0) 有点像底特律变人里面的康纳酱。

少数派28335600(+0) 有点感觉像打无人机的无人机。

↳ 💬 关于「从价格上来说,这画框也是艺术的一部分」的热议:

Double95(+0) 还包含已经逝去的亲人……感觉温馨中透露着一丝诡异。

↳ 💬 关于「洗个澡的功夫,我就发财了」的热议:

少数派28711838(+0) 想法不错啊,就像我小时候想,为什么不能一边骑自行车一边发电呢?人家却把想法变成了现实。

↳ 💬 关于「情绪陪伴,可爱或许比拟真更重要」的热议:

异星绿洲(+0) 家里不乱的可以买回来添乱。

BLUME(+0) 旁边两个仿生人搞得我恐怖谷效应都要犯了。

来自文章 《丢掉遥控器,寻找生命感:这是我的 Vbot「大头」机器狗使用体验》

dead_lee(+3) 能做成导盲犬就太好了。

少数派太少数了(+1) 很想买一个,但还没想到明确的场景。里面提到帮忙搬运摄影器材,对户外比较有用,但我出门很少。普通搬运极限 12kg,感觉又不够。

wwwwwwv(+0) 我家是自建房,倒是有搬运货物上楼的需求。

少数派37606071(+0) 如果把充电器内置,直接用路边的电瓶车充电插头充电就好了。

来自文章 《与胃里的「老房客」正确相处:了解幽门螺杆菌》

Alei(+1) 总结:如有怀疑的症状,直接去三甲医院检查,如检查有问题,过来人经验,一定要顺带生活过的家人一起检查。

治疗遵医嘱就行,有社保的情况下,大部分都能负担,没必要自行治疗。

来自文章 《消亡的动态磁贴》

A1exMinatoooo(+22) 领先一步是先驱,领先两步是先烈。

少数派67077666(+5) 我倒是觉得动态磁贴挺好的,一方面没那么多花花绿绿更简介,另一方面有一些轻量级消息确实我个人喜欢直接主页就能获取到。

我觉得 UWP 的消亡更多还是微软战略上的问题,WP7.x 不能升级 WP8,WP8 又不能到 WP10,手机虽然说已经不是诺基亚那种买一个用 10 年的时代,但也不是用个两三年就换的产品,谁家钱也不是大风刮来的,买来用个一两年就被抛弃没未来谁受的了。

凝儿(+2) 恰恰相反,我用了十几年的 Windows XP 和 Windows 7,但入手了第一台预装 Windows 8.1 的笔记本电脑后,就非常喜欢,也由此养成了用磁贴的习惯。后来更新设备预装 Windows 10,还屡次尝试换回 8.1,最后因为缺少驱动而放弃。至今 8.1 仍是我最爱的系统,相比之下 10 真的很卡,还砍掉了我一直在用的自定义桌面壁纸轮换功能。

来自文章 《如何花式压榨 Gemini:一位律师选手的 2025 年 AI 使用报告》

alex11037(+18) Q:Gemini,请告诉我如何得到案源,底薪太低了我受不了了

A:不知道,但可以考虑兼职律所的司机🙈

来自文章 《新玩意 232|少数派的编辑们最近买了啥?》

一般很笨(+9) 鼻炎、鼻腔干燥,也可以试试成分最简单、使用最方便的生理盐水喷雾,我以前会觉得没用,最近使用后感觉还挺好的(一天 3 到 4 次),不用洗鼻器洗鼻也完全 OK~

McTang(+3) 我选择全家远行时候租一辆六座或者七座,一年也没几次这种机会。

来自文章 《浏览器扩展合集:派友近期推荐的 7 款浏览器扩展》

Hugogo(+6) 这个 Megi:将线性对话生长为思考的知识树真的是巧思,我现在越来越依赖 Gemini 了,可是它没有提供类似 GPT 的项目文件夹来统一项目记忆,这就导致我只能在一个超级超级长的对话里继续,导致在一定程度上对话上文已经“仅 AI 可见”了。

任大喵(+2) 安利一个,等等贴,如果你在网页端需要重复复制粘贴内容的话,这个插件真的非常好用。

Lynn(+1) Handy Prompt,自己写了一个提示词管理工具。

↳ 💬 关于「AutoVerify:免费的自动化图形验证码工具」的热议:

潮鳴(+0) 其实这种字母验证码也算古早的东西了,但我每次成功率都挺低的,不知道哪出问题,这下算是解决痛点了。

↳ 💬 关于「复制网页为 Markdown 链接:写作必备」的热议:

moon夕染秋芒(+0) 已有现成的功能更加丰富的扩展存在 https://chromewebstore.google.com/detail/copy-url-to-clipboard/miancenhdlkbmjmhlginhaaepbdnlllc https://github.com/asamuzaK/url2clipboard

↳ 💬 关于「PageVS:比自带功能更好用的拆分视图」的热议:

Serene_(+0) 感觉问题是,我屏幕不够大😟😟😟

↳ 💬 关于「PeekLink:用预览远离「标签页地狱」」的热议:

ZLNAEEZD(+0) 本来以为这一期插件分享一个感兴趣的都没有了,没想到碗底一块肉,PeekLink 很喜欢。

来自文章 《如何不用空格打字——顶功类输入法简介》

Doit(+8) 如果不是喜欢折腾……真的不建议折腾输入法……除非永远不会用别人电脑,永远不会有 Win-Mac-iOS 等平台的切换。要不然,影响的不仅仅为追求各平台一致的输入体验,而造成的精力时间耗费,还有一旦发生意外后,输入卡手导致的思路卡顿、输出混乱等一系列效率负优化的灾难场景。

--前星空键道双拼用户有过一次掉链子后怒转全拼的肺腑之言。

Glen(+2) 总觉得,任何需要会写字才能用的中文输入法生命力都不会很强。 因为大脑思考过程是有声音的,通过音频把文字输入出来是最自然的。 对于只能手写不足 1000 字的人来说, 拼音之外的输入法都太难了。

为了打个字,还得先学会怎么写。

我用的是双拼,能够让打字的速度赶得上思考的速度。并且思考时候,不需要看键盘,不需要看屏幕,闭着眼睛也能正常打字。

比如抬头盯着窗外的绿色大叔,然后在键盘上把所思所想打出来。

来自文章 《用「考试」和「代价」,重新审视我的 2026 年度计划》

知行合之一也(+8) 作者只是用大多数人都熟悉的“考试”进行例举,如果有对“考试”敏感的人,可以代换为“挑战”、“量化目标”等更积极的词语,效果也是一样的。

Kun(+1) 内容很棒,同时挑一个小刺,原文是「如果你业余跑步多年,不时游泳,目标是在 2026 年首次完成铁人三项比赛,这就无可厚非。」

这里的「无可厚非」使用有点问题,「无可厚非」的意思是「不能太过分的批评」。

从上下文来看,此处用「无可指摘」更合适,因为「没有任何地方可以被批评」。

Enc3lMag1k(+1) 非常认可作者关于计划和自我评估的方法论,但我完全不认可作者通过考试量化知识习得与能力掌握的观点。

我不知道作者是否没有经历过国内义务教育体系的摧残(没错,我可以很直接的把义务教育定义为摧残)从大的氛围上学习只是为了考试的分数到中考高考可以决定一个人今后一生可获取的知识质量,我都不认为对于大多数在国内生活与工作的人而言考试是什么可以常态化的考核指标。

换言之,如果一个人能平静的面对生活中潮水一般的考试,那他做什么都能成功。但我觉得能做到这一点的人凤毛麟角,更进一步,也不应该用这种方法去尝试规训在心理和自驱力上没那么健全的大多数人。

除了考试以外,有太多的辅助性指标可以达到相似的效果了,比如多邻国的绿鸟或者 Apple Watch 上的圆环,对用户有亲和力的指标才能真正的让用户没有心理负担的去追求其背后的最终目标,而不是一次又一次的考试和分数。

回到考试本身,从我考雅思和四六级的个人经历来看,它并不能很好的反映一个人对英语的掌握水平。仅从我个人而言,我就不认为发音和俚语/口语化表达是能通过口语分数界定的。

我认为这种普遍的对量化指标和考试分数的 PTSD 最终仍然和国内外的教育体系在程序性上的差异有直接关系。国内的教育评价没有一个连贯的,带加权的广泛的考量跨度,而只是用一个分数残忍的把所有人划分三六九等,确实公平,但为了公平实在牺牲了太多。可能我有些偏激,但是我实在无法平静的面对这样的方法论。

最后我想说,很多人都过得太累了,量化总是能给人带来太多无形的精神压力,或许有的时候就是一个 instinct 引发的事业或者习惯反而能获得出人意料的效果。

毕竟,我不觉得我为了看风景随便走走减下来的 35 斤就比 tight schedule 低人一等。

来自文章 《神话与危机并燃,规则与本心角力:一个玩家兼创作者眼中的磁轴众生相》

Mingxu(+4) 很久没关注外设了,目前的办公组合是宁芝静电容配罗技 MX 2S,游戏则是白轴机械加罗技 G304。最近刷到一些客制化壳子和键帽,颜值确实高,打算等手头的键帽打油了就换一套。

元旦去网鱼包间体验了罗技鼠标和达尔优磁轴,磁轴的手感相当惊艳。总的来说,手感对普通用户的影响最为直接。像我用薄膜打游戏会明显感觉“不对劲”,各种段落轴也用不惯,唯独对类红轴的线性手感情有独钟,而磁轴那种丝滑的线性反馈正好戳中我的痛点。

来自文章 《当世界尽头成为热搜:一份南极旅游指南》

皮熊爱睡觉(+5) “这样你的航旅纵横飞行线路图上就有了非常稀有的南极洲打卡记录”——读到这里大笑,作者太理解受众的需求了哈哈哈哈哈。

来自文章 《社区速递 125 | 柯达迷你钥匙扣相机开箱,不到十元的宜家电池值得囤吗》

Konata9(+2) 柯达相机我也买了,很好玩的!保护壳很重要,不然背面的屏幕很容易就有划痕了。(我也买了同款保护壳

来自文章 《Matrix Talk | 2025 年我们都薅到了哪些「数字羊毛」》

雪原狂狼张学友(+1) 关于移动羊毛,补充几个吧:

1:移动 App 首页“热门活动”里面有一个叫做“无敌爽翻”的活动,完成对应的流量使用任务即可再领取相应流量,比方说任务是本月使用 150GB,完成后还能再领取 150GB 全国流量。(通过该活动页面每个月免费领取的 200GB 移动云盘专属流量下载大文件快速完成任务,即可将专属流量换成全国流量)目前江西移动是可以的。

2:如果是 5G 智享套餐的话,在“我的权益”里面同样可以每月领取一次视频会员。

3:星动日活动可以等每月 26-28 号“星动嘉年华”再领取,同样可以选择视频会员,加上 5G 套餐和网龄礼,一个月最多可以薅三个月视频会员的羊毛。当然,嘉年华还有其他的比方说星巴克、酷迪咖啡等,也可以选择。

4:移动豪华会员办理是 19.9 元每月,办理后每月可以领取相关消费券,如加油、电费等,我每月领取一次云闪付满 20.01 减 20 的电费券(网上国网),此外,生活会员还附带 3GB 的通用流量,5GB 的自选视频类 App 专属流量以及一张充值 100 元得 110 元得话费券。

5:移动宽带可以通过“个人网龄提速”活动每月加钱的方式提速到 1000M,在网 10 年以内是 5 元每月,10-20 年是 1 元每月,20 年以上是 0.01 元每月。

以上江西移动实测都可以,其他省份可能有差别。

来自文章 《给旧 iPad 一个「家」:打造高颜值的天气时钟》

试验品_626(+5) 我有个闲置的电纸书,也写了一个简单的时钟页面,需要的可以试试。网址:https://clock-for-ink.netlify.app/index-2.html

📒社区摘要

🆕作者的新玩意

为了让作者的投稿尽快与广大读者见面,我们调整了《新玩意》栏目中作者投稿部分的呈现方式和周期,作者投稿的「新玩意」后续会迁移至本栏目。投稿渠道与奖励方式仍与以往完全一致,详情参见文末。我们相信新鲜火热出炉的分享更能赢得大家的喜爱,也欢迎广大读者朋友们踊跃投稿。

@风马牛:桌面好物 —— HM Hub 拓展坞 & GWANG 磁吸桌垫

突然发现好久没更新了,自从换了个工作开始重新投入到创业中,加上家里老大步入小学需要逐渐辅导学习,自己的时间是越来越少。刚好趁着元旦放假,把这一年攒的桌面新玩意,一起发一发。


名称
入手渠道参考价格
HM Hub Pro 拓展坞海鲜市场100 元
大疆图传线(15cm + 30cm)JD16.32 元
GWANG 磁吸桌垫海鲜市场108.55 元
磁吸配重块 * 6PDD91.59 元

先从HM Hub Pro 拓展坞聊起,用了 6 年多的 Apple Magic Trackpad 2,现在续航是越来越短了,几乎两三天就要充一次电。于是想着能不能找到有两个 Lightning 充电头的充电线,把键盘和触摸板一直充着电用好了,彻底解决一下续航焦虑。

结果找了好久,没找到一个比较简洁美观的方案,我甚至考虑起有没有什么类似于 Stream Deck 的拓展坞。结果淘宝是深得我心啊,直接在首页上推荐了简洁小巧的 HM Hub 拓展坞,简单看了下,直接下单!

这个拓展坞用料很扎实,使用铝合金外壳,手感很好,主要面向高性能的竞技键盘和鼠标,对于我这种用法其实有点浪费。

让我比较喜欢的是,它有一块屏幕,默认情况下显示电压、电流和功耗等信息,也可以自己设置为电子相册或者播放 GIF 动画,这就有很高的可玩性了。

老环节,还是分别介绍一下优缺点,方便大家参考选购。

优点

  • 带独立供电,支持 sRGB,对于游戏键盘和光污染玩家来说,有更多的玩法解锁;
  • 有 3 个输出接口,2 个 Type-C,一个 USB,对于接外设来说应该足够用了;
  • 浏览器直接打开页面就可以进行连接以及设置,非常方便;

缺点

  • 屏幕是凹下去的(低于外壳),边角容易积灰不好清理;
  • 跟桌面是水平放置的,要是有一定的角度,或者提供可以更换角度的外壳,应该会更好一些,这样可以更好的看到屏幕的内容;
  • 一定要注意区分版本,不同的版本,能够播放的图片数量不一样,例如 38 帧的只能放 38 张图或者一个 38 帧的 GIF 动画,这个信息在官方没有详细介绍,海鲜市场有些卖家也没有说明,所以要注意区分;

GWANG 磁吸桌垫

平时一直有个烦恼:耳机线总是会时不时的荡到键盘上,让正常的打字搬砖异常难受,即使换了个弯头的耳机线,也不能很好的解决问题。

刚好在看 HM Hub 的时候,发现大家会用磁吸配重块来固定桌面上的充电线,突然灵机一动,淘宝搜了一下磁吸桌垫,于是找到了 GWANG 磁吸桌垫。

GWANG 磁吸桌垫其实并不是带磁铁,而是桌垫中夹着一张铁板,这样可以让带磁铁的配件吸附在上面。所以顺便买了几个磁吸配重块,把桌面上的线材固定了一下,彻底解决了烦恼。

当然,磁吸配重块上,其实可以自己定制化的贴一些贴纸做装饰,可玩性也很高。另外,现在一些桌面充电站(例如酷态科 15 号超级充电站)或者其他小工具,都可以通过在底座上加装一些磁铁,来增加稳定性。

以下是我觉得 GWANG 磁吸桌垫的一些选择建议。

优点

  • 高级感,并且皮质易于打理,脏了用湿巾纸擦一下就好(长期用估计要定期做一下皮质保养?);
  • 把需要固定的线材、工具等,方便的固定在桌面上,桌面更加干净有序;
  • 胳膊和桌面接触更加舒适,尤其是夏天容易出汗的时候;

缺点

  • 灰尘多的环境,千万不要选择黑色,不然一点点灰尘都会被放大很多倍,爱干净的人会觉得很难受;
  • 由于中间是一层钢板,所以不能弯折,携带或者迁移会很麻烦,尤其是尺寸较大的版本;

桌面上其他物件,都是用了很长时间的老物了,随着这两个新玩意的加入,一方面确实解决了平时的痛点问题,另一方面也给平时的生活增加了一定的乐趣。价格也还算合适,强烈推荐给大家!

@东眠的熊:科沃斯窗宝 mini

  • 购入价格:593(含国补及双十一消费券)
  • 购入渠道:科沃斯天猫旗舰店

如果说 2025 年有什么电子产品给我带来了切实的幸福感,科沃斯窗宝 mini 这款擦窗机器人无疑会名列其中。2 年前我搬进现在的住所后,就一直被阳台玻璃窗的清洁问题困扰,其中既有客观因素,也有自己的拖延使然,而这台科沃斯窗宝 mini,切实从安全性和易用性方面解决了我的大部分问题。

身在高层临近马路,外侧窗户玻璃总是有一层厚厚的灰,晴天时更是异常明显。由于阳台选择了比较厚的玻璃,一般的双面磁吸擦窗工具很难吸牢固,我会请专人来擦。但除了较高的费用外,擦窗师傅带来的风险让我很后怕。

有的擦窗师傅带了安全绳,但觉得我家阳台空间宽裕,不愿意系,直接探出半个身子骑在窗框上向外侧玻璃喷水,在我的坚持下才终于愿意把安全绳系上;有的擦窗师傅干脆连安全绳没有,在窗边搭个架子就站在窗框上清洁,看得我胆战心惊,全程站在旁边扶着,生怕出现意外。

即使我选择的已经是看上去正规的家政平台,也有时不时出现这样的师傅,十分心累。或许安全绳的麻烦程度和成本对这些师傅来说略高,但从我的角度来说,不系安全绳给他们自己和业主都增加了巨大的风险,实在难以接受。

既然基础工具不好使,人工又存在风险,我就把目光投向了擦窗机器人。

在我的印象中,科沃斯应该是比较早做擦窗机器人这一品类的。起初擦窗机器人的价格一直在 3000 元档位,作为一个使用频率远低于扫地机器人的产品,性价比着实有点低,因此我一直没有动购买的念头,只是考虑过是否租赁。

今年,看到这种 mini 型的擦窗机器人产品,价格仅需要之前的四五分之一,除了水箱小一点擦布小一些外,似乎也没特别的大的差异。甚至因为更小更轻,感觉跌落风险都要更小一些。

下单前,照例看了一下这款产品在不同平台的差评,主要集中问题有两点:

  • 擦窗机器人吸附力很强,如果窗户灰尘中含有沙子,会在窗户上留下划痕
  • 擦窗机器人擦边缘时边角比较锐利,容易割坏密封胶条,影响双侧玻璃的密封性

这两点风险不无道理,但考虑我到所在江南地区风沙不大、窗玻璃边缘处的胶条看着也挺厚实,还是决定买来一试。

这台窗宝 mini 的包装很小,包装中含有机器本体、电源线、安全绳、2 块擦窗布和一瓶擦窗液。根据说明书上的介绍,这样的包装方便收纳,也便于亲友间借用,不知道是不是产品经理看到用户对外租赁后产生的灵感。

 

擦窗机器人的结构不算复杂,从内侧看,机器中间是一个风机,启动时依靠风压将机器吸附在玻璃上;两条履带控制机器前进后退,四角是滚珠式的转轮,需要转向时借助履带的速度差实现机身的旋转;擦布则是以类似魔术贴的形式固定在机身下方一圈的位置;机身背部的孔位可以加注清洁液,水箱容量 60ml。

使用前需要把电源线和机身接好拧紧,再接通电源,同时把安全绳挂好。电源线的设计看上去就有防跌落的效果,再加上一道安全绳,机身跌落的风险应该是很低的。

一切准备就绪后,握住机器背部的把手,伸到窗外,用大拇指按住开机键,跟着语音提示把机器人放在窗户上,就可以看它清洁了。科沃斯的 App 上也有不同的清洁模式以及手动遥控模式可选,后者对于这台机器人来说相当重要。

优点

  • 窗宝 mini 的擦窗效果其实比我预料中要好很多,尽管水箱很小,但它采用的是「湿擦布」+「雾化清洁液」的方式进行擦窗,在擦干净玻璃的同时,没有留下什么明显的水渍。
擦完确实通透且几乎没有水痕(有人使用非原装清洁液会留下明显水痕)
  • 此外,由于其方形的设计,能够做到真正的贴边清洁,几乎完全擦到了窗户边缘,没有留下明显的灰尘死角。
左侧为擦完的窗户,右侧未擦
  • 效率方面,如果采用快速模式的话,大概十多分钟就能擦好一面 5 平米左右的玻璃,也没有出现打滑、掉落之类的需要人为处理的情况,使用过程也算省心。
  • 耗材方面也不算贵,购机自带两块擦布,正反面均可使用,清洗并不费力,可以反复使用;清洁液赠送了 230ml,补充装 89 元 1L,但 60ml 的清洁液就足够擦 10 平米左右的阳台玻璃了,算下来单次差不多 5 元左右。

缺点

窗宝 mini 的缺点也很明显,首先是智能化。虽然产品类型是「擦窗机器人」,但其智能程度和现在的扫地机器人完全不能相提并论。这台窗宝 mini 似乎没有什么测量距离的传感器,在规划路线时需要撞在窗框边缘好一会,才会顶着窗户边缘缓缓减速并旋转,这恐怕也是一些用户控诉它划破窗户胶条的原因。

在角落旋转要花费较长时间

且由于它只有两条履带,在旋转时需要的空间较大,也就更容易卡住,在擦较小面积的窗户时常常需要我采用遥控模式,一点点手动调整。

其次,受限于机器体积,这台窗宝的擦布面积十分有限,对于我家近一年没有擦拭的窗户来说,要连续换洗三四块擦布才能把整扇窗户擦干净。(后续的计划是每个月至少拿出窗宝做一次擦窗清洁,避免积累太多灰尘)

此外,虽然雾化喷淋清洁液的方式在擦外侧窗时效果不错,但在擦内侧窗户时,会有很多喷雾逸散到空气中,有股奇怪的气味。说明书中也建议此时人不要站在附近,避免吸入雾化的清洁液,对健康造成负面影响,但实测下来,即使清洁结束,依然有少许气味有些附着在家具上,要通风一阵才能缓解。

不过,如果以人工擦窗进行对比的话,这台窗宝差不多使用三四次即可回本,这些缺点也可以接受了。最主要的风险还是在于产生划痕和破坏密封条的可能性,尽管首次使用没有遇到这样的情况,但随着后续的使用频率增加,这样的风险始终存在,还是让人捏一把汗。


如果你也想分享「新玩意」🔉:

  • 获取 Matrix 社区写作权限并签署 Matrix 共创计划
  • 在少数派独家发布一篇文章,在标题中标注「新玩意」前缀;
  • 用至少 800 字介绍产品,并配上 2-3 张产品的实拍图片;
  • 在网站个人信息中补充支付宝账号。

成功入选本栏目还可以得到 108 元的「剁手红包」🧧。如果你有兴趣参与,就赶紧来稿吧!

> 下载少数派 客户端、关注 少数派公众号,了解更多的新玩意 🆒

> 特惠、好用的硬件产品,尽在 少数派 sspai 官方店铺🛒

    除了首页时间流和侧栏的精选展位,少数派 Matrix 社区还有很多优秀内容因条件所限无法得到有效曝光,因此我们决定重启 Matrix 周报,并在此基础上添加更多社区内容、作者投稿「新玩意」呈现给大家。


    💬一派热议

    在上期第 253 期一派讨论《聊聊你用的语音输入工具?》中,共有 352 名派友热情参与,十分感谢!

    微信和系统输入法的占比:霸占入口真是强势。

    小胡小胡 0009(+21) 我的观察,拥有独立工作空间的人会更加推崇语音输入,比如独立开发者,可以没有顾忌地说话。

    比起语音输入的便捷性,我更介意被他人听到,并且长文本的语音输入能力,需要锻炼才能获得,并没有那么简单。

    Karrdiyas(+10) 微信聊天输入框右边那个麦克风图标就挺好用的,一键语音转文字,识别准、速度快,主要 iOS 设备上使用还不用跳转,体验很流畅,已经是日常高频使用的功能了。

    GabrielleS(+8) 不得不推荐讯飞拼多多买的 50 块钱的语音鼠标,搭配 Windows 的客户端,识别准确成功率可以覆盖 90% 以上,而且还可以自己加标点符号,写文章、battle、理论起来效率更高了。遇到很气的时候可以拿着语音鼠标一顿输出,转成文字之后还可以再润色,删掉不理智的话,有助于疏通情绪、缓和同事关系。50 块钱拍烂了也不心疼,已经成功安利好多身边同事了。

    小杨爱捣鼓(+8) 苹果自带的语音输入准确率太低,App 的又得跳转,硬伤。

    少数派 11695987(+6) VoiceSnap 语闪,刚出的开源离线语音输入,非常不错。

    danghb(+6) 电脑上用的「闪电说」,本地端模型,也可以使用 API 进行 AI 纠正和调整。

    zixr365(+6) 一直不太习惯用语音输入。第一我是个 i 人,在外面说话还是有点放不开,虽然可能并没有人注意。第二是输入总会有个思考过程,文字输入慢,在打字过程中思路就基本理清了,语音输入快,常常输入出错需要删除后重新输入,没有一个完整的输入过程,语音输入的便捷性好像就变低了。此外就是输入不是百分百准确,遇到错别字,还需要光标定位后修改,修改过程比键盘输入更麻烦。

    Eric_du(+4) 我们自己做了一款 Mac 端的,叫「秒言 AI 语音输入法」,识别速度快,精度高,超级好用,有需要的真的可以了解试用下。

    不隔山(+4) 最近用上了「说点啥」(原名「言犀」,https://github.com/BryceWG/BiBi-Keyboard ),本地模型 + 自动录音,一点即说,非常舒适!☺️☺️☺️

    晓 5687(+3) 理论上来说。使用语音输入法,最需要的是「语音输入环境」,比如独立办公室。

    面具熊(+3) 每次使用听写功能时,一旦文本中出现了错字,手机上就要移动光标去修改,非常烦。所以不爱用听写。

    张立行(+2) 本地隐私上:极致准确用 Whisper Large 3,平衡速度和性能一般都是使用 Sherpa ONNX 量化,具体模型可以是 Paraformer-zh(中英,体感上 SOTA),SenseVoice Small(中英粤日韩)。但最好是加一个 AI 校对,可以结合屏幕 OCR 来做。

    消费级设备上追求速度成本平衡的情况下,转录准确率到达一定阶段就可以了,剩下的提升性价比不高。不如引入 LLM 校对处理最合适。

    云端转录:豆包,也就是火山引擎 API 中英体感很准确。LazyTyper 适合。

    少数兀(+2) Spokenly 加 Qwen ASR 加口语化提示词。终结一切。

    raulpepsi(+2) 原先是不用语音输入的。因为口语表达跟书面表达总是会有些差别。用口语表达出来的文字总是有点奇怪。一个是断句,一个是标点,一个是语气词,一个是中英文的混合内容,所以一直很少用。但是豆包语音在这方面表现很好。所以最近就豆包的语音输入就用的比较多了。前几天微信也对语音输入做了升级,试下来感觉还是豆包好一些。所以现在输入法就留了 2 个,微信和豆包。豆包只用语音输入。切换就用小地球的键盘切换。

    努力好脾气(+1) 没人提 Typeless 啊,那我来提一下,极致好用,除了要付费以及在 iOS 端不可避免跳转之外。

    東雲閑_Alter(+1) Product Hunt 上看到一个叫做 Typeless 的软件,是我见过目前来说最好用的 AI 语音输入工具了。唯一的缺点是贵,年付都要 12 刀一个月。打算 1 个月试用完了直接溜。

    碱水结(+1) 预装什么输入法用什么,感觉都差不太多……日常听写现在都比较准了,主要是在外面简单回消息。

    单纯大量录音需要 ASR 有很好的便宜新模型,比如 GLM-ASR,Doubao Seed ASR 等等,用 Buzz 之类的客户端直接接入 OpenAI 兼容 API,对于会议主要还是现场设备收音质量和结合多角色声纹识别,真用得上还是一站式收费应用得了,就是贵了点。

    xiang_meng(+0) 我就说大模型使得语音输入变得舒服常用,语音输入会不会使得键盘越来越少用?

    Jason_4393(+0) 这两年学习了五笔,虎码输入法,对什么语音输入法的话不是很中意。

    twrp(+0) 豆包输入法,自动 AI 校准,还有记忆。

    Futii(+0) 百度输入法的离线语音,识别准确率还不错。我禁止了百度输入法的联网,发现它真的是离线实现的。

    📢:下一期的一派讨论是数码圈日经话题《你用超广角镜头拍出过什么好片?》,欢迎来聊。

    🔥一周热评

    来自文章 《人生的“拥挤季” | 2025年度回顾》

    Badjoe(+0) 艾玛总算回来发文了,上次年度总结貌似还是 24 年,26 年一起加油💪

    Jin丶X(+0) 除了拿 30% 的钱投入到投资账户外,其余的观点都赞同。

    来自文章 《它长得像古董,跑起来像闪电:海贝思磁盘SSD硬盘盒是种什么体验?》

    ivxzhao(+1) 确实好看,这情怀真不错,我家里还特意收藏了一整套软盘+软驱在。

    小红书也在给我猛推这个,不过想来这东西对我没啥场景,先看看吧。

    来自文章 《修复一台 ThinkPad E40》

    牛肉面(+0) 这个电脑是我当年给老婆买的第一台,那时还不是我老婆。

    起名什么的最烦人了(+0) 看不懂,要是能用浏览器看 B 站 4K 不卡的话,100 收。

    lhb5883(+0) 感觉是老机器和新系统不匹配,可能需要装一个 XP 之类的系统,因为我刚工作的时候用的是 IBM 的 R51,预装的是 XP 系统,不知道到你这个 E40 是什么时候的机子,不过看起来已经是联想时代的产物了说不定是出厂就是 8.1+ 的,装 Win7 可能没有驱动。

    查了一下,好像预装的是 Win7 32bit 系统,估计是用 64bit 有硬件不支持,目前大部分的 PE 和安装盘应该都是 64bit 的了。

    来自文章 《派早报:国务院开展外卖市场竞争调查评估》

    ↳ 💬 关于「看看就行的小道消息」的热议:

    FC8E(+0) UOS(指 Uniform(制服) OS)

    来自文章 《CES 2026 盘点:你可能错过的新奇花活》

    Enjisi(+2) 看着看着,有种愚人节特辑的感觉。

    ↳ 💬 关于「联想这屏幕,把「带鱼屏」塞进笔记本」的热议:

    sgricky(+0) 广告词都起好了:“卷到极致!”

    PB1010(+0) 如果是二等座,估计空间不够大,两人并排坐,显示器搞不好要打架。

    louissenny(+0) more like 炒股模式。

    ↳ 💬 关于「我的 house 不算大,但清扫工作立体化」的热议:

    八分(+0) 感觉螺旋桨的吹灰能力,比原来的吸灰能力要强的多。

    ↳ 💬 关于「杀鸡不用牛刀,但我做饭需要超声波」的热议:

    写小黑文的Alex(+0) EVA 直呼内行。

    一介浪子与草生(+0) 假设这个刀真好用,开膛手杰克和汉尼拔狂喜。

    ↳ 💬 关于「CES 终极异类:Light Saver 反 AI 灯」的热议:

    louissenny(+0) 有点像底特律变人里面的康纳酱。

    少数派28335600(+0) 有点感觉像打无人机的无人机。

    ↳ 💬 关于「从价格上来说,这画框也是艺术的一部分」的热议:

    Double95(+0) 还包含已经逝去的亲人……感觉温馨中透露着一丝诡异。

    ↳ 💬 关于「洗个澡的功夫,我就发财了」的热议:

    少数派28711838(+0) 想法不错啊,就像我小时候想,为什么不能一边骑自行车一边发电呢?人家却把想法变成了现实。

    ↳ 💬 关于「情绪陪伴,可爱或许比拟真更重要」的热议:

    异星绿洲(+0) 家里不乱的可以买回来添乱。

    BLUME(+0) 旁边两个仿生人搞得我恐怖谷效应都要犯了。

    来自文章 《丢掉遥控器,寻找生命感:这是我的 Vbot「大头」机器狗使用体验》

    dead_lee(+3) 能做成导盲犬就太好了。

    少数派太少数了(+1) 很想买一个,但还没想到明确的场景。里面提到帮忙搬运摄影器材,对户外比较有用,但我出门很少。普通搬运极限 12kg,感觉又不够。

    wwwwwwv(+0) 我家是自建房,倒是有搬运货物上楼的需求。

    少数派37606071(+0) 如果把充电器内置,直接用路边的电瓶车充电插头充电就好了。

    来自文章 《与胃里的「老房客」正确相处:了解幽门螺杆菌》

    Alei(+1) 总结:如有怀疑的症状,直接去三甲医院检查,如检查有问题,过来人经验,一定要顺带生活过的家人一起检查。

    治疗遵医嘱就行,有社保的情况下,大部分都能负担,没必要自行治疗。

    来自文章 《消亡的动态磁贴》

    A1exMinatoooo(+22) 领先一步是先驱,领先两步是先烈。

    少数派67077666(+5) 我倒是觉得动态磁贴挺好的,一方面没那么多花花绿绿更简介,另一方面有一些轻量级消息确实我个人喜欢直接主页就能获取到。

    我觉得 UWP 的消亡更多还是微软战略上的问题,WP7.x 不能升级 WP8,WP8 又不能到 WP10,手机虽然说已经不是诺基亚那种买一个用 10 年的时代,但也不是用个两三年就换的产品,谁家钱也不是大风刮来的,买来用个一两年就被抛弃没未来谁受的了。

    凝儿(+2) 恰恰相反,我用了十几年的 Windows XP 和 Windows 7,但入手了第一台预装 Windows 8.1 的笔记本电脑后,就非常喜欢,也由此养成了用磁贴的习惯。后来更新设备预装 Windows 10,还屡次尝试换回 8.1,最后因为缺少驱动而放弃。至今 8.1 仍是我最爱的系统,相比之下 10 真的很卡,还砍掉了我一直在用的自定义桌面壁纸轮换功能。

    来自文章 《如何花式压榨 Gemini:一位律师选手的 2025 年 AI 使用报告》

    alex11037(+18) Q:Gemini,请告诉我如何得到案源,底薪太低了我受不了了

    A:不知道,但可以考虑兼职律所的司机🙈

    来自文章 《新玩意 232|少数派的编辑们最近买了啥?》

    一般很笨(+9) 鼻炎、鼻腔干燥,也可以试试成分最简单、使用最方便的生理盐水喷雾,我以前会觉得没用,最近使用后感觉还挺好的(一天 3 到 4 次),不用洗鼻器洗鼻也完全 OK~

    McTang(+3) 我选择全家远行时候租一辆六座或者七座,一年也没几次这种机会。

    来自文章 《浏览器扩展合集:派友近期推荐的 7 款浏览器扩展》

    Hugogo(+6) 这个 Megi:将线性对话生长为思考的知识树真的是巧思,我现在越来越依赖 Gemini 了,可是它没有提供类似 GPT 的项目文件夹来统一项目记忆,这就导致我只能在一个超级超级长的对话里继续,导致在一定程度上对话上文已经“仅 AI 可见”了。

    任大喵(+2) 安利一个,等等贴,如果你在网页端需要重复复制粘贴内容的话,这个插件真的非常好用。

    Lynn(+1) Handy Prompt,自己写了一个提示词管理工具。

    ↳ 💬 关于「AutoVerify:免费的自动化图形验证码工具」的热议:

    潮鳴(+0) 其实这种字母验证码也算古早的东西了,但我每次成功率都挺低的,不知道哪出问题,这下算是解决痛点了。

    ↳ 💬 关于「复制网页为 Markdown 链接:写作必备」的热议:

    moon夕染秋芒(+0) 已有现成的功能更加丰富的扩展存在 https://chromewebstore.google.com/detail/copy-url-to-clipboard/miancenhdlkbmjmhlginhaaepbdnlllc https://github.com/asamuzaK/url2clipboard

    ↳ 💬 关于「PageVS:比自带功能更好用的拆分视图」的热议:

    Serene_(+0) 感觉问题是,我屏幕不够大😟😟😟

    ↳ 💬 关于「PeekLink:用预览远离「标签页地狱」」的热议:

    ZLNAEEZD(+0) 本来以为这一期插件分享一个感兴趣的都没有了,没想到碗底一块肉,PeekLink 很喜欢。

    来自文章 《如何不用空格打字——顶功类输入法简介》

    Doit(+8) 如果不是喜欢折腾……真的不建议折腾输入法……除非永远不会用别人电脑,永远不会有 Win-Mac-iOS 等平台的切换。要不然,影响的不仅仅为追求各平台一致的输入体验,而造成的精力时间耗费,还有一旦发生意外后,输入卡手导致的思路卡顿、输出混乱等一系列效率负优化的灾难场景。

    --前星空键道双拼用户有过一次掉链子后怒转全拼的肺腑之言。

    Glen(+2) 总觉得,任何需要会写字才能用的中文输入法生命力都不会很强。 因为大脑思考过程是有声音的,通过音频把文字输入出来是最自然的。 对于只能手写不足 1000 字的人来说, 拼音之外的输入法都太难了。

    为了打个字,还得先学会怎么写。

    我用的是双拼,能够让打字的速度赶得上思考的速度。并且思考时候,不需要看键盘,不需要看屏幕,闭着眼睛也能正常打字。

    比如抬头盯着窗外的绿色大叔,然后在键盘上把所思所想打出来。

    来自文章 《用「考试」和「代价」,重新审视我的 2026 年度计划》

    知行合之一也(+8) 作者只是用大多数人都熟悉的“考试”进行例举,如果有对“考试”敏感的人,可以代换为“挑战”、“量化目标”等更积极的词语,效果也是一样的。

    Kun(+1) 内容很棒,同时挑一个小刺,原文是「如果你业余跑步多年,不时游泳,目标是在 2026 年首次完成铁人三项比赛,这就无可厚非。」

    这里的「无可厚非」使用有点问题,「无可厚非」的意思是「不能太过分的批评」。

    从上下文来看,此处用「无可指摘」更合适,因为「没有任何地方可以被批评」。

    Enc3lMag1k(+1) 非常认可作者关于计划和自我评估的方法论,但我完全不认可作者通过考试量化知识习得与能力掌握的观点。

    我不知道作者是否没有经历过国内义务教育体系的摧残(没错,我可以很直接的把义务教育定义为摧残)从大的氛围上学习只是为了考试的分数到中考高考可以决定一个人今后一生可获取的知识质量,我都不认为对于大多数在国内生活与工作的人而言考试是什么可以常态化的考核指标。

    换言之,如果一个人能平静的面对生活中潮水一般的考试,那他做什么都能成功。但我觉得能做到这一点的人凤毛麟角,更进一步,也不应该用这种方法去尝试规训在心理和自驱力上没那么健全的大多数人。

    除了考试以外,有太多的辅助性指标可以达到相似的效果了,比如多邻国的绿鸟或者 Apple Watch 上的圆环,对用户有亲和力的指标才能真正的让用户没有心理负担的去追求其背后的最终目标,而不是一次又一次的考试和分数。

    回到考试本身,从我考雅思和四六级的个人经历来看,它并不能很好的反映一个人对英语的掌握水平。仅从我个人而言,我就不认为发音和俚语/口语化表达是能通过口语分数界定的。

    我认为这种普遍的对量化指标和考试分数的 PTSD 最终仍然和国内外的教育体系在程序性上的差异有直接关系。国内的教育评价没有一个连贯的,带加权的广泛的考量跨度,而只是用一个分数残忍的把所有人划分三六九等,确实公平,但为了公平实在牺牲了太多。可能我有些偏激,但是我实在无法平静的面对这样的方法论。

    最后我想说,很多人都过得太累了,量化总是能给人带来太多无形的精神压力,或许有的时候就是一个 instinct 引发的事业或者习惯反而能获得出人意料的效果。

    毕竟,我不觉得我为了看风景随便走走减下来的 35 斤就比 tight schedule 低人一等。

    来自文章 《神话与危机并燃,规则与本心角力:一个玩家兼创作者眼中的磁轴众生相》

    Mingxu(+4) 很久没关注外设了,目前的办公组合是宁芝静电容配罗技 MX 2S,游戏则是白轴机械加罗技 G304。最近刷到一些客制化壳子和键帽,颜值确实高,打算等手头的键帽打油了就换一套。

    元旦去网鱼包间体验了罗技鼠标和达尔优磁轴,磁轴的手感相当惊艳。总的来说,手感对普通用户的影响最为直接。像我用薄膜打游戏会明显感觉“不对劲”,各种段落轴也用不惯,唯独对类红轴的线性手感情有独钟,而磁轴那种丝滑的线性反馈正好戳中我的痛点。

    来自文章 《当世界尽头成为热搜:一份南极旅游指南》

    皮熊爱睡觉(+5) “这样你的航旅纵横飞行线路图上就有了非常稀有的南极洲打卡记录”——读到这里大笑,作者太理解受众的需求了哈哈哈哈哈。

    来自文章 《社区速递 125 | 柯达迷你钥匙扣相机开箱,不到十元的宜家电池值得囤吗》

    Konata9(+2) 柯达相机我也买了,很好玩的!保护壳很重要,不然背面的屏幕很容易就有划痕了。(我也买了同款保护壳

    来自文章 《Matrix Talk | 2025 年我们都薅到了哪些「数字羊毛」》

    雪原狂狼张学友(+1) 关于移动羊毛,补充几个吧:

    1:移动 App 首页“热门活动”里面有一个叫做“无敌爽翻”的活动,完成对应的流量使用任务即可再领取相应流量,比方说任务是本月使用 150GB,完成后还能再领取 150GB 全国流量。(通过该活动页面每个月免费领取的 200GB 移动云盘专属流量下载大文件快速完成任务,即可将专属流量换成全国流量)目前江西移动是可以的。

    2:如果是 5G 智享套餐的话,在“我的权益”里面同样可以每月领取一次视频会员。

    3:星动日活动可以等每月 26-28 号“星动嘉年华”再领取,同样可以选择视频会员,加上 5G 套餐和网龄礼,一个月最多可以薅三个月视频会员的羊毛。当然,嘉年华还有其他的比方说星巴克、酷迪咖啡等,也可以选择。

    4:移动豪华会员办理是 19.9 元每月,办理后每月可以领取相关消费券,如加油、电费等,我每月领取一次云闪付满 20.01 减 20 的电费券(网上国网),此外,生活会员还附带 3GB 的通用流量,5GB 的自选视频类 App 专属流量以及一张充值 100 元得 110 元得话费券。

    5:移动宽带可以通过“个人网龄提速”活动每月加钱的方式提速到 1000M,在网 10 年以内是 5 元每月,10-20 年是 1 元每月,20 年以上是 0.01 元每月。

    以上江西移动实测都可以,其他省份可能有差别。

    来自文章 《给旧 iPad 一个「家」:打造高颜值的天气时钟》

    试验品_626(+5) 我有个闲置的电纸书,也写了一个简单的时钟页面,需要的可以试试。网址:https://clock-for-ink.netlify.app/index-2.html

    📒社区摘要

    🆕作者的新玩意

    为了让作者的投稿尽快与广大读者见面,我们调整了《新玩意》栏目中作者投稿部分的呈现方式和周期,作者投稿的「新玩意」后续会迁移至本栏目。投稿渠道与奖励方式仍与以往完全一致,详情参见文末。我们相信新鲜火热出炉的分享更能赢得大家的喜爱,也欢迎广大读者朋友们踊跃投稿。

    @风马牛:桌面好物 —— HM Hub 拓展坞 & GWANG 磁吸桌垫

    突然发现好久没更新了,自从换了个工作开始重新投入到创业中,加上家里老大步入小学需要逐渐辅导学习,自己的时间是越来越少。刚好趁着元旦放假,把这一年攒的桌面新玩意,一起发一发。


    名称
    入手渠道参考价格
    HM Hub Pro 拓展坞海鲜市场100 元
    大疆图传线(15cm + 30cm)JD16.32 元
    GWANG 磁吸桌垫海鲜市场108.55 元
    磁吸配重块 * 6PDD91.59 元

    先从HM Hub Pro 拓展坞聊起,用了 6 年多的 Apple Magic Trackpad 2,现在续航是越来越短了,几乎两三天就要充一次电。于是想着能不能找到有两个 Lightning 充电头的充电线,把键盘和触摸板一直充着电用好了,彻底解决一下续航焦虑。

    结果找了好久,没找到一个比较简洁美观的方案,我甚至考虑起有没有什么类似于 Stream Deck 的拓展坞。结果淘宝是深得我心啊,直接在首页上推荐了简洁小巧的 HM Hub 拓展坞,简单看了下,直接下单!

    这个拓展坞用料很扎实,使用铝合金外壳,手感很好,主要面向高性能的竞技键盘和鼠标,对于我这种用法其实有点浪费。

    让我比较喜欢的是,它有一块屏幕,默认情况下显示电压、电流和功耗等信息,也可以自己设置为电子相册或者播放 GIF 动画,这就有很高的可玩性了。

    老环节,还是分别介绍一下优缺点,方便大家参考选购。

    优点

    • 带独立供电,支持 sRGB,对于游戏键盘和光污染玩家来说,有更多的玩法解锁;
    • 有 3 个输出接口,2 个 Type-C,一个 USB,对于接外设来说应该足够用了;
    • 浏览器直接打开页面就可以进行连接以及设置,非常方便;

    缺点

    • 屏幕是凹下去的(低于外壳),边角容易积灰不好清理;
    • 跟桌面是水平放置的,要是有一定的角度,或者提供可以更换角度的外壳,应该会更好一些,这样可以更好的看到屏幕的内容;
    • 一定要注意区分版本,不同的版本,能够播放的图片数量不一样,例如 38 帧的只能放 38 张图或者一个 38 帧的 GIF 动画,这个信息在官方没有详细介绍,海鲜市场有些卖家也没有说明,所以要注意区分;

    GWANG 磁吸桌垫

    平时一直有个烦恼:耳机线总是会时不时的荡到键盘上,让正常的打字搬砖异常难受,即使换了个弯头的耳机线,也不能很好的解决问题。

    刚好在看 HM Hub 的时候,发现大家会用磁吸配重块来固定桌面上的充电线,突然灵机一动,淘宝搜了一下磁吸桌垫,于是找到了 GWANG 磁吸桌垫。

    GWANG 磁吸桌垫其实并不是带磁铁,而是桌垫中夹着一张铁板,这样可以让带磁铁的配件吸附在上面。所以顺便买了几个磁吸配重块,把桌面上的线材固定了一下,彻底解决了烦恼。

    当然,磁吸配重块上,其实可以自己定制化的贴一些贴纸做装饰,可玩性也很高。另外,现在一些桌面充电站(例如酷态科 15 号超级充电站)或者其他小工具,都可以通过在底座上加装一些磁铁,来增加稳定性。

    以下是我觉得 GWANG 磁吸桌垫的一些选择建议。

    优点

    • 高级感,并且皮质易于打理,脏了用湿巾纸擦一下就好(长期用估计要定期做一下皮质保养?);
    • 把需要固定的线材、工具等,方便的固定在桌面上,桌面更加干净有序;
    • 胳膊和桌面接触更加舒适,尤其是夏天容易出汗的时候;

    缺点

    • 灰尘多的环境,千万不要选择黑色,不然一点点灰尘都会被放大很多倍,爱干净的人会觉得很难受;
    • 由于中间是一层钢板,所以不能弯折,携带或者迁移会很麻烦,尤其是尺寸较大的版本;

    桌面上其他物件,都是用了很长时间的老物了,随着这两个新玩意的加入,一方面确实解决了平时的痛点问题,另一方面也给平时的生活增加了一定的乐趣。价格也还算合适,强烈推荐给大家!

    @东眠的熊:科沃斯窗宝 mini

    • 购入价格:593(含国补及双十一消费券)
    • 购入渠道:科沃斯天猫旗舰店

    如果说 2025 年有什么电子产品给我带来了切实的幸福感,科沃斯窗宝 mini 这款擦窗机器人无疑会名列其中。2 年前我搬进现在的住所后,就一直被阳台玻璃窗的清洁问题困扰,其中既有客观因素,也有自己的拖延使然,而这台科沃斯窗宝 mini,切实从安全性和易用性方面解决了我的大部分问题。

    身在高层临近马路,外侧窗户玻璃总是有一层厚厚的灰,晴天时更是异常明显。由于阳台选择了比较厚的玻璃,一般的双面磁吸擦窗工具很难吸牢固,我会请专人来擦。但除了较高的费用外,擦窗师傅带来的风险让我很后怕。

    有的擦窗师傅带了安全绳,但觉得我家阳台空间宽裕,不愿意系,直接探出半个身子骑在窗框上向外侧玻璃喷水,在我的坚持下才终于愿意把安全绳系上;有的擦窗师傅干脆连安全绳没有,在窗边搭个架子就站在窗框上清洁,看得我胆战心惊,全程站在旁边扶着,生怕出现意外。

    即使我选择的已经是看上去正规的家政平台,也有时不时出现这样的师傅,十分心累。或许安全绳的麻烦程度和成本对这些师傅来说略高,但从我的角度来说,不系安全绳给他们自己和业主都增加了巨大的风险,实在难以接受。

    既然基础工具不好使,人工又存在风险,我就把目光投向了擦窗机器人。

    在我的印象中,科沃斯应该是比较早做擦窗机器人这一品类的。起初擦窗机器人的价格一直在 3000 元档位,作为一个使用频率远低于扫地机器人的产品,性价比着实有点低,因此我一直没有动购买的念头,只是考虑过是否租赁。

    今年,看到这种 mini 型的擦窗机器人产品,价格仅需要之前的四五分之一,除了水箱小一点擦布小一些外,似乎也没特别的大的差异。甚至因为更小更轻,感觉跌落风险都要更小一些。

    下单前,照例看了一下这款产品在不同平台的差评,主要集中问题有两点:

    • 擦窗机器人吸附力很强,如果窗户灰尘中含有沙子,会在窗户上留下划痕
    • 擦窗机器人擦边缘时边角比较锐利,容易割坏密封胶条,影响双侧玻璃的密封性

    这两点风险不无道理,但考虑我到所在江南地区风沙不大、窗玻璃边缘处的胶条看着也挺厚实,还是决定买来一试。

    这台窗宝 mini 的包装很小,包装中含有机器本体、电源线、安全绳、2 块擦窗布和一瓶擦窗液。根据说明书上的介绍,这样的包装方便收纳,也便于亲友间借用,不知道是不是产品经理看到用户对外租赁后产生的灵感。

     

    擦窗机器人的结构不算复杂,从内侧看,机器中间是一个风机,启动时依靠风压将机器吸附在玻璃上;两条履带控制机器前进后退,四角是滚珠式的转轮,需要转向时借助履带的速度差实现机身的旋转;擦布则是以类似魔术贴的形式固定在机身下方一圈的位置;机身背部的孔位可以加注清洁液,水箱容量 60ml。

    使用前需要把电源线和机身接好拧紧,再接通电源,同时把安全绳挂好。电源线的设计看上去就有防跌落的效果,再加上一道安全绳,机身跌落的风险应该是很低的。

    一切准备就绪后,握住机器背部的把手,伸到窗外,用大拇指按住开机键,跟着语音提示把机器人放在窗户上,就可以看它清洁了。科沃斯的 App 上也有不同的清洁模式以及手动遥控模式可选,后者对于这台机器人来说相当重要。

    优点

    • 窗宝 mini 的擦窗效果其实比我预料中要好很多,尽管水箱很小,但它采用的是「湿擦布」+「雾化清洁液」的方式进行擦窗,在擦干净玻璃的同时,没有留下什么明显的水渍。
    擦完确实通透且几乎没有水痕(有人使用非原装清洁液会留下明显水痕)
    • 此外,由于其方形的设计,能够做到真正的贴边清洁,几乎完全擦到了窗户边缘,没有留下明显的灰尘死角。
    左侧为擦完的窗户,右侧未擦
    • 效率方面,如果采用快速模式的话,大概十多分钟就能擦好一面 5 平米左右的玻璃,也没有出现打滑、掉落之类的需要人为处理的情况,使用过程也算省心。
    • 耗材方面也不算贵,购机自带两块擦布,正反面均可使用,清洗并不费力,可以反复使用;清洁液赠送了 230ml,补充装 89 元 1L,但 60ml 的清洁液就足够擦 10 平米左右的阳台玻璃了,算下来单次差不多 5 元左右。

    缺点

    窗宝 mini 的缺点也很明显,首先是智能化。虽然产品类型是「擦窗机器人」,但其智能程度和现在的扫地机器人完全不能相提并论。这台窗宝 mini 似乎没有什么测量距离的传感器,在规划路线时需要撞在窗框边缘好一会,才会顶着窗户边缘缓缓减速并旋转,这恐怕也是一些用户控诉它划破窗户胶条的原因。

    在角落旋转要花费较长时间

    且由于它只有两条履带,在旋转时需要的空间较大,也就更容易卡住,在擦较小面积的窗户时常常需要我采用遥控模式,一点点手动调整。

    其次,受限于机器体积,这台窗宝的擦布面积十分有限,对于我家近一年没有擦拭的窗户来说,要连续换洗三四块擦布才能把整扇窗户擦干净。(后续的计划是每个月至少拿出窗宝做一次擦窗清洁,避免积累太多灰尘)

    此外,虽然雾化喷淋清洁液的方式在擦外侧窗时效果不错,但在擦内侧窗户时,会有很多喷雾逸散到空气中,有股奇怪的气味。说明书中也建议此时人不要站在附近,避免吸入雾化的清洁液,对健康造成负面影响,但实测下来,即使清洁结束,依然有少许气味有些附着在家具上,要通风一阵才能缓解。

    不过,如果以人工擦窗进行对比的话,这台窗宝差不多使用三四次即可回本,这些缺点也可以接受了。最主要的风险还是在于产生划痕和破坏密封条的可能性,尽管首次使用没有遇到这样的情况,但随着后续的使用频率增加,这样的风险始终存在,还是让人捏一把汗。


    如果你也想分享「新玩意」🔉:

    • 获取 Matrix 社区写作权限并签署 Matrix 共创计划
    • 在少数派独家发布一篇文章,在标题中标注「新玩意」前缀;
    • 用至少 800 字介绍产品,并配上 2-3 张产品的实拍图片;
    • 在网站个人信息中补充支付宝账号。

    成功入选本栏目还可以得到 108 元的「剁手红包」🧧。如果你有兴趣参与,就赶紧来稿吧!

    > 下载少数派 客户端、关注 少数派公众号,了解更多的新玩意 🆒

    > 特惠、好用的硬件产品,尽在 少数派 sspai 官方店铺🛒