2026年3月

前阵子老家只有一台 32 寸 4K 显示器,想再加 1–2 台凑多屏。家里正好来了一台小米 27 寸 4K 碎屏机(型号 XMMNT27NU ,面板京东方 MV270QUM-N40 ),测下来素质还挺不错(高色域 IPS 、做工好),就想着再搞一台类似的。
于是上咸鱼搜同款面板 MV270QUM-N40 。刷着刷着看到红米 27 寸 4K ( RMMNT27NU ),面板是 MV270QUM-N50 ,外观参数几乎一模一样,问了几个 AI 都说兼容,可以直接互换到小米机身上用。
一开始规规矩矩下单 N40 ,结果过了一会儿脑子一热,想着 N50 是升级版(亮度和背光均匀性)改单买 N50……从此开启“买了退、退了买”的无限循环,哈哈哈。

第一阶段:N50 到手,直接寄
背板螺丝孔位比 N40 少一大截,驱动板和支架根本固定不了。
N50 有两条背光灯条,但小米驱动板只出一条背光线(没一分二适配线),结果插上只能亮一半背光。
更惨的是点亮后只能显示纯红/纯绿/纯蓝画面(兼容性问题)。

跟卖家沟通想换 N40 ,但来回运费大几十,心态崩了。
这时咸鱼刷到一台搭载 N50 面板的碎屏 27 寸 4K (小米/红米同系列),只要 100 块!心想:与其折腾运费,不如直接收碎屏机,面板+外壳齐活,不就等于白嫖一台新显示器?
果断下单。

第二阶段:N40 又翻车,但这次我有备而来
同时又找原老板买了一块 N40 ,这次学乖了,发货前让他拍背板实物照片确认孔位一致,老板拍了,看着一模一样,就确认发货。
结果 N50 碎屏机和新 N40 面板同一天到:

N50 面板+碎屏机超级匹配,接线点亮完美(面板有轻微瑕疵,但日常用完全能接受),满血复活一台!
但新到的 N40……背板和照片不符!螺丝孔位又少了几个,驱动板支架还是固定不了……

这时候脑洞大开:我之前拆的那块坏 N40 金属背板结构完整,不如自己动手把金属背板移植到这个新 N40 模组上?
于是跟老板沟通:要么换货但是全程路费他承担,要么补点钱我自己试换(失败自负)。老板爽快补了点(其实比运费低),我也答应了,主要还是心痒手痒。
动手换背板过程(别搞坏液晶玻璃,防尘是关键)
之前已经把第一块 N40 完全拆解,对内部结构门清。又狂刷 B 站换面板视频,联系到一个专门维修显示器的兄弟,小付费咨询了一些事情,然后就开干了
操作环境准备:

全屋窗帘拉上,用手电筒到处照,找飞尘最少的地方
最终选客厅大桌子,空间足

过程就是细心耐心慢一点,防尘方面想到一个绝妙的办法,最终成功更换完成,并且保证模组的几块板之间几乎没有进灰尘。
对齐孔位、固定螺丝、接所有线
最后通电——完美点亮!无雪花、无灰尘、显示正常。

现在老家显示器阵容:

1 台原装 32 寸 4K
3 台 27 寸 4K (原碎屏复活一台 + DIY 两台)

另外还有 2 台 32 寸 4K (几年前自己 DIY 的)在另一个城市没带回来,不然就 6 台 4K 了……
整个过程一波三折,完美诠释“没事找事瞎折腾”,但也解锁了显示器面板互换 + 背板移植技能,成就感爆棚。

V 友们如果有显示器的维修、换面板、点屏、背板移植等问题,可以来交流。我可以远程指导步骤,或者有需要也可以帮忙修(看位置),其实没啥高科技,主要靠耐心 + 动手能力。

经过这一波折腾,更加坚定了其实我完全有技术能力在老家搞个维修店,电脑,显示器,手机(涉及电路的就难点,还没啥经验,其他换屏,电池,换摄像头的都有丰富的经验了),我竞争力肯定很强,因为这次折腾我发现整个县城没有一家有能力帮我拆面板模组更换背板的。电脑方面的我应该也都能搞定。

最后来一张全家福
quanjiafu.avif

我真的受不了那些没有营养的官方新闻号了,一点屁事都要发视频,写了个油猴脚本来批量拉黑账号解决这个问题。

功能特性

抖音拉黑界面

批量拉黑

  • 关键词搜索用户(支持多关键词批量处理)
  • 自动批量拉黑用户
  • 自动跳过已拉黑用户
  • 实时进度显示和操作日志

高级过滤

  • 仅拉黑认证用户选项
  • 认证类型关键词过滤(抖音)
  • 可调节操作间隔和翻页延迟

黑名单管理( B 站)

  • 一键清空黑名单列表
  • 导出黑名单为 CSV 文件

预设管理

  • 创建和保存自定义拉黑预设
  • 导入/导出预设分享

支持平台

  • ✅ 抖音
  • ✅ 哔哩哔哩

安装

https://greasyfork.org/zh-CN/scripts/569170

https://github.com/Steven-Qiang/block-kit/releases

使用示例

  1. 登录抖音或 B 站
  2. 左上角会出现浮球面板
  3. 输入关键词(如:新闻,日报,资讯
  4. 设置拉黑数量( 0 表示不限制)
  5. 点击「开始拉黑」

特点

  • 所有操作在本地浏览器执行,不收集任何数据
  • 预设数据存储在浏览器本地
  • 可调节操作间隔避免触发风控
  • 支持从小到大测试,确认效果后再大批量操作

项目链接

欢迎反馈和建议!

大家好,我是良许。

在嵌入式开发的道路上,我们经常会和各种硬件电路打交道。

无论是设计一个简单的 LED 闪烁电路,还是复杂的通信接口,数字电路的设计和仿真都是必不可少的技能。

今天,我就来和大家聊聊数字电路设计与仿真的那些事儿,从基础概念到实际应用,希望能帮助大家更好地理解这个领域。

1. 数字电路设计基础

1.1 什么是数字电路

数字电路是处理离散信号的电子电路,与模拟电路不同,它只处理两种状态:高电平(通常用 1 表示)和低电平(通常用 0 表示)。

这种二进制的特性使得数字电路在现代电子系统中占据着核心地位。

我在做 STM32 开发的时候,几乎每天都在和数字电路打交道,比如 GPIO 的高低电平控制、SPI 通信的时序设计等等。

数字电路的基本组成单元包括逻辑门(与门、或门、非门等)、触发器、计数器、寄存器等。

这些基本单元可以组合成更复杂的功能模块,比如加法器、译码器、多路选择器等。

在实际的嵌入式系统中,我们使用的 MCU 内部就集成了大量的数字电路模块,比如定时器、串口控制器、DMA 控制器等,它们都是由这些基本的数字电路单元构建而成的。

1.2 数字电路设计的层次

数字电路设计通常分为几个层次,从底层到高层依次是:晶体管级、门级、寄存器传输级(RTL)、行为级和系统级。

对于我们嵌入式开发者来说,最常接触的是门级和 RTL 级的设计。

门级设计关注的是如何用基本逻辑门实现特定功能,而 RTL 级设计则更关注数据在寄存器之间的传输和处理流程。

在我的工作经历中,曾经参与过一个汽车电子项目,需要设计一个自定义的 CAN 总线过滤器。

当时我们就是从 RTL 级开始设计,先用 Verilog 描述数据流和控制逻辑,然后通过综合工具转换成门级网表,最后烧录到 FPGA 中进行验证。

这个过程让我深刻体会到了数字电路设计的层次化思想的重要性。

1.3 常用的设计方法

数字电路的设计方法主要有两种:自顶向下和自底向上。

自顶向下的方法是从系统需求出发,逐步细化到具体的电路实现;而自底向上则是先设计好基本模块,再组合成复杂系统。

在实际项目中,我们通常会结合这两种方法,既要有整体的系统视角,又要关注底层模块的实现细节。

举个例子,当我需要为 STM32 设计一个外部扩展的存储器接口时,我会先从顶层分析需求:需要多大的地址空间、数据位宽是多少、读写时序要求如何等。

然后再细化到具体的地址译码电路、数据锁存电路、时序控制电路的设计。

每个子模块设计完成后,再组合起来形成完整的存储器接口电路。

2. 数字电路仿真工具

2.1 Multisim 仿真软件

Multisim 是一款非常适合初学者的数字电路仿真软件,它提供了直观的图形化界面和丰富的元件库。

我在刚开始学习数字电路的时候,就是用 Multisim 来验证各种逻辑电路的功能。

这个软件最大的优点是操作简单,拖拽式的设计方式让人很容易上手,而且它还提供了虚拟仪器,比如示波器、逻辑分析仪等,可以直观地观察电路的工作状态。

在 Multisim 中,我们可以搭建从简单的门电路到复杂的时序电路。

比如设计一个 4 位二进制计数器,只需要将四个 D 触发器连接起来,配合一些逻辑门就可以实现。

通过仿真运行,我们可以清楚地看到计数器的状态变化过程,这对于理解数字电路的工作原理非常有帮助。

2.2 ModelSim 和 Vivado

对于更专业的 FPGA 开发,ModelSim 和 Vivado 是业界标准的仿真工具。

ModelSim 是一款功能强大的 HDL 仿真器,支持 Verilog 和 VHDL 两种硬件描述语言。

我在做 FPGA 项目的时候,经常使用 ModelSim 来验证 RTL 代码的功能正确性。

它可以进行时序仿真,精确模拟信号的延迟和传播时间,这对于高速数字电路的设计至关重要。

Vivado 则是 Xilinx 公司推出的集成开发环境,它不仅包含了仿真功能,还集成了综合、实现、时序分析等完整的 FPGA 开发流程。

在 Vivado 中,我们可以编写 Verilog 或 VHDL 代码,然后通过内置的仿真器进行功能验证,最后将设计下载到 FPGA 芯片中进行实际测试。

2.3 在线仿真平台

现在还有一些在线的数字电路仿真平台,比如 EDA Playground、CircuitVerse 等,它们的优势是无需安装软件,通过浏览器就可以进行电路设计和仿真。

这些平台特别适合快速验证一些简单的电路想法,或者用于教学演示。

我有时候在写公众号文章需要配图的时候,就会用这些在线工具快速画一个电路图并截图。

3. 实际设计案例

3.1 简单的流水灯控制器

让我们从一个简单的例子开始——设计一个流水灯控制器。

这是嵌入式开发中最经典的入门案例之一。

从数字电路的角度来看,流水灯本质上是一个移位寄存器加上时钟分频电路。

在硬件层面,我们可以用 74HC595 这样的移位寄存器芯片来实现。

74HC595 是一个 8 位串行输入、并行输出的移位寄存器,通过串行数据输入、时钟信号和锁存信号的配合,可以控制 8 个 LED 的亮灭状态。

如果需要控制更多的 LED,可以将多个 74HC595 级联使用。

如果用 STM32 来实现,我们可以用 GPIO 模拟 SPI 时序来驱动 74HC595,代码示例如下:

// 74HC595控制引脚定义
#define SER_PIN GPIO_PIN_0   // 串行数据输入
#define RCLK_PIN GPIO_PIN_1  // 锁存时钟
#define SRCLK_PIN GPIO_PIN_2 // 移位时钟
#define GPIO_PORT GPIOA
​
// 向74HC595发送一个字节数据
void HC595_SendByte(uint8_t data)
{
    uint8_t i;
    for(i = 0; i < 8; i++)
    {
        // 发送数据位
        if(data & 0x80)
            HAL_GPIO_WritePin(GPIO_PORT, SER_PIN, GPIO_PIN_SET);
        else
            HAL_GPIO_WritePin(GPIO_PORT, SER_PIN, GPIO_PIN_RESET);
        
        // 移位时钟脉冲
        HAL_GPIO_WritePin(GPIO_PORT, SRCLK_PIN, GPIO_PIN_SET);
        HAL_Delay(1);
        HAL_GPIO_WritePin(GPIO_PORT, SRCLK_PIN, GPIO_PIN_RESET);
        
        data <<= 1;
    }
    
    // 锁存数据到输出端
    HAL_GPIO_WritePin(GPIO_PORT, RCLK_PIN, GPIO_PIN_SET);
    HAL_Delay(1);
    HAL_GPIO_WritePin(GPIO_PORT, RCLK_PIN, GPIO_PIN_RESET);
}
​
// 流水灯效果
void WaterLight_Effect(void)
{
    uint8_t pattern = 0x01;
    while(1)
    {
        HC595_SendByte(pattern);
        HAL_Delay(200);
        pattern <<= 1;
        if(pattern == 0)
            pattern = 0x01;
    }
}

这个例子展示了如何通过软件控制数字电路芯片,实现特定的功能效果。

在实际项目中,我们经常需要这样的软硬件配合设计。

3.2 状态机设计

状态机是数字电路设计中非常重要的概念,它可以用来描述系统在不同状态之间的转换关系。

在嵌入式系统中,很多控制逻辑都可以用状态机来实现,比如通信协议的解析、按键的消抖处理、电机的控制等。

以一个简单的交通信号灯控制器为例,它有三个状态:红灯、黄灯、绿灯。状态转换的规则是:绿灯亮 30 秒后变黄灯,黄灯亮 3 秒后变红灯,红灯亮 30 秒后变绿灯。

这是一个典型的有限状态机(FSM)设计。

用 Verilog 描述这个状态机的代码如下:

module traffic_light(
    input clk,
    input rst_n,
    output reg [2:0] light  // bit2:红灯 bit1:黄灯 bit0:绿灯
);
​
// 状态定义
parameter IDLE = 2'b00;
parameter GREEN = 2'b01;
parameter YELLOW = 2'b10;
parameter RED = 2'b11;
​
reg [1:0] state, next_state;
reg [31:0] counter;
​
// 状态转换逻辑
always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        state <= IDLE;
    else
        state <= next_state;
end
​
// 下一状态逻辑和计数器
always @(*) begin
    case(state)
        IDLE: begin
            next_state = GREEN;
            light = 3'b001;
        end
        GREEN: begin
            if(counter >= 30000000)  // 假设时钟1MHz,30秒
                next_state = YELLOW;
            else
                next_state = GREEN;
            light = 3'b001;
        end
        YELLOW: begin
            if(counter >= 3000000)   // 3秒
                next_state = RED;
            else
                next_state = YELLOW;
            light = 3'b010;
        end
        RED: begin
            if(counter >= 30000000)  // 30秒
                next_state = GREEN;
            else
                next_state = RED;
            light = 3'b100;
        end
        default: next_state = IDLE;
    endcase
end
​
// 计数器逻辑
always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        counter <= 0;
    else if(state != next_state)
        counter <= 0;
    else
        counter <= counter + 1;
end
​
endmodule

这个状态机设计清晰地描述了交通信号灯的控制逻辑,通过仿真可以验证状态转换是否正确,时序是否符合要求。

3.3 时序电路设计要点

在数字电路设计中,时序是一个非常关键的问题。

时序不对,电路就无法正常工作。我在做汽车电子项目的时候,曾经遇到过一个因为时序问题导致的 bug,花了好几天才定位出来。

那是一个 SPI 通信接口,由于时钟相位设置不对,导致数据采样时机错误,接收到的数据总是不正确。

时序电路设计需要注意以下几点:首先是建立时间(Setup Time)和保持时间(Hold Time)的要求,数据信号必须在时钟沿到来之前的一段时间内稳定,并且在时钟沿之后还要保持一段时间,这样才能被正确采样。

其次是时钟偏斜(Clock Skew)问题,在大规模电路中,时钟信号到达不同触发器的时间可能不一致,这会影响电路的最高工作频率。

在实际设计中,我们可以通过仿真来检查时序问题。

比如在 ModelSim 中,可以设置时序约束,然后运行时序分析,工具会自动检查是否存在时序违例。

如果发现问题,可以通过调整电路结构、增加流水线级数、降低工作频率等方法来解决。

4. 仿真验证方法

4.1 功能仿真

功能仿真也叫行为仿真,它只关注电路的逻辑功能是否正确,不考虑延迟、时序等物理特性。

这是数字电路设计中最基础也是最重要的验证步骤。

在写完 RTL 代码之后,第一件事就是进行功能仿真,确保逻辑功能符合设计要求。

功能仿真需要编写测试激励(Testbench),这是一段专门用于测试的代码,它会产生各种输入信号,然后观察电路的输出响应是否正确。

一个好的 Testbench 应该覆盖所有可能的输入组合和边界条件,这样才能充分验证电路的正确性。

我在做 FPGA 项目的时候,通常会花大量时间编写和完善 Testbench。

有时候 Testbench 的代码量甚至比设计代码还要多,但这是值得的,因为充分的仿真验证可以在早期发现问题,避免在硬件调试阶段浪费更多时间。

4.2 时序仿真

时序仿真会考虑电路中的延迟和时序特性,它能更真实地反映电路在实际硬件中的工作情况。

时序仿真通常在综合和布局布线之后进行,因为这时候工具已经知道了每个门电路的延迟、连线的延迟等信息。

时序仿真可以帮助我们发现一些功能仿真无法发现的问题,比如竞争冒险、时序违例等。

在高速数字电路设计中,时序仿真是必不可少的验证手段。

我曾经遇到过一个设计,功能仿真完全正常,但是下载到 FPGA 后却工作不正常,后来通过时序仿真发现是因为某个关键路径的延迟太大,导致数据采样错误。

4.3 波形分析技巧

波形分析是仿真验证中最直观的方法,通过观察信号的波形变化,可以快速定位问题。

在 ModelSim 或 Vivado 的波形查看器中,我们可以添加需要观察的信号,设置合适的时间范围和显示格式,然后运行仿真观察波形。

有几个波形分析的小技巧:第一,合理分组信号,把相关的信号放在一起,比如把一个模块的所有输入信号放在一组,输出信号放在另一组,这样便于对比观察。

第二,使用不同的显示格式,比如对于地址信号可以用十六进制显示,对于数据总线可以用二进制显示,对于计数器可以用十进制显示。

第三,设置合适的时间标尺,既要能看到整体的工作流程,又要能放大观察细节。

5. 从仿真到实际应用

5.1 仿真与实际的差异

虽然仿真是验证数字电路设计的重要手段,但仿真环境和实际硬件环境还是有差异的。

仿真是理想化的环境,不考虑温度、电源噪声、电磁干扰等实际因素。

我在实际项目中就遇到过这样的情况:电路在仿真中工作完美,但在实际硬件上却出现了问题,最后发现是因为 PCB 布线不合理导致的串扰。

因此,仿真验证通过后,还需要在实际硬件上进行充分测试。

特别是对于一些关键的时序电路、高速接口电路,必须用示波器、逻辑分析仪等实际测量工具来验证。

这也是为什么在嵌入式开发中,既要懂软件编程,也要懂硬件调试的原因。

5.2 与嵌入式软件的配合

在实际的嵌入式系统中,数字电路往往需要和软件配合工作。

比如我们设计了一个自定义的外设模块,用 FPGA 实现了硬件功能,但还需要编写驱动程序来控制这个模块。

这就要求我们既要懂硬件设计,也要懂软件开发。

在我的工作经历中,软硬件协同设计是非常常见的。

比如在汽车电子项目中,我们用 FPGA 实现了一个高速的图像处理模块,用来处理摄像头采集的图像数据。

硬件部分负责图像的滤波、边缘检测等算法实现,软件部分负责图像的分析和决策。

这种软硬件分工可以充分发挥各自的优势,硬件处理速度快,软件灵活性强。

5.3 持续优化和迭代

数字电路设计不是一次性完成的,往往需要经过多次迭代优化。

第一版设计可能只是实现了基本功能,后续还需要优化性能、降低功耗、减少资源占用等。

通过仿真可以评估不同优化方案的效果,选择最优的设计方案。

在我的公司业务中,经常会接到一些电路优化的咨询项目。

客户的电路功能是正常的,但是存在功耗过高、速度不够快、成本太高等问题。

这时候就需要对电路进行分析和优化,通过仿真来验证优化效果。

比如有个项目需要降低 FPGA 的功耗,我们通过时钟门控、流水线优化等技术,在保证功能的前提下,将功耗降低了 30% 以上。

6. 学习建议和资源

对于想要学习数字电路设计和仿真的朋友,我有几点建议:首先要打好理论基础,数字逻辑、时序电路、状态机等基本概念一定要理解透彻。

其次要多动手实践,光看书是不够的,一定要自己搭建电路、编写代码、运行仿真,在实践中加深理解。

在学习工具方面,可以从 Multisim 这样的入门级工具开始,熟悉了基本操作后再学习 ModelSim、Vivado 等专业工具。

同时建议学习一门硬件描述语言,Verilog 或 VHDL 都可以,这是进行数字电路设计的必备技能。

在我的公众号里,我也经常分享一些数字电路设计和嵌入式开发的经验和技巧,欢迎大家关注交流。

学习这个领域需要时间和耐心,但一旦掌握了,你会发现它的魅力所在,能够设计出自己的数字电路,看着它在硬件上正常工作,那种成就感是无与伦比的。

数字电路设计和仿真是一个既有理论深度又有实践价值的领域,它是现代电子系统的基础。

无论你是做嵌入式软件开发,还是做硬件设计,掌握这方面的知识都会让你的技术能力更上一层楼。

希望这篇文章能对大家有所帮助,也欢迎大家在实践中多多交流探讨。

更多编程学习资源

楼主一个月前遭遇了 layoff ,从 data scientist 转到 MLE ,但是目前是平薪,一点也没涨,不知道是否有必要接。面试的过程感受到公司 HR 不是特别的 professional ,动不动的 cold call, 公司的股票在这几年间一直在跌。这个工作做的是一些目前落地比较多的 AI Agent,虽然感觉完全是开发做的事情,但是可以加强一下自己的落地部署( CI/CD )的经验。

谈薪的阶段,我试探性的问了 HR 预算多少。HR 当时说预算能比现在的工作多 3k ,我说我希望可以涨薪 5k ,对方就说询问一下 Hiring Manager 。等了三天后还是没有消息,我比较担心 offer 谈崩了,所以直接发了一个邮件进行跟进,对方直接就说现在卡在了预算这一步,最后只能给我加薪 900 。

楼主只是感觉到比较愤怒,只能加 900 为什么当初要说可以多给 3k 呢?觉得对方并不是很尊重我。希望大佬们给些建议!

楼主看到有一些人建议接了然后骑驴找马,但是跳槽频繁容易让简历不好看(虽然楼主工作经验只有 1 年半),并且签约了毁约感觉不是很符合契约精神。楼主在香港,整个圈子就那么小,比较担心和 Hiring Manager 闹的比较僵。大也看到一些人觉得才一个月没必要焦虑,但是楼主下个月就要离职了,感觉空窗期的压力是巨大的,一方面还要继续付房租还要继续生活,另一方面这一个多月筋疲力尽了,还是继续找工作,战线太长有点疲软。

家里面的 wifi 网速是正常的,但是只要 mac 或者 iphone 连上了 wifi ,icloud 文件的下载就巨慢无比,使用手机的流量就是正常下载速度,请问大家知道是什么原因怎么解决吗,要被逼疯了

图片


开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@鲍勃

01 有话题的技术

1、RunAnywhere 推出 RCLI,实现 131ms 端到端本地语音控制架构

RunAnywhere 发布的开源项目 RCLI 实现了 macOS 环境下全本地化的 Voice + RAG 闭环流水线。该系统通过优化端到端推理路径,将「语音输入至指令执行」的延迟压缩至 ~131ms,目前支持 43 项原生 macOS 自动化操作(覆盖 Spotify、窗口管理、FaceTime 等)。项目采用全开源模式,核心逻辑完全脱离云端,确保数据本地化存储与处理。

RCLI 的技术核心在于针对 Apple Silicon 深度优化的推理链路。下一版本计划引入 MetalRT 支持,届时预计 decode 速度可达 658 tok/s,并显著提升 自动语音识别(ASR)与语音合成(TTS) 的并发性能。该架构利用本地 RAG 插件实现文档问答与实时系统控制的协同,通过高性能本地推断规避了传统云端助理的延迟瓶颈。

GitHub 链接:

https\://github.com/RunanywhereAI/RCLI

( @sanchitmonga22\@x)

2、北京大学开源 Helios 14B,实现单卡 H100 视频实时生成

北京大学(PKU-YuanGroup)正式开源 Helios,这是一个参数量达 14B 的高性能视频生成模型。该模型通过架构优化,在单张 NVIDIA H100 上实现了实时生成(Real-time Generation),其推理速度超越了常规 1.3B 规模的模型,显著降低了高参数量模型在视频流合成中的延迟瓶颈。

Helios 架构原生支持多种生成范式与交互模式,具备类「世界模型(World Models)」的物理模拟潜力:

  • 多模态输入:完整覆盖 Text-to-Video (T2V)Image-to-Video (I2V)Video-to-Video (V2V) 任务。
  • 交互式生成:支持实时交互控制,允许用户在生成过程中干预视频状态,模拟动态环境反馈。
  • 高效率推理:14B 参数量级下实现实时输出,标志着视频扩散模型或自回归模型在算力利用率上的重大突破。

目前该项目已在 GitHub 开源,提供模型权重与推理脚本。

GitHub 链接:

https\://github.com/PKU-YuanGroup/Helios

( @Gorden\_Sun\@X)

3、OpenAI 研发 BiDi 双向音频模型,旨在攻克实时中断与工具调用

OpenAI 正在研发代号为 BiDi(Bidirectional) 的新型实时音频模型,旨在打破当前 Advanced Voice Mode 的轮询式(Turn-based)交互局限。该模型的核心突破在于持续处理能力,允许 AI 在输出过程中实时感知输入信号并调整响应逻辑,而非在遭遇中断(如 「OK」或 「嗯」)时简单停顿或失效。

  • 双向流式交互:BiDi 改变了固定响应生成机制,支持在语音输出期间动态修正预测路径,适用于复杂的服务场景(如客服场景中的中途需求变更)。
  • 外部工具集成:据内部人士透露,该模型在外部工具与 API 调用的协同效率上优于现有模型,预示其将成为未来 AI 硬件(如智能音箱)的核心交互层。
  • 技术瓶颈:目前原型机存在稳定性缺陷,长时对话(数分钟后)易触发异常音色或逻辑溃缩(Glitching)
  • 交付计划:原定于 2026 年 Q1 发布,受稳定性影响,预计推迟至 Q2 或更晚

(@TheInformation;@investing.com)


02 有亮点的产品

1、苹果「HomePad」智能家居中枢推迟至 2026 年秋季发布

图片

据原型机收集者「Kosutami」最新消息,苹果长期传闻中的智能家居中枢设备「HomePad」将推迟至 2026 年秋季推出,比预期时间更晚。

Kosutami 在 X 平台上发帖表示,该设备将于 9 月至 12 月的秋季期间问世,这通常是苹果一年中最繁忙的产品发布窗口。苹果已为此设备研发数年,旨在打造智能家居控制中心,用户可通过它统一管理家居产品、播放音乐和播客、进行视频通话,并查看天气、日历等即时信息。

设备预计配备 7 英寸方形显示屏和前置摄像头,可能推出两种版本:一款壁挂式,另一款带有类似 HomePod mini 扬声器底座的桌面款。内置传感器能检测附近人员,并根据身份调整显示内容。它将高度依赖 Siri 语音指令,Siri 在设备上可能呈现拟人化界面,如 Mac Finder 图标的变体设计。

苹果预计定价约 350 美元。该设备原计划 2025 年初发布,后因 Apple Intelligence 开发延误移至 2026 年初,如今进一步推至秋季,或与 iPhone 18 Pro 或全新 MacBook Pro 一同亮相。

(@极客公园)

2、VoiceLine 获 1000 万欧元 A 轮,用于扩展语音 AI 在欧洲企业一线应用

图片

慕尼黑初创公司 VoiceLine 近日宣布完成 1000 万欧元 A 轮融资。本轮由 Alstin Capital 与 Peak 领投,Scalehouse Capital、Venture Stars 及 NAP 跟投。资金将主要用于扩展全球市场及深化针对移动端一线员工(Frontline Workers)的语音 AI 技术研发。

VoiceLine 旨在通过语音交互解决现场销售、服务及运营人员在移动场景下的数据录入延迟问题。

其主要技术有

  • 异步语音采集:取代传统的手动文本输入,支持现场语音实时抓取。
  • 结构化处理引擎:利用 AI 自动将非结构化语音转化为标准访问报告、CRM 条目及待办任务
  • 企业级系统集成:原生对接主流 CRM(如 Salesforce, HubSpot)及 ERP 逻辑,确保数据实时同步至企业现有工作流。
  • 多模态输出:系统根据预设规则,自动从单条语音记录中提取并分发至不同业务模块,降低信息衰减。

该方案旨在重塑一线业务的标准化文档沉淀,通过「语音即接口」的设计理念减少员工对移动端 UI 的高频依赖,从根源上消除因「事后补录」导致的数据滞后与信息黑盒问题。

目前,VoiceLine 已在制造、物流及服务业完成闭环落地,为分布式移动团队提供实时、高保真的数据反馈链路,将非结构化现场交互转化为具备可追溯性的企业数字资产,显著提升了管理端的全局可见性。

未来,voiceline 将以德国为中心向全欧洲及全球市场渗透,强化多语言环境下的企业级语音 AI 部署能力。同时开发更多适配现场业务的垂直用例(Use Cases),提升对复杂业务逻辑的识别精度。

( @thenextweb)

3、语音社交 App 森森(Gensen)MAU 突破 260 万:基于副语言信号与游戏行为实现 AI 人格建模

图片

由暴雪与皮克斯资深开发人员创立的社交产品森森(Gensen),通过 3D 语音游戏场景捕捉用户的实时声音特征与交互行为,利用 AI 建模替代传统社交产品的静态图文匹配。目前该产品 MAU 已达 260 万,估值 1.5 亿美元,旨在解决 AI 时代生成内容带来的社交信息信任危机。

  • 副语言信号(Paralinguistic signals)特征分析:系统通过 AI 提取语调起伏、语速节奏、停顿、笑声音频等非语言声学特征。这些信号因具有实时性且难以通过 AI 实时伪造,被作为识别用户性格与情绪状态的核心数据源。

图片

  • 游戏化行为数据标注:利用「海龟汤」、「森森酒馆」等 3D 语音场景,将社交匹配从「自我陈述」转向「行为观测」。系统通过观测用户在游戏逻辑推理、抗压表现及社交直觉中的本能反应,进行多维度的人格特征画像。
  • 匿名化统计建模逻辑:系统在不涉及具体语音内容存储的前提下,对表达方式(声学特征)和语言模式(用词习惯、互动逻辑)进行统计建模。匹配逻辑基于用户真实的互动风格而非用户填写的问卷标签。
  • 高增长与资本准入:产品曾位列 iOS 社交榜前 20,累计融资金额超 4500 万美元。目前已在上海与 Palo Alto 设立双总部,并获得 A16Z 及腾讯的投资意向。

国内版已上线运营;美国版 Gensen 正在进行上线准备;已完成 A 轮融资,累计融资约 3.1 亿元人民币。

(@量子位)


03 有态度的观点

1、雷军:AI 不会消灭工作,未来每天上班两小时就够了

图片

近日,全国人大代表,小米集团创始人、董事长兼 CEO 雷军在接受采访时表示,在人工智能时代,或许很多规则将被重写,但同时又会产生很多新的岗位。

雷军建议,大家要用开放的心态,迎接更先进的时代。未来,也许不再需要每天工作 8 小时、每周工作 5 天了,或许一周仅需工作 3 天,每天工作 2 个小时。我们的生活质量、工作质量都会大幅度提升。

前不久, 小米机器人走进小米工厂开始拧螺丝了,雷军表示未来 5 年会有更多的人形机器人走进小米的工厂。

对此,雷军进一步阐述称:「我们已经进入人工智能的时代,这是毫无疑问的共识。」

(@极客公园)


04 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、AveraLabs — 语音 AI 研究工程师 / Research Engineer, Voice AI

我们是一家来自美国旧金山的语音 AI 初创团队,正在打造下一代「全双工语音交互」系统,目标是让它通过图灵测试,创造像真人一样的自然对话。

创始团队

  • YC 连续创业者,均来自 UC Berkeley / Rice University
  • BCV Labs 贝恩资本孵化器创始成员
  • 前 Cruise 自动驾驶模拟算法 lead
  • Databento(Bloomberg 最大竞品)第一任 PM
  • 曾主导 Pinterest 增长
  • 获 Y Combinator、Rebel Fund、Afore Capital、UpHonest Capital 等顶尖机构投资

你会做什么

  • 研究并实现低延迟全双工语音对话模型
  • 设计语音 tokenizer、streaming encoder/decoder、duplex 状态机等核心模块
  • 解决真实场景下的打断检测、情感建模、paralinguistic 特征保留等挑战
  • 跟踪 Moshi / Freeze-Omni / MiMo-Audio 等前沿工作,快速内化并超越

我们在找什么人

  • 顶校 CS/EE/信号处理硕博,或同等工业界经历
  • 深度理解语音+LLM 交叉领域:audio codec、speech LM、multimodal training
  • 有 ICASSP / Interspeech / NeurIPS / ICLR 等一作/核心贡献者经验优先
  • 有过全双工、streaming audio tokenizer、低延迟系统落地经验者强烈优先

加分项

  • 待过 Alibaba/Tencent/Xiaomi/字节/小红书/SOUL 语音团队
  • 做过 neural audio codec(RVQ/VQ-VAE)、语音情感建模、低延迟 TTS
  • 对"为什么当前语音 AI 还不像真人对话"有深入研究和独到见解

我们给什么

  • 超 BAT 薪资水平 + equity(early stage,上车要趁早)
  • 直接参与定义核心架构,不做螺丝钉
  • 小团队,快速迭代,做完就上线

有兴趣 or 知道合适的人,微信/邮件联系:richardh\@averalabs.com

在这里插入图片描述

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


图片

作者提示: 个人观点,仅供参考

各位好,

平时开发总要用各种小工具,JSON 格式化、Base64 转换、图片压缩之类的。用多了觉得麻烦,就自己整理了一个站,把所有工具放在一起了。

地址: https://www.xyutil.com

大概 90 多个工具吧,分类挺全的:

  • 开发工具( JSON 、XML 、正则测试这些)
  • 图片处理(压缩、格式转换、水印)
  • 文本处理(字数统计、文本对比)
  • 颜色工具、计算器、生成器等等

特点就几个:

  1. 不用注册,打开就能用
  2. 没广告
  3. 加载快

都是自己平时用得比较多的,希望能帮到大家。

有啥建议欢迎提,也欢迎大家收藏备用~

一同探索 Voice Agent、Physical AI 等对话驱动的下一代人机交互界面。

3 月 19 日旧金山湾区见!Physical AI Meetup\&Workshop 邀你探讨全模态与端侧智能!


上午主题分享+圆桌下午动手工作坊,无论你是产品人、开发者、创业者还是硬件极客,总有一款适合你!

围绕 Conversational AI、Visual Agent 与 Edge AI 等核心议题,我们邀请了来自基础芯片与大模型、前沿硬件初创、硬件投资机构,以及记忆数据与实时互动基础设施的先锋代表齐聚一堂。

参会嘉宾/机构:

MiniMax | Agora | 同歌创投| EverMind | HumanTouch | RiseLink | RTE 开发者社区丨TEN Framework

这场动脑又动手的 Physical AI 活动你绝对不容错过!


活动信息

地点:硅谷 Sunnyvale(具体地址报名审核通过后以短信通知)


日期:3 月 19 日(周四),9:30 AM - 12:30 PM;13:30 PM-17:00 PM(太平洋夏令时间 PDT)


上午主题分享+圆桌丨 Physical AI Meetup: Conversational AI, Visual Agent and Edge AI

09:30\~ 12:30

下午丨与硬件对话:TEN + Agora R1 套件语音 AI 工作坊

13:30\~ 17:00

💡 你可以只参加单场,也可全天参与——动手也动脑,快乐翻倍!


访问链接报名方式(注:上下午活动需分开报名)

上午场:https\://luma.com/8we6qyma

下午场:https\://luma.com/onc0xr9y

报名通过后,小助手将通过微信联系你,并告知详细地址与注意事项。


上午:Physical AI Meetup: Conversational AI, Visual Agent and Edge AI


📅 活动详情


  • 时间: 3 月 19 日(周四),9:30 AM - 12:30 PM(太平洋夏令时间 PDT)
  • 地点: 硅谷 Sunnyvale(具体地址报名审核通过后以短信通知)

日程安排


  • 9:30 - 10:00|签到 & 自由交流
  • 10:00 - 10:10|开场
  • 10:10 - 11:10| 主题演讲:对话真实世界

    • Morgan Suo, Senior GTM Manager\@MiniMax
    • Diana Zhu, Head of US Office\@RiseLink
    • 冯晓东,Physical AI 产品线负责人@Agora
  • 11:10 - 11:40|🔄圆桌讨论:从 Always on 到 Proactive AI,全模态 AI 硬件的机会

    • Kara 李欣航,执行董事@同歌创投
    • Troy Hua,VP\@EverMind,负责技术生态
    • William Gao, Founder\@HumanTouch
    • Moderator: Cynthia Yang, Initiator\@RTE Dev Community
  • 11:40 - 11:55|⚡Lightning Demo
  • 11:55 - 12:30|自由 Networking

👇 访问链接报名(含 Demo 申请通道)! (审核通过后,我们将通过短信告知详细地址与参会指引。)

https\://luma.com/8we6qyma


注:上下午活动需分开报名

下午:与硬件对话:TEN + Agora R1 套件语音 AI 工作坊

GTC 期间,我们准备了这场特别的硬件工作坊!带你深入了解如何在开发板上接通语音 AI Agent 并进行动手实操。


📅 活动详情

  • 时间: 3 月 19 日(周四),1:30 PM - 4:30 PM(太平洋夏令时间 PDT)
  • 地点: 硅谷 Sunnyvale(具体地址报名审核通过后以短信通知)
  • 人数:50~70 人 现场提供 40 套 R1 设备 👉 可以 单人成组 或 两人一组 👉 每组配有一套 R1 硬件 👉 成功跑通的队伍都可以把 R1 套件带回家!

🔍 活动亮点


🔹 TEN Framework 是专为构建 对话式语音 AI 设计的开源工具集,支持:

  • 低延迟、多模态语音交互
  • 兼容主流 STT /TTS / LLM / RTC
  • 灵活接入不同模型与编排方案 👉 让你的语音 Agent 快速落地

🔹 Agora R1 是一款集成对话引擎的轻量级 AI 硬件套件

  • 开箱即可操控语音交互
  • 支持 APP 配网连接智能体实现语音交互功能
  • 提供全面开发资料与二次开发支持

📌 在这里,你将亲手完成从硬件配置、编译、运行,到自定义语音 Agent 的完整动手链路。


🧠 你会得到什么


✔ 现场技术分享

✔ R1 设备实操上手

✔ 自定义语音 AI

✔ 团队合作与答疑支持

✔ 跑通就能把设备带回家!

欢迎对智能硬件、语音交互、Agent 产品有兴趣的朋友报名。


活动流程


  • 13:30–14:00 签到 & 自行组队
  • 14:00-14:20 技术分享
  • 14:20–16:30 现场实操(提供详细流程文档和技术答疑)

📌 准备建议(强烈推荐)

为了让现场体验流畅,请提前准备:

  • 一台笔电
  • GitHub 账号(用于运行 Codespace / 示例仓库)
  • 终端工具与命令行基础(建议提前熟悉)

👇 访问链接报名 (审核通过后,我们将通过微信联系您告知地址与参会指引。)

https\://luma.com/onc0xr9y


注:上下午活动需分开报名



主办方:

RTE Dev Community 丨 TEN Framework

合作伙伴:

Agora | RiseLink | MiniMax | HumanTouch | EverMind | Resonance Ventures | AI Camp | Founder Park | Atlas Cloud

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

我有一块性能很差的安卓阅读器,想要一个轻量级的 app ,能打开本地 epub 和 pdf 就行。
目前测了下来比较喜欢:
1. Readera 轻量简洁,但注释只能黑白,没有内建词典,但可以跳转到已安装的词典 app
2. google play book 满足我所有需求除了!要上传云端,好麻烦,需要联网开 vpn (耗电!),而且还要等很久才能传上去。。
还尝试过 moon+(比如 readera ,有太多花里胡哨的设置,不喜欢)

大佬们有其他推荐好用的阅读器 app 吗?

一、核心架构图(Mermaid语法,可直接渲染)

架构1:轻量版(MQTT为主,适合中小规模机器人)

graph TD
    A[关节模组集群] -->|1.位置上报/状态上报<br>MQTT QoS1| B[MQTT Broker<br>(Mosquitto/EMQX)]
    C[上位机/调试后台] -->|2.指令下发<br>MQTT QoS1| B
    B -->|3.转发上报数据| D[数据存储<br>(InfluxDB/MySQL)]
    B -->|4.转发指令| A
    B -->|5.实时调试数据| E[可视化面板<br>(Grafana/前端页面)]
    F[告警模块] -->|订阅异常主题| B
    A -->|硬件层| A1[STM32/ARM固件<br>C/C++采集位置]
    C -->|调试层| C1[Python/Lua下发指令(webRTC?)]

架构2:企业版(MQTT+AMQP,适合大规模/跨系统机器人)

graph TD
    A[关节模组集群] -->|MQTT QoS1<br>位置/状态上报| B[EMQX MQTT Broker]
    B -->|协议桥接| C[RabbitMQ(AMQP)<br>跨系统消息转发]
    D[上位机调试端] -->|MQTT<br>指令下发| B
    E[企业级后台系统] -->|AMQP<br>指令/数据交互| C
    B -->|实时数据| F[时序数据库<br>InfluxDB/TimescaleDB]
    C -->|离线消息/可靠投递| G[MySQL/PostgreSQL<br>指令日志/历史数据]
    B -->|告警触发| H[告警服务<br>(邮件/短信/钉钉)]
    F -->|数据可视化| I[Grafana<br>关节位置监控面板]
    A --> A1[关节固件<br>C/C++ MQTT客户端]
    D --> D1[Python调试脚本<br>paho-mqtt]
    E --> E1[Java/Go后端<br>AMQP客户端]

二、架构核心组件说明(贴合关节场景)

组件作用开源选型
关节模组集群采集位置/执行指令自研C/C++固件 + paho-mqtt-c
MQTT Broker实时消息转发(核心)EMQX(开源版)/Mosquitto
AMQP Broker跨系统可靠消息(企业版)RabbitMQ(开源)
数据存储位置时序数据/指令日志InfluxDB(时序)/MySQL(结构化)
调试/控制端指令下发/实时调试Python脚本/MQTTX(可视化工具)
可视化/告警位置监控/异常告警Grafana(开源)/Prometheus

三、开源项目参考(可直接复用)

以下开源项目包含“关节上报+指令下发+MQTT/AMQP”核心逻辑,你可以克隆下来参考架构和代码:

1. 轻量MQTT版(适合中小机器人)

  • 项目名robot-joint-mqtt
  • 地址https://github.com/elephantrobotics/pymycobot(大象机器人开源的机械臂控制,含MQTT上报/指令)
  • 核心亮点

    • 关节位置实时上报(MQTT);
    • Python上位机下发运动指令;
    • 支持STM32固件+C/C++ MQTT客户端;
    • 包含简单的调试面板。

2. 企业级MQTT+AMQP版

  • 项目名ros2-mqtt-amqp-bridge
  • 地址https://github.com/ros-industrial/ros2-message-bridge(ROS2生态的协议桥接)
  • 核心亮点

    • MQTT(机器人端)和AMQP(企业后台)双向桥接;
    • 支持关节位置时序上报、指令可靠下发;
    • 包含EMQX+RabbitMQ的部署配置;
    • 适配多关节机器人集群。

3. 极简嵌入式版(适合单个关节模组)


四、架构设计关键原则(关节场景专属)

  1. 协议分层

    • 机器人端(关节模组):优先MQTT(轻量、实时、低功耗);
    • 企业后台/跨系统:用AMQP(RabbitMQ)做可靠消息投递(比如指令离线缓存);
    • 桥接:通过EMQX的“MQTT→AMQP”桥接功能,实现协议互通。
  2. 主题规范(必遵守)

    # 上报主题
    robot/{机器人ID}/joint/{关节ID}/status  # 位置/状态
    robot/{机器人ID}/joint/{关节ID}/error   # 异常告警
    # 指令主题
    robot/{机器人ID}/joint/{关节ID}/cmd     # 运动指令
    robot/{机器人ID}/joint/{关节ID}/config  # 参数配置
  3. 可靠性保障

    • MQTT用QoS1(保证指令/上报不丢);
    • AMQP用“持久化队列+确认机制”(企业级指令不丢);
    • 关节模组加“遗嘱消息”(离线自动上报异常)。
  4. 调试友好

    • 保留原始上报数据(脉冲数),后台做单位转换;
    • 指令下发加“指令ID”,上报加“响应ID”,便于追溯调试;
    • 部署EMQX Dashboard,实时查看MQTT消息流转。

总结

  1. 轻量场景:直接用MQTT(EMQX/Mosquitto)+ 关节模组C/C++固件 + Python调试端,参考robot-joint-mqtt开源项目;
  2. 企业场景:MQTT(机器人端)+ AMQP(后台),通过EMQX桥接RabbitMQ,参考ros2-mqtt-amqp-bridge
  3. 架构核心:关节模组上报MQTT→Broker转发→后台存储/调试;后台下发指令→Broker转发→关节模组执行。

你可以把上述Mermaid架构图复制到Mermaid在线编辑器渲染成可视化图,也可以基于开源项目的代码结构,快速搭建自己的关节模组通信架构。如果需要某部分的详细代码解析(比如EMQX桥接RabbitMQ的配置),我可以补充。

看到有几个市里面的政策在出。
云厂商在宣传一键部署和云电脑/云服务器。
大模型厂商在出套餐卖 token 。
公共平台热搜在涨。
报道里有上门安装赚几十万这种新闻。
公众号/知识星球/这些卖课的在取 UC 震惊体引流。

这玩意儿在“合规性”和“生产力落地上”称得上这么大的阵仗吗。
没有顶级的模型在后面撑着不就一滩泥巴吗。

先不说 token 耗的多不多。
真有拿免费的或者低价的类似 glm 这种模型的 api 干出正经活儿的吗。

AI 发展感觉太快了,让人触不及防。以前论坛大家都是讨论框架、语言、架构。有了 AI 会不会都变成聊天工程师,kpi 都是统计今天跟 ai 聊天了多久,产出了多少。

```

这个月开始招行的闪电贷优惠没有了,最低是 4 点几

有什么 3 左右的贷款吗?


```