包含关键字 typecho 的文章

在做产品设计的人基本都有一个共同感受:画原型真的很耗时间。从最开始的手绘草图,到一点点搭组件、调整布局,费时又费力。但随着AI设计工具的发展,原型设计已经变得轻松很多。现在只要简单几步操作,就能快速做出高保真原型,今天整理了一份AI原型设计工具清单。不管你是刚接触产品设计的新手,还是已经有经验的设计师,都可以从中找到适合自己的工具。

  1. UXbot(国内首选)
    UXbot它不只是能把文字描述、手绘草图,瞬间变成可编辑的原型,还支持多端适配,帮你一次性生成PC端、移动端页面。最省心的是,它能一次性生成高质量的完整项目,甚至直接输出开发能用的代码,让整个团队告别重复劳动。
    核心亮点
  2. 文字描述秒变原型:不用复杂操作,只要用日常话描述界面内容和交互逻辑,比如“做一个首页,有轮播图和商品列表,点击商品能跳转详情页”,AI A就能生成高保真原型,连按钮点击、页面跳转这些交互都能自动添加。
    image.png
  • 手绘草图/截图秒识别:随手画的原型草图或者喜欢的软件页面,直接截图上传,就能快速识别成可编辑页面,不用再重新描线、调整布局,省了超多功夫。
  • 自带自然语言处理 AI 助手,搭配支持像素级微调的专业可视化编辑器,可以任意修改原型图上任何一个元素,自由度拉满。
    image.png
  • 设计即代码:支持直接输出前端可用的代码,开发人员可以直接拿去使用,减少前端还原UI时的偏差和重复工作。
    适合人群
    中小型企业、工作室、设计和开发团队合作,快速把商业想法变成可展示的原型,提高原型评审和代码转化效率。
  1. Uizard
    Uizard比较突出的一个功能是:可以把手绘草图直接转换成原型界面。即使只是简单画出的线框图,它也能识别出页面里的按钮、图片区域、输入框等元素,并自动整理成完整的界面布局,省去了重新搭建页面结构的时间。
    除了草图识别功能,Uizard还加入了AI设计辅助。系统会根据页面结构给出一些基础优化,比如调整排版、统一样式,让整体界面看起来更清晰、更规范。对于设计经验不多的人来说,这个功能会比较友好。
    工具内部也提供了不少现成模板,可以在模板基础上直接修改内容,不需要从空白画布开始设计,这样做原型会更快一些。另外,它还支持交互预览,在设计阶段就可以查看页面跳转、按钮点击等效果,方便及时发现问题并进行调整。
    适合人群:
    初创团队、产品经理,以及刚接触UI/UX设计的新人,整体上手门槛比较低。
    image.png
  2. Visily
    Visily更适合用来做快速原型设计,从简单线框到中等精度的页面都可以完成。使用的时候,你可以直接上传竞品截图,或者导入自己画的草图,系统会自动识别页面里的结构,并生成可以继续编辑的界面。这样就不需要从零开始搭建布局,做原型会快很多。
    它的AI功能还会在设计过程中提供一些参考建议,比如组件排列、页面结构和间距调整等,让整体布局看起来更清晰,也更符合常见的设计习惯。
    Visily还支持多人同时在线协作。团队成员可以在同一个项目里一起编辑、评论和调整设计,很多修改都能实时看到结果,这样沟通效率会更高,原型迭代也会更顺畅。
    整体来说,这个工具学习成本不高,界面也比较直观,对于需要频繁修改原型的团队来说,会比较实用。
    适合人群:
    UX设计师,以及需要快速推进原型设计和迭代的产品团队。
    image.png
  3. Relume
    Relume更偏向网站原型设计,能快速生成页面框架和线框图,尤其适合做网站、落地页或者营销页面。在使用时,只需要简单描述页面内容或选择相关模块,Relume就能自动生成网站的基础结构和线框图,比如首页布局、内容区块和页面层级等。这样就不用自己一点点去组合组件,可以更快完成页面雏形。
    生成的线框原型还可以导入到Figma等设计工具中,再继续完善视觉设计或细化交互流程。对于需要频繁制作网页结构草稿的设计师来说,这种方式能节省不少时间。
    通过自动整理网站信息架构和生成基础线框图,Relume能帮助团队更快进入设计阶段,也方便在早期就进行页面结构讨论。
    适合谁用:Web设计师,以及需要快速搭建营销页面的团队。
    image.png
  4. Creatie
    Creatie不只是能生成原型,还能自动生成风格统一的UI元素和组件库,特别适合团队项目使用。它能智能识别设计文件里的组件,快速整理成风格库,让整个团队的设计保持一致,不用再担心样式混乱。同时,它支持多人协作和交互模拟,设计师在做原型、跟团队配合的时候都能更高效,减少重复操作,提升整体工作效率。
    适合谁用:团队项目、UX/UI设计师。
    image.png

选对工具真的能省太多事,原本要花几天甚至一周的原型工作,现在几小时就能搞定,让设计工作变得更轻松。说到底,要是想真正体验高效的AI原型设计,国内首选肯定是UXbot。不管你是产品经理、UI/UX设计师,还是开发协作团队,它都能帮你从文字或草图,快速生成高保真原型、自动整理设计文档,甚至直接输出代码,让设计交付又快又高效。

背景

随着全民健身意识的提升,传统健身房的运营模式面临着信息传递滞后、预约流程繁琐、数据统计困难等挑战。本设计旨在开发一款基于微信小程序的健身房轻量化服务平台,实现线上线下服务闭环。系统采用前后端分离架构,前端基于微信小程序开发,后端采用Java SpringBoot框架,数据库选用MySQL。系统主要包含用户端和管理端两大模块:用户端提供栏目浏览、在线注册、私教/团课/场地预约、个人中心管理等功能;管理端提供内容维护、预约规则设置、扫码核销、数据导出及权限管理等能力。测试结果表明,该系统有效提升了会员健身体验,优化了场馆运营效率,实现了服务质量的量化管理。

相关技术

微信小程序开发技术

介绍微信小程序框架特点(无需安装、触手可及)。
开发工具:微信开发者工具。

Java SpringBoot框架

介绍SpringBoot的快速开发特性、自动配置原理及其在后端服务中的优势。
开发环境:JDK 1.8+,IDEA。

MySQL数据库

介绍关系型数据库在存储用户信息、预约记录中的应用。
版本要求:MySQL 8.0+,字符集utf8mb4。

开发工具链

后端:IntelliJ IDEA
数据库管理:Navicat 16+
前端:微信开发者工具

系统需求分析

  • 会员角色:需要快速获取门店动态、学习健身知识、便捷预约教练/课程/场地、管理个人预约记录。
  • 管理员角色:需要发布资讯、灵活设置预约规则、核销用户到店、导出经营数据、管理用户账号。

功能分析

在这里插入图片描述

系统设计

  • 采用B/S架构与C/S架构结合(小程序端+C端管理入口)。
  • 前后端分离:前端通过API与后端SpringBoot交互。

数据库设计

  • 用户表:存储用户ID、微信OpenID、姓名、年龄、联系方式等。
  • 栏目内容表:存储文章标题、内容、类型(动态/干货/饮食)、发布时间。
  • 预约项目表:存储项目名称、类型(私教/团课/场地)、可预约时段、最大人数。
  • 预约记录表:存储用户ID、项目ID、预约时间、状态(已预约/已完成/已取消/已核销)。
  • 管理员表:存储账号、密码、角色权限。
CREATE TABLE `sys_user` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `openid` varchar(64) NOT NULL COMMENT '微信OpenID',
  `username` varchar(50) DEFAULT NULL COMMENT '用户昵称',
  `phone` varchar(20) DEFAULT NULL COMMENT '联系电话',
  `age` int(3) DEFAULT NULL COMMENT '年龄',
  `gender` tinyint(1) DEFAULT 0 COMMENT '性别 0:未知 1:男 2:女',
  `create_time` datetime DEFAULT CURRENT_TIMESTAMP COMMENT '注册时间',
  `status` tinyint(1) DEFAULT 1 COMMENT '状态 1:正常 0:禁用',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_openid` (`openid`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用户信息表';
CREATE TABLE `gym_project` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `name` varchar(100) NOT NULL COMMENT '项目名称',
  `type` varchar(20) NOT NULL COMMENT '类型:PRIVATE(私教), GROUP(团课), VENUE(场地)',
  `coach_name` varchar(50) DEFAULT NULL COMMENT '教练姓名(私教/团课用)',
  `max_capacity` int(11) NOT NULL DEFAULT 1 COMMENT '最大容纳人数/场次',
  `price` decimal(10,2) DEFAULT 0.00 COMMENT '价格',
  `description` text COMMENT '项目详情',
  `is_available` tinyint(1) DEFAULT 1 COMMENT '是否上架',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='预约项目表';
CREATE TABLE `gym_reservation` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `user_id` bigint(20) NOT NULL COMMENT '用户ID',
  `project_id` bigint(20) NOT NULL COMMENT '项目ID',
  `reserve_date` date NOT NULL COMMENT '预约日期',
  `reserve_time_slot` varchar(50) NOT NULL COMMENT '预约时段 如 14:00-15:00',
  `verify_code` varchar(32) NOT NULL COMMENT '核销码/二维码内容',
  `status` tinyint(2) NOT NULL DEFAULT 0 COMMENT '状态: 0-已预约 1-已核销 2-已取消 3-已过期',
  `create_time` datetime DEFAULT CURRENT_TIMESTAMP,
  `verify_time` datetime DEFAULT NULL COMMENT '核销时间',
  `verify_admin_id` bigint(20) DEFAULT NULL COMMENT '核销管理员ID',
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`),
  KEY `idx_status` (`status`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='预约记录表';
CREATE TABLE `sys_admin` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `username` varchar(50) NOT NULL COMMENT '账号',
  `password` varchar(100) NOT NULL COMMENT '加密密码',
  `role` varchar(20) NOT NULL COMMENT '角色:SUPER_ADMIN, NORMAL_ADMIN, VERIFIER(核销员)',
  `create_time` datetime DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_username` (`username`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='管理员表';

后端核心代码 (SpringBoot)

@Service
public class ReservationService {

    @Autowired
    private ReservationMapper reservationMapper;
    
    @Autowired
    private ProjectMapper projectMapper;

    /**
     * 用户发起预约
     * @param userId 用户ID
     * @param dto 预约参数包含项目ID、日期、时段
     * @return 预约结果
     */
    @Transactional(rollbackFor = Exception.class)
    public Result<Void> createReservation(Long userId, ReservationDTO dto) {
        // 1. 查询项目信息
        GymProject project = projectMapper.selectById(dto.getProjectId());
        if (project == null || !project.getIsAvailable()) {
            return Result.fail("该项目暂未开放预约");
        }

        // 2. 检查该时段剩余名额 (并发场景下建议使用数据库乐观锁或Redis锁,此处演示基础逻辑)
        int bookedCount = reservationMapper.countByProjectAndSlot(
            dto.getProjectId(), dto.getReserveDate(), dto.getReserveTimeSlot(), 0);
        
        if (bookedCount >= project.getMaxCapacity()) {
            return Result.fail("该时段名额已满,请更换时间");
        }

        // 3. 生成唯一核销码 (UUID + 时间戳)
        String verifyCode = UUID.randomUUID().toString().replace("-", "");

        // 4. 插入预约记录
        GymReservation reservation = new GymReservation();
        reservation.setUserId(userId);
        reservation.setProjectId(dto.getProjectId());
        reservation.setReserveDate(dto.getReserveDate());
        reservation.setReserveTimeSlot(dto.getReserveTimeSlot());
        reservation.setVerifyCode(verifyCode);
        reservation.setStatus(0); // 0: 已预约
        
        reservationMapper.insert(reservation);

        return Result.success("预约成功,请前往个人中心查看核销码");
    }

    /**
     * 管理员扫码核销
     */
    @Transactional(rollbackFor = Exception.class)
    public Result<Void> verifyReservation(String verifyCode, Long adminId) {
        GymReservation reservation = reservationMapper.selectByVerifyCode(verifyCode);
        
        if (reservation == null) {
            return Result.fail("无效的核销码");
        }
        if (reservation.getStatus() != 0) {
            return Result.fail("该预约状态不可核销 (当前状态:" + reservation.getStatus() + ")");
        }

        // 更新状态为已核销,记录核销人和时间
        reservation.setStatus(1);
        reservation.setVerifyAdminId(adminId);
        reservation.setVerifyTime(new Date());
        
        reservationMapper.updateById(reservation);
        return Result.success("核销成功");
    }
}
@RestController
@RequestMapping("/api/admin/export")
public class ExportController {

    @Autowired
    private ReservationService reservationService;

    /**
     * 导出预约数据 Excel
     * @param startDate 开始日期
     * @param endDate 结束日期
     * @param response HttpServletResponse
     */
    @GetMapping("/reservations")
    public void exportReservations(@RequestParam String startDate, 
                                   @RequestParam String endDate, 
                                   HttpServletResponse response) throws IOException {
        // 设置响应头
        response.setContentType("application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
        response.setCharacterEncoding("utf-8");
        String fileName = "健身预约数据_" + System.currentTimeMillis() + ".xlsx";
        response.setHeader("Content-disposition", "attachment;filename=" + URLEncoder.encode(fileName, "UTF-8"));

        // 查询数据
        List<ReservationVO> data = reservationService.getReservationList(startDate, endDate);

        // 使用 EasyExcel 写入流
        EasyExcel.write(response.getOutputStream(), ReservationVO.class)
                 .sheet("预约明细")
                 .doWrite(data);
    }
}

部署步骤

数据库部署:使用Navicat连接MySQL,运行初始化SQL。
后端部署:IDEA导入Maven项目,安装依赖,运行SmartWorkApplication.java。
前端部署:微信开发者工具导入项目,编译上传(或本地调试)。
初始化管理:使用默认超级管理员(admin/123456)登录,修改密码并添加子账号。

常见问题与解决方案

依赖包缺失问题(Maven install)。
数据库字符集不匹配问题(升级MySQL至8.0+)。
前后端端口不一致导致的连接失败。

UI设计

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

后台管理系统设计

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

git代码下载

点击下载

做产品设计时,画原型往往是最费时间的环节。从梳理需求、排版布局,到反复修改调整,产品经理和设计师得投入大量时间和精力。不过现在不一样了,借助AI生成APP原型工具,几分钟就能做出带交互逻辑的原型页面,省下来的时间能专注做更核心的事。今天就给大家整理了5款目前市场上好用又成熟的AI原型设计工具,不管你是产品经理、UI设计师,还是独立开发者,都值得收藏起来备用。

  1. Uizard
    这是海外一款很资深的AI设计平台,特别适合没有设计基础的人,用来做早期需求验证。它最亮眼的功能就是“草图识别”——你可以在纸上画一个简单的APP线框图,用手机拍下来上传,Uizard的AI就能自动把它转换成可编辑的数字版原型。另外,它的Autodesigner功能,也能通过自然语言,直接生成多页面的APP高保真原型流,操作很简单。
    image.png
  2. UXbot
    这是一款集高保真网页和应用界面设计、交互式原型以及Web、iOS、Android前端代码制作于一体的平台的工具。只需要输入一句话,UXbot就会自动学习目前市面上所有的UI页面,并生成视觉超精美的UI设计界面。而且她生成的是层次清晰、逻辑连贯且可交互的UI页面。(例如输入:生成一个app商城的UI界面,要求有有首页、商品页、下单、个人中心等)生成后可随意调布局、改样式、换图文,操作简单,非专业设计师也能上手,贴合实际需求。
    image.png
  3. Create.xyz
    这款工具的核心是通过自然语言,生成完整的交互原型。和那些只生成静态界面的工具不一样,它更侧重生成可用的交互组件。你用日常话描述APP功能就行,比如“做一个待办事项列表,点击能打勾并划掉已完成的内容”,AI就会直接生成带这个逻辑的交互原型,特别适合用来快速验证MVP(最小可行性产品),或者做功能演示。
    image.png
  4. Appy Pie AI
    Appy Pie是海外知名的无代码平台,它内置的AI App Generator,能通过简单的文本提示,直接生成APP原型框架。它的目标用户主要是业务人员或创业者,你只要描述自己的业务模式,比如“我想做一个宠物寄养预约的APP”,它就会自动规划需要的功能模块,生成对应的原型页面。虽然视觉定制化程度不如专业设计工具,但用来梳理早期业务逻辑和页面层级,能给你不错的参考。
    image.png
  5. Framer AI
    Framer是海外很火的交互原型和建站工具,加上AI功能后,原型生成能力更厉害了。在Framer里输入你的应用构思,AI几秒钟就能生成一个结构完整的响应式页面,还会自动搭配好色彩主题和排版布局。它最突出的优势是微交互特别流畅,要是你需要给客户展示动效丰富、逻辑顺畅的APP高保真原型,用它能省很多手动调参的时间。
    image.png

上面这5款AI生成APP原型工具,在草图识别、高保真视觉、代码生成等方面各有优势。如果你想找一款即真正懂国内业务场景的全能型工具,强烈推荐你试试UXbot。
它不仅能用中文对话快速生成可编辑的原型页面,还能无缝衔接你平时的工作流,真正让AI帮你省时间、提效率。

事情是这样的 周末电动车后鼓刹坏了,一直显示正在刹车,用手往前顶才能正常骑行。

去了第一个雅迪店,雅迪店说我这个车把摔断了,需要换把手 90 元。直觉告诉我有问题,这跟把手有什么关系?

然后我就去找了旁边不远处露天的修车大爷他说你这个是闸线松了,然后鼓刹里边锈死了,导致的。
经过研究诊断,发现闸线那头也锈死了,拧不下来,最终换了一条闸线和鼓刹总成模块,花费 110 元。但是我在 pdd 搜索 发现这两个配件只需要不到 20 块就能买一套,花费时长 20 分钟搞定。

35 失业后去修电动车是不是也不错?感觉月入过万比较容易

此乃鼓刹总成 我一开始以为很贵 比较看着还比较值钱。。

最近花了时间搞了下 nas 的电源和机箱,机箱废了我好大力气。想分享一下。
原文链接

https://blog.luluhome.site/p/nas-%E5%8D%87%E7%BA%A7%E5%91%8A%E5%88%AB-50w-%E5%BE%85%E6%9C%BA%E5%8A%9F%E8%80%97/


机箱部分

机箱我挑了很久,开始选择了银欣 CS382 。它拥有 8 个热插拔盘位,而且外观紧凑,散热设计也非常合理。 主要是我的目前硬件需求是 ATX 电源+MATX 的主板。

选到最后基本只有御夫座和银欣 CS382 、CS380 还有 SG02,珍宝系列支持。

其实 Nas 不是我的刚需,但多硬盘肯定是要的。热拔插也不是特别需要,有那是更好,这次下了血本,直接买了全新的 CS382.

直接看视频,我也不是小白脸,以前还有健身的,我竟然拔不动,这热拔插,我尼玛手疼死了。买之前到处看到银欣机箱铁皮薄,不值价钱,我不信,毕竟大品牌,拿到手之后我服了,真的太垃圾了做工,用料一点都不值 800 快,顶多 300 。就为了他那块背板吗?太亏了。品牌形象打打折扣。

然后说说内部结构,官方明确支持 matx 主板,我的是技嘉的 B760M 小雕,主板电源根本就没法插,和硬盘笼卡在一块了。机箱内部紧凑,铁皮质量辣鸡,做工不好。

被 CS382 坑了以后,天天上班不再心思,一直看评测视频,其实我的需求里,这个机器不是纯 Nas ,我也用不到那么大的 8 盘位,顶多 4 盘位,此外我的主板也只有 4 个 SATA 。所以我更想要的是一个有 4 盘位,支持 MATX+ATX 的机箱,而不是 Nas 机箱,区别就是带热拔插。热拔插一年又有几次能换? 主要拿来跑 vm ,跑点 docker 才是我经常用的。我拿它来做开发环境,装 openclaw 。做软路由。

御夫座

御夫座我看了很多视频,确实不错,颜值,大小,matx+atx ,存储空间 6 盘位,都挺好。准备下手了,但我是一个爱捡垃圾的,我还是再问我自己,需要 500 多的机箱吗?这个机箱是值 500 的,但我需要这样的 Nas 机箱吗?还是只是要一个多盘位的塔式就行了呢?所以没有下手,继续在观望。

恩杰 H440

有天晚上,我正在海鲜市场挑菜,突然一款机箱映入眼前,虽然没看到背面,我猜测一定有竖着的一排硬盘仓,我立马去查了下资料,果然,原生自带 5 个盘位。隔音棉,做工优秀,质感,外观颜值,内部空间,双 USB3.0 。外加这个闲鱼价格,天呐,被我赶上狗屎运了,速速拿下。当然后来发现,基本都是二手百元左右。

1|30%
离我上班很近,兴奋的不行。当晚就去拿了。到手灰尘很多,花了一天时间好好清理了一下,终于恢复了原本的面貌。

这颜值、这触感、这做工,背后的风扇集成板我都没见过,什么科技啊。开机按钮,这 Logo 大灯。这隔音棉,这防尘网,太棒了辣。 无敌。心满意足。

速速装机。点火,起飞。“嗯?”开机键坏了。我擦,赶紧试了一下 Rest 键,呼,还好是好的。嗯,满意,舒服了,我看着它运行了很久,心里真的很高兴,我可以花钱去买现成的机箱,但是这种捡到宝贝,自己折腾的感觉实在是太棒了。
1|30%

1|30%

1|30%

1|30%

总结

这次升级 Nas 的电源和机箱是我很久之前就想做的,以前的实在是太垃圾了。最后去了解了下历史,恩杰这个牌子,以前高端产品了,不知道现在怎么没落了,从我拿到机箱我就知道真的做工很棒。唯一失落是,开机键坏了。体积有点大。但人不能既要又要。我已经很满意这个了。 后来去了解了下,以前的机箱都重存储的,所以硬盘仓很多,现在都重显卡,海景房,也就舍弃了硬盘仓了。

如果你和我有一样的需求,ATX+MATX ,多硬盘仓的需求。热拔插不是必要的,不如看看这些过去老式机箱。

Uber 工程团队宣布开源uForwarder,这是一款面向Apache Kafka的推送式消费者代理,用于提升分布式微服务间高吞吐事件流的可扩展性、效率与运维管控能力。uForwarder 作为 Kafka 与消费者服务之间的中间层,以 gRPC 驱动的推送接口替代了直接的消费者客户端实现。该系统旨在简化消费者逻辑、集中式管理偏移量、隔离工作负载,并为事件队列提供内置的延迟处理能力。

 

uForwarder 的诞生源于优步内部的 Kafka 部署场景,它支撑了超过 1000 个下游消费者服务,每日处理数万亿条消息与 PB 级别的数据。标准 Kafka 的消费者组在此规模下存在诸多局限,包括分区管理复杂、跨服务语言支持不一致以及运维开销大。直接使用消费者客户端需要每个服务自行实现偏移量管理、重试逻辑与延迟机制,这会增加队头阻塞的概率并降低资源利用率。

宏观层面的消费者代理架构(来源:优步的博客

 

此前的内部消费者代理主要面临四大挑战,也就是,当消息因载荷大小限制或服务实例无效而投递失败时,顺序分区处理可能阻塞,从而产生队头阻塞;运行数千台代理服务器支撑消费者服务被证明效率低下,硬件资源消耗不均;消费者服务通常实现自定义的延迟语义,增加了服务复杂度;生产与非生产环境或不同区域之间的工作负载隔离,要么需要大量 Topic,要么需要复杂的负载均衡配置。

 

uForwarder 引入了上下文感知路由,以提升工作负载隔离与投递精准度。Kafka 消息头将路由元数据带入下游 gRPC 调用,允许在基础设施层做决策,而非应用层过滤。负载均衡器根据区域、租户或环境,仅将事件投递给匹配的消费者实例,减少无效流量并简化消费者的逻辑。

上下文感知路由(来源:优步的博客

 

乱序提交追踪器通过避免分区停滞来强化偏移量管理。它独立监控提交进度,并根据配置阈值检测阻塞位置的偏移量。问题消息会被重定向至死信队列,同时提交指针继续处理,避免队头阻塞并保持各分区吞吐稳定。

 

消费者自动重平衡器持续评估各工作节点的 CPU 使用率、内存压力与吞吐量,基于实时指标重新分配分区以实现高效负载均衡。流量峰值时快速扩容以减少积压,流量下降时平缓缩容以避免不稳定,从而提升整体资源利用率与性能稳定性。

 

DelayProcessManager 支持分区级暂停与恢复控制,实现更细粒度的回压(backpressure)处理。当依赖不可用或被限流时,仅缓冲阻塞的分区,而非停止整个消费者;其他分区会继续正常处理,在保持吞吐、减少全局变慢的同时,简化服务内部的延迟处理逻辑。

消费者代理工作者拉取线程中的延迟处理(来源:优步的博客

 

优步表示,uForwarder 已经成为其内部主流的 Kafka 消费方案,现已在GitHub上开源。该架构实现了更好的工作负载隔离、更低的消费者延迟、更高的硬件利用率,同时简化了微服务中的消费者逻辑。团队正在扩展队列容量,并通过将偏移量回退到最新位置、同时使用副消费者(side consumer)处理延迟数据来解决积压问题。项目还将原生支持Protobuf,让服务可直接接收结构化的消息。

 

查看英文原文:Uforwarder: Uber’s Scalable Kafka Consumer Proxy for Efficient Event-Driven Microservices

不知道这里有没有玩 IHG 常旅客计划的道友。在这么多国际酒店集团中,IHG 应该是对中国最友好和重视程度最高的一个,在中国的覆盖率和性价比都挺不错的。

曾经有人在我的博客上留言想要一份 IHG 的全国酒店列表,最近有空就花了点时间整理出来了一份。

列表在这里:
https://docs.qq.com/sheet/DRk5aYnpsbmRmQ3NU

我也不知道这份列表有什么作用,如果有人真的有这个需求,我会持续更新这份列表。

根据这份列表,我做了一些简单的统计:

1 、大中华区酒店总数

目前整个大中华区共有 17 个品牌 963 家 IHG 酒店。

2 、各大城市酒店数量

  • 上海:84 家
  • 成都:47 家
  • 北京:39 家
  • 西安:33 家
  • 苏州:32 家
  • 杭州:28 家
  • 深圳:27 家
  • 重庆:23 家
  • 青岛:23 家
  • 南京:21 家
  • 广州:18 家
  • 台湾:18 家
  • 长沙:15 家
  • 郑州:15 家
  • 昆明:14 家
  • 天津:14 家
  • 武汉:14 家
  • 无锡:14 家
  • 三亚:13 家
  • 佛山:12 家
  • 厦门:11 家

3 、各品牌酒店数量

  • 智选假日:421 家
  • 假日:154 家
  • 皇冠假日:138 家
  • 洲际:67 家
  • 英迪格:40 家
  • voco:37 家
  • 华邑:27 家
  • 逸衡:24 家
  • 套房假日:13 家
  • 洲至奢选:11 家
  • 假日度假:10 家
  • 丽晶:6 家
  • 金普顿:5 家
  • 洲际度假村联盟:3 家
  • Atwell Suites:3 家
  • Garner:1 家
  • 六善:1 家

上次介绍了中转站的商业模式,大家反馈良好,本周继续抽奖
https://cn.v2ex.com/t/1196011

夜间低峰期不定期开放 claude/codex 免费渠道,白天尽量保证大家 coding 稳定

上周抽奖结果公示,https://cn.v2ex.com/t/1196438


老办法,点击下方获得自己的 id 回帖抽奖,本周五上证指数收盘指数作为随机数种子,hash 后随机抽取 10 楼 作为中奖用户

欢迎大家加入 AI 创业交流群,交流创业想法。
利用 AI 创业一起搞副业,养殖龙虾🦞赚大钱

赚钱的思路你来想,便宜的 token 群主帮你找


在数字化转型纵深推进的2026年,项目管理工具已成为企业降本增效的核心引擎。据Gartner《全球项目管理趋势报告(2025)》显示,高效工具链可帮助组织平均降低18%的运营成本,并提升25%的跨团队协作效率。本文基于真实场景测试,聚焦7款市场新锐工具,从用户思维平台价值双视角,深度解析其核心优势,助您精准匹配团队需求,实现“工具即生产力”的升级目标。

一、禅道(Zentao):开源生态的敏捷实践者

作为国内开源项目管理标杆,禅道以轻量化部署与全流程覆盖见长,特别适合预算敏感型团队。

  • 开源免费,成本友好:基础版完全开源,团队无需支付许可费,中小型企业可节省30%以上工具成本。
  • 全流程集成,减少碎片化:需求、开发、测试、文档一体化管理,避免多系统切换导致的效率损耗。
  • 自定义工作流,适配多元场景:支持灵活配置Scrum/Kanban流程,从产品研发到运维均可快速适配。
  • 社区驱动,学习成本低:拥有超10万开发者社区,官方文档与实战案例丰富,新成员1天内可上手。

二、Jira:敏捷开发的工业级标杆

Atlassian旗舰产品,以深度敏捷支持与企业级扩展性著称,适合规模化技术团队。

  • 敏捷模板全覆盖:内置Scrum、Kanban、XP等模板,开箱即用,敏捷实践效率提升40%。
  • 高度可定制化:通过Jira Automation实现任务状态流转、提醒规则等逻辑自定义,贴合复杂业务。
  • 生态集成深度:与Bitbucket代码库、Confluence文档库无缝联动,构建端到端开发闭环。
  • 企业级安全与合规:支持SAML单点登录、数据驻留策略,满足金融、医疗等强监管行业需求。

三、Asana:任务驱动的协作可视化平台

界面简洁、逻辑清晰,主打任务管理与跨部门协同,适合营销、设计等创意团队。

  • 直观任务视图,减少认知负荷:列表、看板、时间线多视图切换,关键任务一目了然。
  • 智能时间线规划:拖拽式甘特图支持依赖关系设置,项目进度预判准确率提升35%。
  • 自动化工作流引擎:自动分配任务、触发提醒(如“需求评审超期3天”),减少70%人工跟进。
  • 跨团队协作中心:内置评论、@提及功能,会议纪要直接关联任务,沟通效率倍增。

四、Trello:极简主义的看板管理专家

以卡片式操作为核心,零学习门槛,适合轻量级项目或个人任务管理。

  • 看板界面,直观易用:卡片=任务,列表=阶段,新用户无需培训即可上手操作。
  • 灵活卡片系统:支持附件、检查项、截止日期等属性,满足从待办事项到复杂项目的需求。
  • 插件生态丰富:集成Google Calendar、Slack等100+工具,快速扩展功能边界。
  • 移动端体验优化:iOS/Android端响应速度极快,通勤途中可完成任务更新,碎片化时间利用率提升50%。

五、Monday.com:可视化驱动的流程引擎

通过高度自定义仪表盘,将抽象流程转化为可量化数据,适合销售、运营等数据敏感型团队。

  • 动态仪表盘,实时洞察:拖拽生成进度看板、资源热力图,关键指标一屏掌握。
  • 自动化规则引擎:设置“任务完成→自动通知客户”等规则,减少人工干预。
  • 第三方应用集成广:与Salesforce、Zoom等500+应用打通,构建专属工作流。
  • 用户友好设计:无代码配置界面,业务人员可自行调整流程,培训成本降低60%。

六、ClickUp:全能型效率中枢

定位“一站式工作平台”,覆盖任务、文档、时间追踪等全场景,性价比突出。

  • 全能功能整合:任务管理、文档协作、时间追踪、目标设定内置一体,减少工具切换。
  • 无限自定义视图:支持列表、看板、日历、表格等10+视图模式,适配任何工作流。
  • 内置沟通中心:评论、@提及、文件共享集成在任务内,避免邮件/即时工具碎片化。
  • 免费版功能强大:基础功能全覆盖,企业级团队可节省25%以上订阅支出。

七、Wrike:数据驱动的项目规划专家

以精准规划与深度分析见长,适合研发、咨询等需强计划性的团队。

  • 智能甘特图规划:自动计算任务依赖与资源冲突,项目里程碑达成率提升28%。
  • 实时协作反馈:任务评论区支持@提醒与文件附件,需求变更响应速度加快50%。
  • 多维报告分析:生成资源利用率、进度偏差等报表,为决策提供数据支撑。
  • 全球化支持:多语言界面+时区适配,助力跨国团队无缝协作,沟通成本降低35%。

降本增效方案:从工具选择到价值落地

本次测评揭示核心规律:工具的价值不在于功能堆砌,而在于匹配团队基因

  • 中小团队(5-50人):优先选择禅道ClickUp,开源/免费方案降低启动成本,自定义能力快速适配业务。
  • 敏捷技术团队JiraAsana提供深度敏捷支持,减少流程冗余,开发周期缩短20%。
  • 跨部门协作场景Monday.comWrike的可视化与自动化能力,使会议效率提升45%,决策更精准。
用户思维关键点:避免“为工具而工具”,应聚焦“解决什么痛点”——例如,若团队常因需求模糊导致返工,禅道的全流程集成或Asana的时间线规划将是优先选项;若目标是提升客户交付速度,Wrike的甘特图与实时反馈更契合。

在2026年竞争加剧的市场中,项目管理工具已从“辅助软件”升级为“战略资产”。本文7款工具均通过实战验证,无贬低、无偏见,仅呈现其真实优势。选择时请回归本质:工具是杠杆,团队是支点。当您用对工具,降本增效将从口号变为可量化的日常成果——这正是数字化转型的核心价值所在。

在建设网站或部署企业应用时,我们通常习惯为域名配置SSL证书以实现HTTPS加密。然而,在不少实际场景中——例如企业API接口、内部管理系统、或是纯IP访问的测试环境——我们往往需要通过外网IP地址直接访问。面对这种情况,直接在浏览器地址栏输入IP加端口,得到的往往是令人不安的“连接不安全”警告。

为什么IP地址也需要SSL证书?

IP SSL证书,顾名思义,就是绑定公网IP地址而非域名的数字证书。它能够为通过IP直接访问的服务端数据传输进行加密,防止数据被窃听或篡改,同时消除浏览器的“不安全”提示,建立访问者的基本信任。这对于一些没有域名、或者为了安全考量不希望暴露域名的业务系统来说,至关重要。

为什么选择JoySSL申请IP证书?

市面上的许多传统证书厂商虽然提供IP证书,但往往价格昂贵(动辄上千元一年),且申请流程复杂。而JoySSL作为近年来崛起的国产数字证书品牌,具备以下几个显著优势:

  1. 支持免费试用:JoySSL提供了免费版的IP证书,非常适合个人开发者或小微企业进行测试和低成本部署。
  2. 数据不出境:对于政府、教育、医疗等敏感领域,JoySSL作为国内CA,验签和数据均在国内完成,符合网络安全法规要求。
  3. 全品牌支持:提供从DV(域名验证,适合IP)到OV(企业验证)等多种类型的IP证书选择。

手把手教学:如何申请JoySSL外网IP证书

为你的外网IP配置SSL证书,只需以下四个简单步骤:公网IP证书申请入口

第一步:注册账号并获取权限

首先,访问JoySSL的官方网站。点击右上角的“注册”按钮,创建一个新账户。请注意,为了获得免费IP证书的申请资格,在注册过程中务必填写特定的注册码。根据最新的官方指引,你可以填写注册码230970,以便在后台获取免费IP证书的申请权限和相关优惠。

第二步:选择IP证书并提交申请

登录JoySSL后台,在证书产品列表中找到“IP SSL证书”或“免费体验版”入口。点击申请后,系统会要求你填写需要加密的公网IP地址以及相关的联系信息。请确保填写的IP地址准确无误,且你对该IP拥有管理权限。

第三步:完成IP所有权验证

这是确保证书只能由合法持有者申请的关键步骤。CA机构需要验证你对这个IP地址的控制权。JoySSL通常会提供文件验证方式:
你需要登录到该IP地址指向的服务器,在网站根目录下创建指定的验证文件。CA机构通过公网访问该文件内容来确认你的管理权。完成配置后,点击“验证”按钮,通常审核会在几分钟到几小时内完成。

第四步:下载证书并部署到服务器

验证通过后,证书便会签发。你可以登录JoySSL账户下载证书文件包,其中包含了适用于不同服务器(如Nginx、Apache、IIS)的证书文件。

很多人,经常一坐就是大半天,腰和颈椎都受不了。试过一些番茄钟工具,要么太重,要么提醒太容易忽略。于是自己写了一个,分享给大家。

主要功能:

  • 菜单栏常驻,不占 Dock ,轻量运行( CPU 接近 0%)
  • 自定义工作/休息时长
  • 多种提醒方式:菜单窗口提醒、浮窗、全屏强制
  • 休息时检测键鼠操作,有动作就暂停倒计时,确保真正离开
  • 每日目标 + 连续打卡 + 11 枚成就徽章
  • 7 天/30 天数据统计
  • 中英文支持
  • Apple Silicon / Intel 均支持

截图:

https://cdn.jsdelivr.net/gh/lifedever/images@master/uPic/2026/03/eccBkg.png
https://cdn.jsdelivr.net/gh/lifedever/images@master/uPic/2026/03/CS2026-03-09-12.03.49@2x.png
https://cdn.jsdelivr.net/gh/lifedever/images@master/uPic/2026/03/CS2026-03-09-12.04.26@2x.png

下载地址: https://github.com/lifedever/health-tick-release/releases/latest

macOS 14+ 可用,完全免费。首次打开需要去 系统设置 → 隐私与安全性 → 仍要打开。

欢迎试用,有建议可以提 issue: https://github.com/lifedever/health-tick-release/issues

演讲嘉宾|李志宇 博士

策划|QCon 全球软件开发大会

随着大模型在企业和行业场景中持续落地,“记忆”正在成为继参数调优和上下文工程之后的下一个工程化核心。短时遗忘、知识碎片化、跨任务信息无法留存等问题,正在限制大模型的个性化、推理链延展与持续演化能力。

本文整理自记忆张量 CTO 李志宇博士在 2025 年 QCon 全球软件开发大会(上海站)的演讲分享。志宇博士结合他多年的研发与落地实践,系统剖析大模型记忆工程的核心技术:记忆分层管理、多粒度调度、可信更新与安全治理,并展示这些技术在金融、工业、知识管理等业务中的应用效果。通过对架构设计、实现细节和案例经验的讲解,帮助开发者与架构师全面理解如何构建具备长期留存与动态调度能力的“有记忆的 AI”,以及它在未来产业智能化演进中的角色与挑战。

预告:将于 4 月 16 - 18 召开的 QCon 北京站设计了「记忆觉醒:智能体记忆系统的范式重塑与产业落地」专题,旨在重新定义企业级记忆系统的未来——聚焦非显式偏好捕捉、记忆自主演化与生命周期管理等前沿方向,探索其在高端客服、个性化助理、企业决策等场景的深层价值。敬请关注。

以下是演讲实录(经 InfoQ 进行不改变原意的编辑整理)。

大模型性能缩放曲线的演进历史

我们公司名为“记忆张量”,单从名字便可看出,我们聚焦的是“记忆增强”——或者说“记忆优化”这一方向。去年十一月刚刚成立,不久前刚完成近亿元人民币的天使轮融资。

之所以选择“记忆”作为主攻点,根本原因在于我们判断:在大模型的演进史中,记忆将成为与 MCP 工具并列的下一个关键增强维度。2023 年以前,业界普遍通过扩大数据规模、参数量和训练量来换取性能提升,由此催生了千问、ChatGPT 等代表性范式。进入 2024–2025 年,人们逐渐发现,单纯堆参数与规模带来的收益开始递减,于是转向“后训练”与“推理增强”,DeepSeek-R1 便是这一阶段的典型产物。当后训练也逼近瓶颈时,Sam Altman 等人开始追问:下一步的突破口究竟在哪里?在 GPT-4 的更新日志里,OpenAI 把“全局记忆”列为令团队“兴奋到失眠”的新功能;而在 GPT-5、GPT-6 的路线图中,“记忆”与“个性化”被反复提及,被视为大模型面向应用场景的核心变量。

从实践层面看记忆增强的必要性

若把大模型业务服务做一次抽象,可自下而上划分为:底层的数据库存储与基础 AI 引擎;中间的 MCP 增强、知识库增强;最上层的业务逻辑。再将视角切换到单个用户与大模型的交互流程,就会发现其中同时存在动态与静态两类信息。所谓动态信息,指随每次查询而变化的个性化内容:用户临时贴入的参考材料、在 prompt 里约定的偏好等。查询一旦发出,模型先进行意图理解与任务规划,再进入信息增强链路——MCP 调用各类动态工具,并返回执行结果、校验信息、汇总结果;与此同时,知识库从预先处理好的企业静态知识中抽取内容,为模型提供补充。最终,响应结果既包含推理过程(think 部分),也包含知识性内容,以及用户对本次回答的点赞或点踩。

若沿着时间轴把记忆类型进一步展开,其复杂度远超直觉。假设我们在第 6 轮对话里需要引用一个月前第 2 轮的内容,又在第 5 轮里引用第 1 轮的细节,就必须保证用户在不同场景下都能准确召回、并同步更新已发生变化的记忆。再把视角拉远:大模型可能在多轮会话、多用户、多 Agent、多 App 之间穿梭,动态信息的量级与管理难度呈指数级上升。因此,我们希望在开发层面屏蔽这些复杂性,让应用开发者无需深陷动态信息的泥沼,从而显著降低落地成本。

大模型记忆增强层的实现路径

顺着这一思路,我们把大语言模型、Agent、业务流程与用户之间抽象出一个“记忆操作层”。要实现记忆增强,业界目前大致有两条路径。

第一条是模型增强范式:从模型架构与训练范式本身入手,让训练后的模型对记忆具备更强的理解与编排能力。我们团队早期便尝试以记忆分层的方式建模,以提升记忆管理与唤起的效率;近期,字节跳动等机构也尝试利用强化学习来优化记忆使用范式,重点解决短期记忆与长期记忆的协同问题。这一路线可称为“基模驱动”的记忆优化。

第二条则是面向应用层的工程实践:在不动基座模型的前提下,通过通用大模型、提示工程(prompt engineering)与 Agent 工作流来模拟人类对记忆的管理过程。早期项目如 MemGPT、Mem0、Zep 等开源框架均循此思路;近期 Memories.AI 更进一步,从多模态记忆角度拓展了记忆管理框架。除这些偏开源或商业化的团队外,也有不少学术团队围绕记忆工程中的单点创新提出独立方案。

若将两条路线并置比较,二者几乎处于对立的两极。以基模为核心的方案,研发周期长、投入高;然而一旦在模型层面把记忆问题真正吃透,其性能天花板也最高,后续扩展几乎没有硬约束。反之,纯应用层的做法可在极短时间内搭出第一版记忆系统,且横向扩展灵活;但依赖通用基座模型与提示工程,往往很快触到性能瓶颈——从 85% 再往上走到 90%、95%,每一步都异常艰难。

在我们看来,真正可行的路线是把“基模驱动”与“应用驱动”融合为一。具体做法是:在系统关键节点训练一系列面向记忆操作与记忆理解的小型专用模型,同时保留一套能力更强的主模型来执行整体记忆编排。这样,开发者无需深陷复杂的编排与理解细节,成本被大幅压缩。一句话概括:模型决定上限,应用夯实下限。我们坚持由模型驱动去攻克原创理论与核心算法,确保开源框架随版本迭代持续抬升性能天花板;同时,团队里既有来自高校的理论研究者,也有曾任职阿里巴巴、美团的应用算法工程师,因此在设计整套系统时,我们同样关注业务适配性与通用性,力求让前沿成果能够平滑落地到真实场景。

记忆增强层落地需要做什么?

若要把记忆管理系统真正搭建并持续优化,从系统到算法层面,需要攻克的环节远比表面看起来繁复。首先,记忆一旦进入系统,就要完成抽取、组织与检索三步闭环:抽取必须精准,组织必须高效,检索则要在极低冗余与极高精准之间取得平衡。紧接着,当信息动态更新时,必须确保用户曾提及的实体与细节被准确刷新,版本历史被完整保留,而检索时又能即时返回最新状态。最后,记忆还要在多方之间顺畅共享——不仅跨会话、跨 Agent,也跨企业组织内的不同用户。

这些环节里,有些难题仅靠通用模型几乎无解。以记忆抽取为例,通用模型常出现幻觉,既可能捏造事实,也可能把 A 用户的记忆错放到 B 用户名下;而在记忆更新阶段,幻觉同样高发,稍不留神就会让旧版本与新版本混为一谈。因此,我们必须引入更精细的机制,才能在这些关键节点上守住准确性与一致性。

MemOS 的核心设计思路

既然我们给自己定的目标是打造一套“记忆操作系统”,至少也得是 Tiny-OS 级别,那就必须像传统操作系统那样,把整体框架拆成清晰的分层。从硬件到内核再到应用,每一层都对应记忆场景里的关键问题:

  • 最底层相当于“存储硬件”,要解决的是记忆如何被高效共享与持久化;

  • 中间的内核层,必须保证全局记忆的读写效率足够高;

  • 最上面的应用层,则要把复杂的记忆操作流程对开发者完全屏蔽,让他们用起来足够顺滑。

顺着这个思路,我们设计了五层记忆管理框架:存储、治理、调度、应用、解码。其中,治理层与调度层是市面上现有框架极少单独拆出的两层。很多人会把记忆直接塞进向量库或图数据库,我们却坚持为记忆量身定制存储层——因为我们相信,当大模型能力继续跃升、终端入口趋于统一后,传统带 GUI 的 App 形态会逐步消失。

不妨以“时间管理”为例:今天我们要先下载一个时间管理 App,再手动录入日程;稍智能的软件能帮我们排期并提醒。但在不远的将来,人们可能不再下载 App,而是直接获取一个“时间管理记忆体”。这个记忆体已经把时间管理所需的推理逻辑与细节知识打包完毕,安装到本地通用模型后,两者联合推理即可从对话里自动抽取时间要素、生成排程,效率远高于通用模型本身。

因此,我们把“记忆体”定义为可独立打包、下载、安装的最小单元,既可以是个人经验资产,也可以是企业知识沉淀的载体。明年年中,我们将上线“记忆交易市场”,思路类似今天的 App Store:开发者用我们提供的 SDK 把企业知识封装成记忆体并上架;终端用户按需下载安装,即可在“最后一公里”显著提升业务效能。

MemOS 的系统框架

既然记忆已被视作个人最核心的经验资产,治理就必须在一开始就被提到最高优先级。在即将发布的 1.0 版本中,我们把记忆全生命周期管理、幻觉评估框架、水印、权限与隐私控制全部内建,力求让每一份记忆资产从诞生起就保持稳健与可信。

再往上是调度层。之所以单独设立“记忆调度”,是因为我们坚持记忆必须分层管理——这直接源于 2023 年 11 月启动的记忆分层基座模型研究。从建模角度看,明文记忆、激活记忆与参数化记忆在读写效率上差异显著:明文记忆只需改写文本即可瞬间入库;参数化记忆则依赖继续训练或后训练,写入成本极高,但读取极快;激活记忆介于两者之间,读写相对均衡。基于这一分层,我们按使用场景与访问频率动态建模,确保全局读写效率、时效性与首 token 时延同时最优。

为支撑这套调度框架,我们配套实现了消息队列、动态埋点与主动预测算法,使系统始终面向 memory-ready 状态:用户随时提问,背后的 Memory Cube 都已处于最佳形态,时延被压到最低。

最上层是 MemOS 开源框架与服务平台。对外我们提供两类标准服务:

  • 记忆即服务(Memory-as-a-Service):接收 Query 后,返回回答该 Query 最相关的记忆片段;

  • 记忆 + 推理即服务(Memory+Inference-as-a-Service):在底层完成推理,用户只需指定模型,系统即返回融合记忆后的完整答案。

以上便是 MemOS 1.0 的整体设计现状。

Memos 的核心机制一:记忆分层建模

围绕当前框架,我想分享三点在实践中被反复验证、值得特别注意的经验:记忆分层、记忆调度,以及记忆脑图的信息组织方式。它们共同构成了我们整套系统的核心设计思想。

首先是记忆分层。自 2023 年 11 月我们启动记忆分层大模型研究以来,业界虽频繁提及“分层”,但多数仍停留在“长期 / 短期”或“明文工作记忆”这类粗粒度划分。我们认为,从基础模型理论出发,记忆应被系统性地划分为参数化记忆、激活记忆与明文记忆,而明文记忆内部还可进一步细分。之所以必须如此,根源在于人脑的记忆形成机制。

人脑首先接受感官刺激——听觉、视觉、触觉等。只有“重复且有效”的刺激才会留下痕迹。所谓“有效”,是指该刺激与当前任务或兴趣高度相关。例如,普通人对路边落叶视而不见,环卫工人却会敏锐捕捉。若所有信息无差别入库,大脑将因容量有限而崩溃。

被筛选出的信息先进入短期记忆。短期记忆自带遗忘机制;若再经重复刺激,便沉淀为长期记忆。长期记忆又分两类:外显记忆——可被语言提取,如“昨晚看过的电影情节”;内隐记忆——通过行为表现,如程序员盲打键盘的指法。长期记忆若长期不被调用,也会被主动遗忘,以维持系统效率。

人脑这套“刺激—筛选—巩固—遗忘—再学习”的闭环,为我们设计记忆系统提供了完整范式:刺激阶段对应“选择性写入”,降低冗余;短期记忆对应“激活记忆”,追求读写速度;长期外显记忆对应“明文记忆”,便于检索与共享;长期内隐记忆对应“参数化记忆”,通过继续训练微调,读取快、写入慢;遗忘与再学习机制则对应“动态调度与回收”,确保全局性能最优。

围绕当前记忆系统设计的实践,我想分享三点体会,它们共同构成了我们框架设计的核心考量:记忆分层的必要性、记忆调度的技术原理,以及“记忆脑图”这一组织方式的独特价值。

记忆分层绝非简单地把信息划分为“长期”与“短期”,或套用认知心理学中 working memory 的概念。从大语言模型的理论视角出发,记忆应当被系统地拆分为三层:参数化记忆(模型权重)、激活记忆(推理过程中的中间状态)与明文记忆(可显式读取的外部存储)。其中明文记忆又可进一步细分为外显与内隐两类,这一划分直接对应人脑的记忆形成机制。

人脑的记忆始于感官刺激。视觉、听觉、触觉等信号若要在神经层面留下痕迹,必须满足“重复且有效”的条件:重复保证突触可塑性的持续强化,有效则意味着刺激需与个体目标或情感显著相关。以日常场景为例,路人往往忽略脚边落叶,而环卫工人因职责所在,会反复接收并处理同一类视觉信号,落叶遂成为其短期记忆的一部分。若此类信息未经筛选地全部入库,有限的脑容量将迅速耗尽;因此人脑在编码阶段即执行严格的过滤。

短期记忆并非终点。它自带遗忘曲线,只有通过再次复述或情境复现,才能被巩固为长期记忆。长期记忆又可区分为外显与内隐:前者可被语言化,如“昨日观影内容”;后者则表现为程序性技能,如程序员对键盘键位的肌肉记忆。值得注意的是,长期记忆亦遵循“用进废退”原则——久未调用的记忆会被主动遗忘,以维持检索效率。

借鉴人脑的这一套机制,我们便会发现其中有许多值得汲取的要点:长期记忆中的遗忘机制、学习与进化机制,短期记忆在效率上的优势,以及刺激阶段选择性过滤所带来的功耗优势,皆可为我们构建记忆分层与记忆管理系统提供直接启示。

基于上述启发,我们在 2024 年 7 月发布了首个分层架构的大模型。其核心理念是把 Transformer 中的参数化记忆拆分为抽象知识与具体知识,并进一步把其中可分离的部分抽离出来,使模型主干尽可能轻量化。主干只需保留最关键的推理能力,其余具体知识则交由外部存储管理。据此,我们将记忆划分为隐性记忆、显性记忆与外部记忆三类,通过分层降低推理与记忆负载。

若将三类记忆映射到人类行为,隐性记忆如同骑自行车——一旦学会便不再需要刻意思考;显性记忆则像昨日读过的书或课堂笔记,经大脑加工后随时调用;外部记忆则类似开卷考试,学生可现场翻阅教材,按需检索。

写入方式亦各有特征:隐性记忆通过训练固化于模型参数;显性记忆以 KV Cache 形式缓存;外部记忆即明文知识库,按常规检索逻辑维护。读取时,隐性记忆支持即时推理;显性记忆依赖 Self-Attention 交叉计算;外部记忆则需重新编码。综合来看,隐性记忆更新慢、读取快;外部记忆容量大、存储效率高,但联合解码耗时;显性记忆更新灵活,既可随时丢弃,也可常驻显存,读写速度居中。

记忆调度的本质,是把上述三种记忆各自的优势真正用起来。在 MemOS 的设计里,我首先把参数化记忆拆成两块:一块是“内置参数记忆”,即模型出厂时便固化的权重;另一块是“外置参数记忆”,它随着用户或 Agent 与大模型的持续交互而动态生长——系统会挑选那些反复出现、对任务至关重要的偏好、事实与推理模式,以低秩更新或增量训练的方式写进这一区域。场景一变,外置参数记忆也随之调整,始终保持与当前任务高度相关。

显性记忆则体现为推理过程中产生的高速 KV Cache。我会把它暂存在显存或高速缓存区,并在下一次同类任务到来前,预判是否需要提前加载到 GPU,避免冷启动带来的延迟。至于外部记忆,我进一步把它细分为短期明文记忆与长期明文记忆:前者存放最近几轮对话或临时参考文档,后者则像一座可随时间沉淀的知识库,按需召回。

整个记忆管理机制就落在对这五类记忆——内置参数、外置参数、显性 KV Cache、短期明文、长期明文——的灵活调度上。若把记忆系统的全生命周期比作八颗星的工作量,传统 RAG 往往把六颗星都花在“使用”环节:幻觉校验、主体一致性检查、权限验证……而构建与调度环节却相对单薄,无非是切片、 Embedding,再复杂一点便是 GraphRAG。可一旦把 GraphRAG 真正部署到生产环境,就会发现它的成本与延迟都高得难以接受。

我们的思路恰恰相反:把尽可能多的工作量前置到构建与调度阶段。构建时,针对不同记忆类型做类脑式的组织与抽取,采用“图 + 向量”的多路混合存储,既保留语义关系,又兼顾检索效率;调度时,则引入主动预测模型,让所需记忆在任务到达前就已处于“就绪”状态。如此,开发者在真正使用这套系统时,只需关心业务逻辑,无需再为记忆管理付出额外成本。

MemOS 的核心机制二:记忆调度管理

我们整套机制的核心,是把“调度”做到极致。调度究竟意味着什么?一句话概括:在最恰当的时刻,把最匹配的记忆放到最恰当的位置。这三个“最恰当”听起来简单,实则每一步都隐藏着大量算法与工程细节。

当前主流 RAG 的增强范式,在我看来属于“被动式检索”。它的典型流程是:用户输入查询 → 系统重写查询 → 生成嵌入 → 向量库召回 → 粗排 → 精排 → 构造提示 → 交由大模型作答。整个链路呈“阻断式”。后续上下文构造与模型回答必须等待检索全部完成后才能继续。为了提升精度,我们常常把检索方案从 Pro 升级到 Ultra,每次升级又额外增加两秒延迟。若业务硬性要求两秒内返回结果,这套阻断式流程便几乎无法兼顾精度与速度。更棘手的是,随着对话窗口拉长,上下文 Token 不断累积,成本呈指数级上升;跨会话、跨天的推理结果也难以复用,导致碎片化与浪费。

若把 Agent 或用户在真实场景中的时间线拆开,可发现大量“空档”:用户敲键盘输入、模型推理、用户阅读答案、再次输入……这些碎片时间加起来往往远超两秒。与其让它们白白流逝,不如化整为零,把记忆管理、调度与预热工作嵌入每一个空隙。届时,当真正需要构造上下文时,所需数据已提前就位,只需极短时间即可完成拼接。无论对系统延迟还是用户体验,提升都立竿见影。

我们把最小记忆单元称为 Memory Cube。借助它,可在用户输入、模型推理、答案阅读乃至下一轮输入等任意阶段与记忆系统交互,持续把后续可能用到的内容提前准备到“就绪”状态。如此,当查询真正到来时,上下文已静静等候,只需一次轻量调用即可交付。

若把记忆调度抽象来看,它由三类核心容器构成:触发器、调度器与快速检索器。触发器允许开发者依据自身业务灵活配置触发点——当用户键入查询、点击设置列表,或任何其他关键动作发生时,皆可即时唤起记忆调度。调度器则接收触发器传来的信号与模板化配置,对隐性、显性与外部记忆分别执行差异化处置,确保在真正需要时,所需记忆已处于最佳状态。

快速检索器并非必需,可视场景取舍。由于记忆准备已转为全时、异步、并行流程,检索耗时可从原来的数秒压缩至百毫秒级,仅需在最后一刻快速补入最新片段即可。由此,我们将传统单轮、阻断式的 RAG 记忆准备,拆分为跨多轮、可并行异步执行的细粒度过程。

欲将记忆调度系统打磨成熟,至少需在以下层面着力:触发触点建模、负载均衡、明文与激活记忆的分级调度。触点建模尤其依赖对用户与系统行为的主动预测——通过一系列轻量级预测模型,实时捕捉行为变化,并据此将调度模板路由至恰当节点。

MemOS 的核心机制三:记忆脑图组织与检索

当记忆分层与调度都已就绪,我仍需回到起点,重新审视“记忆被抽取之后,究竟应以何种形态组织”。组织方式直接决定后续检索成本、准确率与效率。业界目前可见两条路径:一是直接分块,简单高效,却易割裂文本间的语义关联;二是 GraphRAG,试图以知识图谱保留关系,但构建高精度图谱对实体一致性要求极高,成本令人望而却步。我曾在阿里巴巴业务中台负责商品知识图谱,六十余人历时三四年持续打磨,仍深感其复杂与脆弱。即便引入大模型辅助,图谱的可靠性与可用性依旧难以令人满意。

反观人类自身,我们并不会在听完一场讲座或读完一本书后,立刻铺开一张大纸绘制知识图谱;更自然的做法是勾勒一张脑图——提取事件与逻辑的脉络,形成树状框架。脑图恰好介于“分块”与“图谱”之间:既利用大模型的推理与理解能力,又将构建成本控制在可接受范围。

然而,仅有脑图还不够。我更想强调的是“主动记忆”——与被动分块或静态图谱不同,它要求系统像领域专家一样,只抽取对当前场景真正有价值的信息。以金融行业为例,金融专家阅读同一份研报时,会自觉过滤通识内容,仅保留差异化、可复用的要点。为此,我们引入记忆的 CoT(Chain of Memory)过程:先分析对话或文档的主题与特征,再据此决定抽取策略,使转换效率最大化。

获得初版记忆脑图后,还需二次关联与校验:跨会话补全上下文、跨文档建立路由节点,最终形成由根节点(Root Node)与主题节点(Topic Node)构成的网络。在此网络中,我们为关键路径与节点预计算嵌入向量,实现“图 + 向量”的混合检索——既保留灵活性,又确保召回的准确与全面。

MemOS 的整体性能表现

我们也把整套框架与主流开源方案在 LoCoMo 和 LongMemEval 两个数据集上做了横向性能比较。然而我更想指出的是,现有评估体系尚难真实还原记忆框架在业务场景中的价值。多数评测把一百轮对话一次性塞进模型,仅测试基座对长上下文的处理能力,却忽略了记忆是在逐轮交互中缓慢生长的现实;用户键入查询、模型推理、阅读答案均耗时,若不在评估中模拟这些空隙,便无法体现记忆管理系统在真实环境中的优势。

MemOS 的开源框架与 OpenMem 社区

今年 7 月底,我们开源了 MemOS Preview,并发起国内首个聚焦记忆管理的开源社区 OpenMem,邀请高校研究团队与工业界伙伴共同探讨记忆技术的演进方向,沉淀通用标准与协议。开发者社区保持完全开放,API 服务框架已发布第一版,第二版将于 10 月 31 日上线,未来一年对所有调用量级与性能需求均免费,涵盖“记忆即服务”与“推理即服务”。同时提供可私有化部署的版本,满足高安全场景需求。

MemOS 的典型应用场景

之所以打造 MemOS,源于团队自 2023 年成立至今在 ToB 项目中的切身体会。无论是智能投顾还是工业运维,客户对个性化记忆的诉求高度一致:希望把员工与 AI 中枢交互产生的公共经验固化下来。在工业现场,若资深技师退休且未带徒,其调试经验往往随人散失;企业期待记忆平台能留存“为何把参数设为 5%”这类过程信息,而非仅记录结果。开源后,已有开发者将 MemOS 应用于酒店商户服务、科研助手等场景,显著提升了人工反馈准确率与个性化服务水平。

One More Thing

既然我们自视为“记忆操作系统”,就不能只停留在基座训练与中间件层面;操作系统必须拥有自己的语言。换句话说,当用户以自然语言与系统交互时,如何以最高效率完成编排,是成败关键。

设想一句看似简单的请求:“请帮我记录昨天与某人的会议内容,并在后天提醒我撰写技术报告。”其背后隐含多个基础算子:先检索日程,抑或先更新用户画像?是否需要重写、摘要,还是直接扩展?过去,这些逻辑由算法工程师硬编码,导致大量边界情况难以覆盖。因此,我们正在构建一套自动化编排语言框架,让任意自然语言输入都能被实时解析为系统可执行的操作序列,显著降低开发者接入成本。

最后,以公司 Slogan 作结:智能始于记忆,张量链接未来。谢谢大家。

演讲嘉宾介绍

李志宇,博士,记忆张量(上海)科技有限公司联合创始人兼 CTO、上海算法创新研究院大模型中心技术负责人、研究员。长期从事预训练和大模型应用方向的研发技术攻关,主要研究方向包括大模型记忆增强、高效评估与应用算法。曾在阿里巴巴、小红书等头部科技企业带队承担多个核心算法方向,技术成果服务于商品评价、双十一大促、营销广告等超大规模业务场景,累计带来数十亿营收,影响用户近亿人次,并获得双十一技术突破奖。近年来,先后和团队提出了首个记忆分层的创新架构大模型,以及业内业内首个大模型记忆操作系统(MemOS),MemOS 开源 6 个月累计获得 Star 数超 5800+,开发者数超 11000+,为大模型的记忆增强落地提供了可行的探索路径。相关大模型技术成果已在中国银行、招商证券、中国电信、新华社等多家国央企落地应用。当前已在 Patterns(Cell Press)、NeurIPS、ICLR、ACL 和 TKDE 等国际会议期刊发表论文 70 余篇、授权专利 10 余项。现任中国中文信息学会信息检索专委会委员、大模型与生成专委会委员,相关研究工作入选《麻省理工科技评论》封面报道、《机器之心》、《量子位》和《PaperWeekly》的头条报道,并多次登顶 Huggingface 热点论文 Top1。

会议推荐

2026,AI 正在以更工程化的方式深度融入软件生产,Agentic AI 的探索也将从局部试点迈向体系化工程建设!

QCon 北京 2026 已正式启动,本届大会以“Agentic AI 时代的软件工程重塑”为核心主线,推动技术探索从「AI For What」真正落地到可持续的「Value From AI」。从前沿技术雷达、架构设计与数据底座、效能与成本、产品与交互、可信落地、研发组织进化六大维度,系统性展开深度探索。开往 2026 的 Agentic AI 专列即将启程!汇聚顶尖专家实战分享,把 AI 能力一次夯到位!

在平时做安全运维的时候,我经常需要面对一个问题:如何从海量的登录日志里,快速揪出那些已经被“夺舍”的社交账号。
最典型的情况——凌晨三点,系统报警:多个用户的账号同时在印尼登录。而三个小时前,这些账号刚刚在中国境内有过正常活动。这种“瞬移”不可能靠肉身实现,只能是撞库成功后的黑客在异地登录。我们在后台怎么发现的?靠的就是IP地址。 密码可能被盗,设备指纹可能被伪造,但IP背后的网络环境和地理位置,很难完全隐藏真实痕迹。

一、为什么看IP能揪出异常?

账号安全风控里,IP提供的是“语境信息”——单看一个IP可能没什么,但把它放在时间线和用户行为里,异常就会浮出水面。

一般来说,异常登录逃不出这三类:

  • 地理跳跃异常:常驻地在北京,半小时后出现在上海,这种物理上不可能实现的“瞬移”,基本可以判定是账号被劫持。
  • 网络环境异常:一个普通用户的IP,突然从家庭宽带变成了数据中心、机房或者代理节点,值得警惕。
  • 批量行为异常:同一个IP在短时间内尝试登录几十上百个账号,典型的撞库或扫号行为。

香港警方2025年7月发布的数据显示,过去一个月接获超140宗社交媒体账户被骑劫的案件,涉款超1000万港元,其中WhatsApp占九成以上。这说明账号盗用仍然是黑色产业链的“基础业务”。

二、实战场景:怎么用IP“抓”异常?

说了这么多理论,落地到真实业务里长什么样?讲几个我们日常碰到的场景,以及我们怎么用一款叫IP查询工具的工具来处理。

1. 异地登录,触发二次验证

一个杭州用户的账号,某天突然从巴西发起登录请求。

风控系统拿到这个IP,第一件事就是查它在哪。我们用的是IP查询工具的实时查询接口——它能精准定位到国家、省份、甚至街道级。接口返回:归属地巴西圣保罗,网络类型是“数据中心”。再比对用户历史记录,过去三个月该用户从未离境。

这就对上了:一个数据中心IP,第一次出现在巴西,登录一个杭州用户的账号。系统判定为“中风险”,自动触发短信验证+人脸核身。

这个场景拦截的是典型的撞库攻击:黑客在其他平台拿到密码后,批量尝试登录社交账号。IP查询工具帮我们快速确认了“这个IP和用户没关系”。

2. 批量注册,直接封禁

凌晨时段,平台监测到一个IP段在1小时内注册了超100个新账号。

我们把IP段丢进IP查询工具的批量查询接口,回传的信息很清晰:该IP段属于“数据中心IP”,而且过去7天关联注册账号超500个,其中80%已被平台封禁——这些账号都曾用来发广告、诈骗链接。

系统自动判定为“高风险”,直接阻断后续注册请求。这波操作拦截的是一个典型的“养号”团伙:先批量注册,养一段时间再卖号或用来发垃圾内容。接入IP风险识别后,我们平台的风险拦截率提升到92%以上。

3. 代理IP伪装,被识破

一个账号发起登录,IP显示是“北京市家庭宽带”,归属地也对,看起来挺正常。

但IP查询工具的代理识别模块返回了另一个标签:该IP属于“代理出口节点”。系统判断为“环境异常”,要求用户验证手机号。用户验证失败,登录被阻止。

有些用户会用代理服务访问国内服务,这本身不违规。但如果一个账号同时满足“境外IP+代理节点+首次登录”,就需要多留个心眼。IP查询工具能识别主流代理类型,包括代理服务、Tor、隧道等,让我们在风控里多一层判断依据。

4. 高风险组合,人工复核

另一个案例:一个账号登录时触发了多个异常——IP归属地显示俄罗斯,网络类型是数据中心,IP风险标签包含“代理”和“恶意注册”,而且该IP过去24小时关联了50个不同账号。

IP查询工具返回的风险画像很全:除了基础信息,还有“风险性”等历史标签。系统自动把这个账号纳入“人工复核队列”,并临时限制发消息、加好友等功能。后续溯源发现,这批账号确实与境外刷量黑产有关。

三、从“查地址”到“主动防御”

传统IP工具只能查归属地,但新一代IP安全服务已经进化到“主动防御”阶段。它的核心价值不在于拦截每一个可疑IP,而在于把IP信息和其他维度(设备、行为、时间)联动起来,构建用户的正常行为基线

像我们用的IP数据云,背后是全球43亿全量IP库,数据24小时快速更新,覆盖超700个网络监测点。它的定位算法能做到国内街道级精度,准确率超过99.8%。而且响应很快——毫秒级,能支撑平台7×24小时的高并发风控。

接入方式也很灵活:既可以在线查询,也支持API接口、离线数据库、私有化部署。我们目前是混合模式——基础查询走离线库,高风险场景调实时接口,既保证精度又控制成本。

如果你自己写代码接入,其实不复杂。IP查询工具的API接口地址是 https://api.ipdatacloud.com/v2/query,用Python调一下就行:

import requests

def query_ip(ip):
    url = f"https://api.ipdatacloud.com/v2/query?ip={ip}&key=你的API密钥"
    resp = requests.get(url, timeout=3).json()
    if resp.get("code") == 200:
        data = resp["data"]
        print(data)  # 包含风险等级、场景、代理识别等信息
        return data
    return None

# 示例:查询8.8.8.8
info = query_ip("8.8.8.8")

返回的数据里,usage_type能告诉你这个IP是家庭宽带(DYN)、数据中心(IDC)还是企业专线(GTW);is_proxy标记是否经过代理;risk_levelrisk_score是综合风险评分。有了这些,写风控规则就很简单。

如果是高并发场景,用离线库更稳。IP查询工具提供CSV、MMDB格式的离线库下载,可以在本地毫秒级查询,完全不依赖外网。Java、Python、Go都有对应的解析库。

四、给平台和个人的几点建议

对平台而言,接入IP查询工具这类专业服务,可以显著降低盗号、恶意注册、广告机刷等风险。特别是金融级风控场景,需要的是街道级精度和多维度风险标签,而不仅仅是“这个IP在哪”。

对个人用户来说,技术防御再强,也需要自己留个心眼:

  • 定期查看账号的登录设备与地点记录
  • 能开双重验证就开一下,不费事
  • 别随便用来路不明的加密通道或代理工具
  • 密码定期换,不同平台别用同一个

2025年多家安全厂商报告显示,凭证泄露事件同比增长160%,单次泄露的登录记录可达160亿条。这意味着,你的密码大概率已经在暗网上挂着了。多一道验证,多一分安心。

如今企业做网站,托管方式的选择比以往丰富多了。从早期的虚拟主机、独立服务器,到现在的云服务器,每种方案都有其适用场景。而云服务器之所以能成为当前的主流选择,很大程度上是因为它在弹性、成本和维护性之间找到了不错的平衡点。

简单来说,云服务器就是把物理服务器的计算资源通过虚拟化技术分割成多个独立的虚拟服务器。每个云服务器都有自己独立的操作系统、CPU、内存和硬盘,使用体验和物理服务器几乎一样,但资源可以随时按需调整。在极云科技的云平台上,开通一台云服务器只需要几分钟,配置也可以根据业务发展随时升级或降配。

一是弹性伸缩,访问量突增时可以快速增加CPU、内存或带宽,不用担心网站卡顿或宕机;

二是高可用性,底层硬件故障时虚拟机会自动迁移到其他物理节点,业务几乎无感知;

三是成本可控,按用量付费的模式让企业不用为闲置资源买单,特别适合业务还在快速成长期的企业。

当然云服务器也不是万能的。如果网站需要特殊的硬件驱动、特定的PCIe设备,或者对数据主权有严格要求,可能还是物理服务器更合适。另外,长期高负载运行的网站,从三年以上的总成本来看,物理服务器有时会更经济。

首先要看业务特点,内容管理类网站对CPU和内存要求高,电商网站需要更好的带宽保障,图片视频站点则需要更大的存储空间;

其次要看服务商的网络质量,极云科技采用BGP多线接入,确保不同运营商用户都能快速访问;

还要关注数据备份和安全防护能力,我们提供自动快照和免费基础DDoS防护,为网站稳定运行加上双保险。

总的来说,云服务器确实给企业网站托管带来了更多灵活性和可靠性。它的按需取用、弹性伸缩特性,让企业可以根据业务实际发展来配置资源,既不会因为配置不足影响用户体验,也不会为过度配置浪费预算。

如果你正在为网站寻找合适的托管方案,欢迎体验极云科技的云服务器。我们从1核1G的入门配置到多核大内存的高性能实例都有提供,专业运维、弹性计费,帮你把网站建得又稳又快。

Sa-Token 是一款 开源免费 的轻量级 Java 权限认证框架,主要解决:登录认证权限认证单点登录OAuth2.0微服务网关鉴权 等一系列权限相关问题。🔐

sa-token-jss--tran

目前最新版本 v1.45.0 已推送至 Maven 中央仓库 🎉,大家可以通过如下方式引入:

<!-- Sa-Token 权限认证 -->
<dependency>
    <groupId>cn.dev33</groupId>
    <artifactId>sa-token-spring-boot4-starter</artifactId>
    <version>1.45.0</version>
</dependency>

该版本包含大量 ⛏️️️新增特性、⛏️底层重构、⛏️️️代码优化 等,下面容我列举几条比较重要的更新内容供大家参阅:

🚀 更新点1:万人血书的 Spring Boot 4 集成包,它来了!

Spring Boot 4 正式版发布后,社区里「求适配」的呼声就没停过!fix: #869#IDB02G#IDGQYM 这次,它真的来了!🎉

need-spring-boot-4-starter.png.png

本次更新新增了完整的 Spring Boot 4 集成支持:🌟

  • sa-token-spring-boot4-starter:WebMVC 环境下的 Spring Boot 4 集成包。
  • sa-token-reactor-spring-boot4-starter:Reactor 响应式环境下的 Spring Boot 4 集成包。

同时配套新增了示例项目:

  • sa-token-demo-springboot4:Spring Boot 4 + WebMVC 整合 demo。
  • sa-token-demo-webflux-springboot4:Spring Boot 4 + WebFlux 示例。

如果你正在或计划升级到 Spring Boot 4,可以直接引入对应 starter,体验与 Spring Boot 2/3 一致的丝滑集成。✨

🎯 更新点2:重复登录处理策略升级,可灵活配置是 “顶人下线” 还是 “不允许登录”

Sa-Token 在多端登录控制场景下,现已支持通过 replacedLoginExitMode 配置项自定义重复登录时的行为方式:

  • 当同一账号不允许多客户端同时登录时,以往 Sa-Token 的默认策略为“新登录顶掉旧会话”,即新登录后会将旧端踢下线。🔄
  • 但部分业务对安全性有更高要求,例如用户 A 已在手机端登录,再用电脑登录时,希望直接拦截本次登录,不影响原有会话,即提示“该账号已在其他设备登录,无法顶替下线”,而不是让手机端被踢下线。📱💻

本次更新新增了配置项 replacedLoginExitMode,你可通过它自由选择策略,无需变动业务代码,灵活应对不同安全需求。配置项含义说明如下:

  • replacedLoginExitMode = OLD_DEVICE:旧设备下线,新设备登录成功(默认行为,顶人下线模式)。
  • replacedLoginExitMode = NEW_DEVICE:新设备登录失败,旧设备维持在线(拦截本次登录)。

只需在 Sa-Token 配置文件或启动参数中切换即可,非常便捷。🛡️

merge: pr 349

📦 更新点3:新增 sa-token-jackson3、sa-token-snack4 插件,生态持续扩展

Sa-Token 的 JSON 与序列化生态一直在持续丰富,本次又迎来两位新成员:📚

  • sa-token-jackson3:用于 Jackson 3 的 JSON 操作。Jackson 3 是 Jackson 的最新大版本,如果你已经在使用 Jackson 3,现在可以无缝对接 Sa-Token 了。
  • sa-token-snack4:用于 Snack4 的 JSON 操作。merge: pr 356

引入方式示例:

<!-- Sa-Token 整合 Jackson 3 -->
<dependency>
    <groupId>cn.dev33</groupId>
    <artifactId>sa-token-jackson3</artifactId>
    <version>1.45.0</version>
</dependency>

<!-- Sa-Token 整合 Snack4 -->
<dependency>
    <groupId>cn.dev33</groupId>
    <artifactId>sa-token-snack4</artifactId>
    <version>1.45.0</version>
</dependency>

无论你偏好 Jackson、Fastjson、Snack3 还是 Snack4,Sa-Token 都能满足。🎛️

🏗️ 更新点4:重构 sa-token-dependencies 及 WebMVC/Reactor 集成包

本次版本对依赖体系进行了一次重要重构:🔧

  • 重构 sa-token-dependencies 相关模块,优化依赖关系,使版本管理更清晰。
  • 重构 Spring Boot WebMVC/Reactor 相关集成包,优化模块划分与依赖传递。
  • 优化整体模块依赖关系,减少冗余、提升构建效率。

这是一次「看不见的升级」,但对长期维护和后续扩展都有积极影响。📐

📺 更新点5:SSO 模块新增 STS 协议定义、视频讲解与平台中心模式 demo

SSO 单点登录模块在本版本也有不少文档与示例上的增强:📖

  • STS 协议定义:文档为 sa-token-sso 模块正式定义了 STS 协议,方便大家理解与对接。
  • 平台中心模式 demo:sso-server 前后端分离模式下,新增平台中心模式 demo 示例。
  • 消息处理器相关文档:补全了 SSO 模块内置消息处理器相关文档,修复了 msgType 参数说明与 API 说明。🔗
  • 视频讲解:B 站 up 主「王清江唷」录制了 SSO 篇共 29 集视频,从零到一讲解单点登录,非常适合入门与进阶。

<!-- bilibili-sa-token-sso-video -->

🐞 更新点6:修复 OAuth2 序列化类型转换、Dubbo 上下文清理等问题

本版本修复了多个社区反馈的问题:🙏

  • OAuth2:修复 sa-token-oauth2 组件使用 sa-token-fastjson2 序列化导致的类型转换问题。merge: pr 355
  • Dubbo:修复 Dubbo 上下文清理问题,避免 RPC 调用时上下文污染。merge: pr 889
  • Core:修复 StpUtil.getLoginIdByTokenNotThinkFreeze 方法缺少 static 修饰符的问题。
  • Core:优化路由匹配 pattern 缓存算法,消除魔法值。merge: pr 907

📚 更新点7:文档与社区建设

文档与社区方面也有不少更新:❤️

  • 新增 Sa-Token 内容合作者群,欢迎愿意参与文档、教程、视频等内容创作的小伙伴加入。
  • 新增赞赏码展示、文档首页 stars 对比图、解决跨域专题文章。
  • 优化框架 Slogan、README、案例库展示。
  • 文档主题切换增加水滴特效,登录认证、权限认证、路由拦截鉴权等章节优化。
  • 补全全局策略说明、数据结构说明,目录树增加项目架构设计栏目。
  • 新增 Maven 父子项目无法下载依赖的问题解决方案。merge: pr 358
  • 新增《Gitee 2025 年度开源项目 Web 应用开发 Top 2》证书展示,感谢社区认可。🏆

gitee-2025-top2

📜 完整更新日志

除了以上提到的几点以外,还有更多更新点无法逐一详细介绍,下面是 v1.45.0 版本的完整更新日志:

  • core:

    • 新增:新增重复登录处理策略,当同一账号不允许多客户端同时登录时支持选择踢人下线或拦截本次登录。 [重要] merge: pr 349
    • 修复:修复 StpUtil.getLoginIdByTokenNotThinkFreeze 方法缺少 static 修饰符的问题。
    • 优化:优化路由匹配 pattern 缓存算法,消除魔法值。merge: pr 907
    • 优化:移除冗余导包。
  • 插件:

    • 新增:新增 sa-token-jackson3 插件,用于 Jackson 3 的 JSON 操作。 [重要]
    • 新增:新增 sa-token-jackson3-test 单元测试。
    • 新增:新增 sa-token-snack4 插件。 [重要] merge: pr 356
    • 修复:修复 Dubbo 上下文清理问题。 merge: pr 889
    • 新增:loveqq-framework 版本更新。merge: pr 351
  • starter:

    • 新增:新增 sa-token-spring-boot4-starter 集成包,支持 Spring Boot 4 环境集成。 [重要]
    • 新增:新增 sa-token-reactor-spring-boot4-starter 集成包,支持 Reactor + Spring Boot 4 环境集成。 [重要]
    • 新增:新增 sa-token-demo-springboot4sa-token-demo-webflux-springboot4 示例。
    • 新增:新增 Spring Boot 4 整合 demo 示例。
  • 重构:

    • 重构:重构 sa-token-dependencies 相关模块,优化依赖关系。 [重要]
    • 重构:重构 Spring Boot WebMVC/Reactor 相关集成包,优化依赖关系。 [重要]
    • 优化:优化整体模块依赖关系。
  • Solon:

    • 优化:sa-token-solon-plugin 优化 Gateway 接口的处理,避免使用路由接口。merge: pr 348
  • SSO:

    • 新增:sso-server 前后端分离模式下 平台中心模式 demo 示例。
    • 修复:SSO 模块 msgType 参数说明、API 说明修正。
    • 新增:SSO 模块视频讲解链接:B站 王清江唷 SSO篇(29集)。 [重要]
    • 补全:SSO 模块内置消息处理器相关文档。
    • 新增:文档为 sa-token-sso 模块定义 STS 协议。 [重要]
  • OAuth2:

    • 修复:修复 sa-token-oauth2 组件使用 sa-token-fastjson2 序列化导致的类型转换问题。merge: pr 355
    • 优化:修改 ClientIdSecretModel 的读取构建逻辑。merge: pr 346
  • 文档:

    • 同步:同步公众号文章列表、博客列表、赞助者名单、企业登记案例。
    • 新增:新增 Sa-Token 内容合作者群。 [重要]
    • 新增:新增《Gitee 2025 年度开源项目 Web 应用开发 Top 2》证书展示。
    • 新增:新增赞赏码展示、文档首页 stars 对比图。
    • 新增:新增解决跨域专题文章。
    • 新增:增加微信群聊信息展示。
    • 优化:优化框架 Slogan。
    • 优化:优化 README、案例库展示。
    • 优化:文档主题切换增加水滴特效,调整主题色块顺序。
    • 优化:文档优化 [登录认证]、[权限认证]、[路由拦截鉴权] 篇。
    • 优化:补全全局策略说明、数据结构说明。
    • 新增:目录树增加专门栏目记录项目架构设计。
    • 优化:功能结构图增加点击事件跳转到对应功能文档。
    • 优化:子服务外网隔离章节增加示意图。
    • 优化:Same-Token 同源系统认证图示说明。
    • 修复:更换 GitCode logo 为 AtomGit。
    • 修复:更换 QQ 群链接、微信群聊展示图。
    • 修复:文档图片地址更换为本地文件。
    • 修复:错别字修复。
    • 修复:maven-pull.md 文档,解决父子项目依赖下载问题。
    • 新增:Maven 父子项目无法下载依赖的问题解决方案。merge: pr 358
    • 修复:订正文档错别字。merge: pr 354
    • 修复:文档内代码示例修正。merge: pr 347
  • AI:

    • 新增:新增 organize-update-log SKILL,用于格式化整理版本更新日志信息。
    • 新增:新增 commit-message SKILL,用于整理 git commit 日志信息。
    • 新增:新增 upgrade-version SKILL,用于统一升级修改版本号。
    • 新增:新增 remove-redundancy-import SKILL,用于检查 Java 类中无效冗余导包并移除。
  • 其它:

    • 新增:readme 增加快问快答区域。
    • 新增:增加忽略 .vscode 目录。
    • 优化:注释优化。
    • 重构:备忘录重构为专门的文件夹。
    • 重构:调整项目发布配置至 Maven Central Portal。merge: pr 792
    • 优化:部分构建配置升级到最新版。

更新日志在线文档直达链接:https://sa-token.cc/doc.html#/more/update-log

🌟 其它

代码仓库地址:https://gitee.com/dromara/sa-token

框架功能结构图:

js

在刚刚结束的存储领域顶级学术会议 FAST '26(24th USENIX Conference on File and Storage Technologies) 上,阿里云(Alibaba  Cloud)联合上海交通大学(SJTU)、Solidigm 共同发表的论文 《Here, There and Everywhere: The Past, the Present and the Future of Local Storage in Cloud》 获得最佳论文奖(Best Paper Award)。本界大会仅有两篇论文获此殊荣。值得一提的是,这也是阿里云存储相关研究在过去四年内第三次获得国际学术届的最高荣誉。


本论文从大规模生产实践出发,直面云原生时代本地存储的核心矛盾:一方面要追求更低时延与更高吞吐,另一方面必须满足云上多租户、可运维、可演进、可用性保障等工程要求。论文给出了清晰的技术路线图与可验证的体系化经验总结,也标志着阿里云在存储基础设施“软硬一体化”探索上获得了国际学术界的高度认可。

论文不仅系统阐述了阿里云本地盘(Local Storage)技术从纯软件到软硬协同的“三代进化史”(以咖啡浓度由低到高命名:Espresso、Doppio、Ristretto),更提出了一种前瞻性的端云融合存储架构——Latte。该架构通过基于机器学习的 IO 调度(ML IO Dispatcher)与cache准入控制技术(Admission Controller),在更轻量的系统开销下实现更稳定、更接近“极致”的时延与吞吐体验。在 AI 大模型推理等新兴场景中,Latte 可构建高性能、大容量、高性价比的弹性缓存层,有效降低 GPU 等计算资源消耗,提升推理效率与响应速度,为云原生与 AI 负载提供了兼顾性能确定性与资源效率的新工程范式。

阿里云本地盘技术演进与架构变革

论文用“咖啡”隐喻概括本地盘技术不断“提纯”的过程:每一代都围绕瓶颈点做架构级调整,在性能、隔离、可运维性与可演进性之间寻找更优解。最初,ESPRESSO 通过用户态轮询架构(SPDK)释放 NVMe 性能,却牺牲了 CPU 效率和裸金属支持;随后,DOPPIO 借力 ASIC DPU 卸载虚拟化,提升了隔离与交付能力,但硬件固化难以跟上 SSD 快速迭代,也缺乏对复杂云特性的支持;如今的 RISTRETTO 采用 ASIC 与 ARM SoC 软硬协同设计,既保留高性能数据面,又通过可编程控制面实现灵活的 FTL 与卷管理,已在大规模场景中逼近物理盘性能极限

RISTRETTO 架构:

探究本盘形态:面向未来的混合架构 Latte

论文的核心在于提出了下一代存储愿景——Latte(一种将本地盘与云端存储能力进行融合的混合架构)。

在 Latte 中,本地介质承担“近端、快速、吸收突发与热点”的职责;云端能力承担“持久化、可用性与弹性”的职责。两者通过统一的数据路径与调度机制协同工作,使系统既能保持接近本地的响应特性,也能获得云上可运维、可扩展、可恢复的工程能力

本地介质以 append-only 方式高效吸收突发流量和热点数据,提供微秒级低延迟,规避了传统网络存储的长尾延迟问题;为精准调度数据流向,系统引入轻量级 ML 调度器,基于 I/O 特征动态预测热点,在 CPU 开销低于 10% 的情况下实现 95.6% 的长尾延迟预测准确率,并支持在线自适应更新;在缓存管理方面,摒弃传统的 LRU,采用优化的 S3-FIFO 淘汰策略,在保持对缓存盘写友好(写放大为1)的同时显著提升热点命中率,最终达成高达 80% 的读命中效果,兼顾了性能、效率。

深度解读:Latte 的优势是什么?

1.“更稳”的性能体验(Tail Latency Friendly)
Latte 的设计重点之一是应对云上真实业务最头痛的长尾:抖动、拥塞、突发与干扰。通过“本地吸收 + 智能分流”,系统更容易将性能波动控制在可预期范围内。

2.打破“本地”限制 (Elasticity & Availability)
传统本地盘受限于物理服务器的硬盘槽位数量和大小,容量无法动态扩容,且单机故障会导致服务中断。Latte 将数据最终持久化在云盘,使得本地存储具备了云盘级别的弹性伸缩能力和故障恢复能力。在write-through 模式下,即使物理机宕机,数据依然安全存储在后端 EBS 中。

3.开源贡献与生态
该论文的研究基于广泛使用的开源框架(SPDK)和通用硬件。团队在设计 Latte 时,深度集成了Solidigm 合作开发的开源存储加速框架 CSAL,为业界提供了一个可复刻的、软硬结合的存储分层最佳实践。

结语

从 Espresso 到 Latte,不仅仅是本地存储形态的变化,更是云计算底层存储架构从“资源孤岛”走向“资源池化与融合”的缩影。阿里云通过这篇 FAST '26 论文,向业界展示了如何利用软硬协同(ASIC+SoC)与端云融合(Local+EBS)的技术红利,打破存储性能、成本与可靠性的“不可能三角”。未来,这种混合存储架构或将成为云原生数据库、AI 推理以及大数据分析等高性能场景的重要基础能力之一。

本文带你零基础、零代码,用 Coze 平台快速搭建一个可直接上线使用的智能客服智能体。你只需在本文基础上优化人设、完善知识库,即可快速落地产品级客服能力。

核心功能

  • 自动理解用户问题,基于知识库精准回复
  • 未知问题自动转为用户反馈并后台保存,支持微信 / 钉钉 / 邮件实时通知,持续迭代知识库

一、准备工作:免费注册 Coze 账号

访问官网免费注册使用:https://www.coze.cn/home

二、创建专属知识库

创建专属知识库

根据业务需求自定义知识库名称,例如「智能客服知识库」。

Coze 支持绝大多数文档格式,也可直接填入在线文档 URL 自动导入。

测试知识库示例(可直接复制)

1)质量检查和软件测试有什么区别?
QA(质量保证)关注软件开发过程的质量;软件测试确保最终产品功能符合用户需求。

2)什么是 Testware?
Testware 是测试用例、测试数据、测试计划等测试相关工件。

3)构建和发布之间有什么区别?
构建:开发团队提供给测试团队的安装包。
发布:测试/开发团队交付给客户的正式安装包。

4)SQA 团队在自动化中面临哪些挑战?
自动化工具掌握、脚本复用、用例适配性、复杂用例自动化。

5)什么是漏洞泄漏和漏洞释放?
错误发布:已知缺陷但优先级低,先行交付测试。
错误泄漏:客户发现测试团队未检出的缺陷。

6)什么是数据驱动测试?
从 csv、excel 等文件读取测试数据,在被测系统上自动化执行。

三、创建智能客服智能体

创建智能客服智能体

自定义智能体名称,例如「智能客服智能体」。

3.1 人设与回复逻辑(直接复制使用)

# 角色
你叫小美,是一位资深QA专家,有任何QA方面的问题都可以咨询我。

## 回答主题简介
我是杭州飞的高科技公司的客服人员,帮你提供在线咨询服务。

## 工作流程
### 步骤一:问题理解与回复分析
1. 认真理解从知识库中召回的内容和用户输入的问题,判断是否为有效答案。
2. 若问题模糊、信息不足,主动追问用户,确保准确理解需求。

### 步骤二:回答用户问题
1. 与QA主题无关的问题,礼貌拒绝回答。
2. 知识库无相关内容时,统一回复:
“对不起,我已学习的知识中不包含问题相关内容,暂时无法提供答案。如果你有相关问题,请给我们留言,我们将记录并及时处理。”
并引导用户留下联系方式,通过 comment_add 插件提交反馈,返回记录编号作为回执。
3. 有匹配知识时,仅提取相关内容,整理为**精准、简洁**的答案回复。
4. 按判断返回对应文档链接,无需说明来源。

## 限制
1. 禁止回答与QA无关的问题。
2. 统一使用Markdown格式回复。

3.2 引入知识库

在中间栏「知识」点击 +,绑定已创建的知识库。

用户提问时,智能体会自动检索知识并整理回复。

3.3 添加留言反馈插件

在「技能 → 插件」点击 +,搜索 apifm,添加 apifm common / comment_add。

作用:

智能体无法回答时,自动保存用户问题到后台

返回反馈编号给用户

支持微信 / 钉钉 / 邮件实时通知管理员,用于迭代知识库

3.4 其他设置

默认即可满足使用;可按需调整开场白、语音音色、交互风格等,让智能体更贴合业务。

四、在线测试与效果预览

设置预览

右侧为实时测试窗口,边测边调,直到回复符合预期。

五、正式发布

点击右上角「发布」,无需审核、即时生效,任何人可直接访问使用。

六、效果展示

场景 1:知识库匹配 → 精准回复

问题一

答复一

场景 2:无知识 → 自动保存反馈并通知

要求提供联系方式

收录成功

后台效果

微信提醒

总结

借助 Coze 平台,我们仅用不到 10 分钟就完成了从注册、建库、配置到发布的全流程,快速拥有了一个具备自动问答、未知问题反馈、实时通知、可直接商用的智能客服智能体。整套方案零代码、低成本、易维护,既能大幅降低人工客服压力,又能通过用户反馈持续迭代知识库,让智能体越用越聪明。无论是个人测试、团队效率提升还是企业业务落地,这套流程都具备极强的实用性与可复制性,是快速实现 AI 客服落地的最佳实践之一。

一个真正优秀的MES平-台,既要向上与ERP无缝对接,实现计划、成本与财务的一体化协同;也要向下与PLC、机器人、测试台架等自动化设备实时交互,打通OT与IT;同时横向与PLM、WMS、QMS等系统协同,实现产品全生命周期数据贯通;更要内外与供应链上下游系统对接,构建产业链协同能力。
在2026年的机械制造行业,AI+MES已经超越了简单的“数据记录”阶段,进化为具备感知、分析、决策、执行能力的“工业大脑”。AI不再是一个独立的模块,而是像水电一样渗透在MES的每一个功能环节中。

一、AI赋能MES在机械制造领域的六大核心具体功能:
1、智能高级排程与动态调度 (AI-APS)
多目标优化排程:利用强化学习和遗传算法,同时考虑订单交期、设备产能、物料齐套率、人员技能、模具状态等数十个约束条件。AI能在秒级时间内生成最优排产方案,平衡“交付最快”、“成本最低”或“换线最少”等不同目标。
动态实时重排:当发生急单插入、设备故障、物料延迟等突发事件时,传统MES需要人工重新调整,而AI-MES能毫秒级感知异常,自动触发重排算法,瞬间生成新的执行方案并下发给机台和AGV,实现“计划跟着变化走”。
人机协同排班:基于历史数据和员工技能画像,AI自动推荐最佳的人员排班组合,预测工时瓶颈,避免因人力不足导致的产线停滞。
2、预测性维护与设备健康管理 (PdM)
多维数据融合分析:MES实时采集PLC中的电流、电压、振动、温度、噪音等多维数据,结合深度学习模型(如LSTM长短期记忆网络),识别设备故障前的微弱特征信号。
剩余寿命预测 (RUL):AI不仅报警,还能预测关键部件(如主轴轴承、刀具、减速机)的剩余使用寿命,建议在下一个保养窗口期进行更换,避免生产中途停机。
故障根因自诊断:当设备报警时,AI自动关联历史维修知识库和实时工况,给出故障根因概率排序,并推送维修指导SOP给技工。
3、AI视觉质检与工艺参数自优化
表面缺陷自动检测:集成计算机视觉 (CV) 技术,对机械加工件的划痕、裂纹、毛刺,或装配后的错漏装进行实时在线检测。AI模型能通过少量样本快速训练(小样本学习),适应多品种切换,检出率远超人工。
工艺参数自适应闭环:在加工过程中,AI实时分析质量数据与工艺参数(如切削速度、进给量、压力、温度)的关联关系。一旦发现质量趋势偏移,自动反向调整设备参数进行补偿,无需人工干预,实现“零缺陷”生产。
虚拟量测:对于难以在线测量的内部指标,AI通过建立过程数据与最终质量的映射模型,实现软测量,减少破坏性抽检频率。
4、智能物流与仓储协同
打通MES与WMS、AGV的任督二脉,实现物流的自动化与智能化。
需求预测与精准配送:AI根据生产节拍和实时消耗速率,预测未来几小时的物料需求,提前指令AGV或立体库进行备料和配送,实现真正的JIT(准时制)上线,消除线边库存积压。
路径动态规划:在多AGV协同场景下,AI算法实时计算最优路径,动态规避拥堵和碰撞,提升物流搬运效率30%以上。
智能防错与追溯:利用RFID和视觉识别,AI在投料口自动核对物料批次、型号与工单是否匹配,防止错料;同时自动绑定物料条码与产品序列号,构建全生命周期追溯链。
5、能耗管理与绿色制造
能效指纹分析:AI分析不同产品、不同工艺路线下的能耗特征,建立单位产品能耗模型,识别高耗能环节和异常能耗点(如设备空转、泄漏)。
动态能源调度:结合峰谷电价和生产计划,AI智能建议或自动调整高能耗设备的运行时间(如热处理炉、空压机),在低成本时段进行生产,降低用电成本。
碳足迹实时核算:自动采集水、电、气及原材料数据,实时计算每个工单、每个产品的碳排放量,生成符合国际标准的碳报告。
6、知识图谱与智能辅助决策
工业知识图谱:构建包含设备、工艺、质量、故障案例的企业级知识图谱。当遇到新问题时,AI能像专家一样推理,提供解决方案建议。
在2026年,没有AI能力的MES将被视为“残-次-品”。对于机械制造企业而言,引入AI+MES不仅是技术的升级,更是生产模式从“经验驱动”向“数据智能驱动”的根本性变革。
二、MES平-台的构建逻辑与关键能力如下:
1、纵向打通:IT与OT的深度融合(向下扎根)
这是MES作为“车间操作系统”的基石。传统的MES往往止步于数据记录,而新一代平-台必须实现双向实时控制。
协议标准化与边缘计算:面对PLC、机器人、测试台架等异构设备,平-台不再依赖昂贵的定制开发,而是通过内置OPC UA、MQTT、Modbus等工业标准协议库,结合边缘网关进行数据清洗与协议转换。
指令闭环:不仅是采集数据(如温度、压力、转速),更要能下发指令(如工单参数、配方下发)。例如,MES根据ERP计划生成工单,直接驱动PLC调整产线参数,测试台架完成后自动将质检数据回传MES,形成“计划-执行-反馈”的毫秒级闭环。
2、横向协同:打破系统孤岛(向旁延伸)
机械制造涉及复杂的BOM(物料清单)和工艺路线,单一系统无法覆盖全貌。
与PLM(产品生命周期管理)集成:实现设计制造一体化。PLM中的EBOM(设计BOM)自动转换为MBOM(制造BOM),工艺路线、3D图纸、作业指导书(SOP)直接推送到车间终端,确保生产的是最新设计版本,减少因设计变更导致的返工。
与WMS(仓储管理系统)集成:MES根据生产进度触发WMS叫料,AGV小车自动配送至线边仓;完工后自动触发入库指令,实现账实同步。
与QMS(质量管理系统)集成:实现全流程追溯。从原材料入库检验、过程巡检到成品测试,所有质量数据与生产工单绑定。一旦发现问题,可瞬间反向追溯至具体的人、机、料、法、环。
3、向上对接:业财一体化(向上支撑)
这是解决“计划不如变化快”和“成本算不清”痛点的关键。
与ERP(企业资源计划)无缝对接:

计划层:ERP下达主生产计划(MPS),MES反馈实时产能与进度,支持ERP进行更精准的APS(高级计划与排程)。
成本层:传统成本核算往往是月底分摊,滞后且粗糙。新一代MES通过实时采集工时、能耗、物料消耗,实现按工单、甚至按单件产品的实时成本核算,为财务提供精确数据,真正实现“业财融合”。

4、内外互联:构建产业链生态(向外拓展)
供应链上下游协同:

向上游:与供应商系统对接,共享库存水位与需求预测,实现VMI(供应商管理库存)或自动补货。
向下游:与客户系统对接,开放生产进度查询端口(如“订单像快递一样可追踪”),提升客户满意度。

云端协同:利用工业互联网平-台,实现多基地、多工厂的产能协同与订单调配,构建集团级的“云工厂”。
三、技术架构建议
要实现上述目标,传统的单体架构已难以为继,建议采用以下架构特征:
云原生微服务:将计划、质量、设备等模块解耦,便于灵活迭代与按需部署。
万界星空低代码/无代码平-台:赋予业务人员快速调整流程的能力,适应机械制造多品种、小批量的柔性需求。
AI内嵌:在排程、质检(视觉检测)、设备维护等环节植入AI算法,从“记录数据”转向“智能决策”。
总结:
未来的机械制造MES,本质上是一个工业数据中台 + 业务协同引擎。它不再仅仅是一个车间管理软件,而是企业连接物理世界(设备)与数字世界(ERP/PLM)、连接内部运营与外部生态的核心枢纽。联系我们,万界星空科技机械加工行业全方位协同平-台,项目合作+平-台案例演示。