这几天打牌都没签到
补签第一个显示消耗 100,然后再补签第二个还是显示 100,没有动态刷新。
@Jimmy
xiaohack博客专注前沿科技动态与实用技术干货分享,涵盖 AI 代理、大模型应用、编程工具、文档解析、SEO 实战、自动化部署等内容,提供开源项目教程、科技资讯日报、工具使用指南,助力开发者、AI 爱好者获取前沿技术与实战经验。
补签第一个显示消耗 100,然后再补签第二个还是显示 100,没有动态刷新。
@Jimmy
本人是大学生,最喜欢看老登们吹牛,聊生活,聊工作,聊情感,聊家庭。
做前端或全栈开发时,经常会遇到这样的情况:后端已经返回了 JSON 数据,但我们还要手动写 TypeScript 接口,既花时间又容易漏字段。这个工具就是为这个痛点准备的。 我把它做成了一个在线小工具,核心前端使用 Vue 开发。你只要把 JSON 粘贴进去,就能一键生成对应的 TypeScript 接口代码,适合日常接口联调和项目初始化。 如果你平时也觉得“写接口定义很机械”,这个工具会明显省时。先把数据跑通,再根据业务微调类型,会更高效。JSON转TypeScript接口 在线工具分享
在线工具网址:https://see-tool.com/json-to-typescript
工具截图:
这个工具能帮你做什么
使用步骤
适合哪些人
Agentic AI的核心不在LLM选型也不在提示词技巧。真正决定一个Agent能否在无人值守的情况下稳定工作的是它背后的系统设计。 本文就总结了构建AI系统时真正绕不开的10个基础概念 假设你需要Agent读取Gmail、更新Notion、查询数据库。按传统做法,每个服务都要单独写集成代码,解析Gmail的API、搞定Notion的鉴权、再写一套SQL连接逻辑。三个系统,三套代码,三份维护成本。 MCP(Model Context Protocol)用一种统一协议解决了这个问题。可以把它理解成AI世界的USB-C:不管连什么设备,接口只有一个。 你部署若干MCP服务器,每个服务器对外暴露工具,并附带清晰的功能描述和输入参数说明。Agent连上服务器后自动发现可用工具。 举个例子:某个MCP服务器暴露了send_email函数,描述是"向指定地址发送带主题和正文的邮件"。Agent把它列入工具清单。用户说"把报告发给xxx",Agent就带着正确参数调用这个函数。第二天你加了个search_github服务器,Agent自动发现、自动使用。不需要改任何代码。 多数开发者把LLM当函数用,输入问题输出答案然后就结束了。但现实中的任务不是一锤子买卖,需要根据中间结果不断调整策略。 推理循环才是Agent真正解题的方式。 Agent先想该做什么,然后执行,再观察结果,接着重新评估:刚才的做法管用吗?下一步试什么?如此往复,直到任务完成。 比如你让Agent查竞争对手的定价。它先想到去看对方官网,结果拿到一个404。它注意到页面不存在,于是换个思路,转去主页找入口。从主页定位到定价链接,点进去,提取数据。每一步都建立在上一步的反馈之上。第一条路走不通,Agent没有直接报错退出,而是自己绕了过去。 来看一个场景:用户说过"我习惯把会开在上午10点之前"。这条偏好被写入长期记忆,关联到用户ID。一周后用户说"帮我跟Sarah约个会",Agent检索记忆,发现早会偏好,直接推荐上午9点的空档,而不是随机塞一个下午的时间。没有记忆系统的话用户每次都得重复说明自己的习惯。烦。 Agent准备删文件,LLM非常确定这就是用户的意思。可万一判断错了呢?万一它删的是生产库而不是测试数据呢? 护栏就是在操作真正执行前跑的一道验证。检查权限、校验参数合理性、扫描输出里有没有敏感信息。本质上是一层安全网,在错误造成实际损害之前把它拦下来。 用户说"清理一下旧的测试数据"。Agent理解成删50,000条数据库记录。护栏介入:这个用户有删除权限吗?"旧测试数据"对应5万条记录,合理吗?系统把这标记为可疑操作,弹出确认。一问才知道,用户说的是50条,不是50,000条。一场事故就这么被挡住了。 工具发现的思路完全不同:工具自带描述文档,Agent在运行时读取这些描述,自动学会怎么调用。 假设你在生产环境部署了一个新的日历MCP服务器,暴露了create_event和list_events两个函数,附带功能说明。下次有人说"帮我约个团队会议",Agent在可用工具列表里看到日历相关的接口,读一下描述就知道怎么用了。Agent代码完全没动。新能力是它自己"发现"的。 API会超时,服务会宕机,用户会给模棱两可的指令,Agent一定会撞上错误。关键在于它是直接挂掉,还是能聪明地处理。 错误恢复的核心是分类和应对。网络超时?重试。信息缺失?反问用户。鉴权失败?写日志,给出明确的错误说明。 Agent试着发一封邮件,SMTP服务器超时了。它没崩等2秒重试,还是不行,等4秒再试,第三次通了。用户全程毫无感知。换一种情况:超时一直没好。三次重试都失败后,Agent告诉用户——"邮件服务暂时挂了,草稿已保存,10分钟后自动重发。"出了什么问题、接下来怎么办,交代得清清楚楚。 人工介入不等于事事都要审批。它的精髓在于区分风险等级:高风险操作走审批流程,低风险操作该自动就自动。 社交媒体Agent日常起草帖子、自动发布,处理常规内容没问题。但当它准备回复一条关于产品缺陷的客户投诉时,它停了下来,给你发通知:"这条回复我写好了,要发吗?"你看了看,改了一处措辞,点确认。Agent发出去。该自动的自动,该人审的人审,你不用盯着每一条操作,但关键节点上你还是拿着方向盘。 上下文工程解决的就是这个问题——在每次决策前,把相关信息组装好送进去。不只是对话历史,还包括记忆中的用户偏好、当前系统状态、时间日期之类的环境变量。 用户问:"明天的户外会议要不要改期?"如果上下文里只有这句话,Agent只能瞎猜。但如果上下文里还包括明天的天气预报(70%概率下雨)、日历上标注的户外团建活动、用户以前遇到下雨就改期的习惯、以及当前空闲的室内会议室,Agent就能给出一个靠谱的建议——挪到B会议室,理由充分。信息差决定了输出质量。 状态管理就是跟踪每个任务处于什么阶段——已规划、进行中、等待输入、已完成。没有这层机制,稍微复杂点的需求Agent就搞不定。 用户说"调研排名前5的竞品,做一张对比表格"。Agent拆成子任务:第一步,确定竞品名单(进行中);第二步,逐个调研(等第一步的结果);第三步,生成表格(等第二步的结果)。干到一半需要用户确认"你最关心哪些指标",Agent就把这个子任务标成等待状态,抛出问题,转去做别的事。用户回复后,它从中断的地方精确恢复。没有状态管理的话?Agent丢失上下文,只能从头来过。 运行时编排就是这套基础设施。Agent怎么监听多个输入源?怎么优雅关闭?怎么让外部看到它在干什么?怎么防止某个任务把资源全吃光?这些都是编排层要解决的问题。 一个典型场景:Agent同时监听Slack消息、定时任务和Webhook回调。事件队列把每条消息分发给对应的处理器——用户发的紧急Slack消息即时响应,定时报告在后台跑。部署新版本时,关闭处理器先把所有进行中的任务状态存盘。资源限制确保单个任务不会跑超过5分钟、发起超过50次API调用。出了问题,分布式追踪能精确复现整个执行链路。 从零开始?先搞定MCP和工具发现。地基打好了后面加功能才不会出错。最怕一上来就硬编码集成,回头全是技术债。 测试过了但生产环境翻车?上护栏和错误恢复。执行前校验,瞬态故障自动重试。生产环境的边界情况永远比你想的多。 Agent记性差、表现蠢?加记忆。短期记忆给对话,长期记忆存事实。再配合上下文工程确保决策时信息是完整的。 任务卡住跑不动?看看推理循环和状态管理。复杂需求要拆成可追踪的子任务,计划走不通时Agent得有能力自己调整。 担心安全问题?护栏加人在回路中。起步阶段保守一些,随着对Agent能力边界摸清楚了,再逐步放权。 提示词写得不错但Agent还是做出错误决策?问题多半出在上下文工程。检查一下Agent在做决定时到底看到了哪些信息——用户偏好、系统状态、环境变量,是不是漏了什么。把注入的上下文记录下来方便排查。 部署和监控头疼?运行时编排该补上了。事件处理、优雅关闭、可观测性、资源限制。看不见的问题没法修。 需要快速接入大量外部服务?MCP服务器。一个协议打通所有工具,别再给每个新服务手写集成代码了。 API账单蹭蹭往上涨?加资源限制。每个任务的执行时间和API调用次数都该有上限。宁可快速失败,也别把预算悄悄烧光。 用户不信任Agent?高风险操作走人工审批,其他场景靠错误恢复兜底。透明度是信任的前提——告诉用户Agent在干什么、为什么这么干。 https://avoid.overfit.cn/post/4ed56ec4bdcb4f67b50578bee3f0429b by Divy Yadav
1、MCP:通用插件系统

2、推理循环:思考、行动、观察、重复

3、记忆:短期与长期上下文

短期记忆负责维持当前会话的上下文。用户提到"之前说的那个文档",Agent能回溯对话找到具体是哪份。长期记忆则跨越会话边界,持久化存储用户偏好、历史决策、习得的信息。有了长期记忆,Agent会让人觉得"它记得我",而不是每次都像跟陌生人打交道。4、护栏:执行前的安全校验

5、工具发现:运行时自动获取新能力

把工具列表硬编码进Agent,下个月加了Jira集成,就得改代码、重新部署、全量回归测试。脆弱并且不可扩展。6、错误恢复:体面地失败

7、人共介入:知道什么时候该停下来问人

8、上下文工程:喂给Agent对的信息

LLM够聪明工具也到位了,但Agent的决策就是很离谱。为什么?信息没给对。9、状态管理:跟踪多步任务的进度

用户不会只问一个简单问题就完事。他们会提出需要几小时甚至几天才能完成的多步骤项目。Agent必须知道自己做到哪了。10、运行时编排:管理执行环境

Agent不是跑一次就结束的脚本。它是一个长期运行的系统,要响应事件、并行处理任务、扛住重启、还得在资源限制内运转。何时使用每个概念
想咨询一下各位最近使用的这几个模型体感哪个更强呢?
Agent 场景,主要是 tool using/vibe coding
入围的:
如果还有推荐的也可以写(比如 chatgpt )
由于 prompt 其实和模型是较为绑定的(这个很类似当年针对某个芯片版本写的汇编优化,当芯片/编译器版本换了,方法也就失灵了),所以希望选择一个半年内持续使用的模型。希望了解一下大家目前在 tool using/vibe coding 哪个更方便?
公司生产场景,部署在美东
目前在 openrouter 平台,有什么更好的平台也推荐。
参考:
在计算机视觉领域,目标检测、行为识别、三维重建等方向不断演进,但手势识别始终占据着一个非常特殊的位置。 原因在于: 在实际应用中,手势识别被广泛用于: 而“石头 / 剪刀 / 布”这一经典手势集合,具有类别明确、动作差异明显、语义简单等特点,是一个非常适合用于实时视觉系统工程化验证的任务。 哔哩哔哩视频下方观看: 📦完整项目源码 📦 预训练模型权重 🗂️ 数据集地址(含标注脚本 在很多初学项目中,手势识别往往被简化为: 但在真实使用场景中,这种方式存在明显局限: 因此,从工程角度看,“检测 + 识别”一体化方案更具实用价值。 YOLOv8 在本项目中承担了“实时感知引擎”的角色,主要原因包括: 在综合考虑实时性、精度与开发效率后,YOLOv8 成为非常合适的选择。 本项目并不是单纯“跑一个模型”,而是按照完整应用系统的思路进行设计,整体结构如下: 这种设计方式,使系统具备以下特性: 在手势识别任务中,数据集质量直接决定模型表现。本项目在数据采集与整理时,重点关注: 通过引入多样性,降低模型对特定环境的依赖。 项目采用标准 YOLO Detection 标注方式,每一类手势(石头 / 剪刀 / 布)作为独立目标类别进行标注。 这种方式相比“纯分类”具备明显优势: 训练阶段主要包括: 标准训练命令如下: 在本项目中,重点关注以下指标: 当模型在验证集上表现稳定,即可进入部署阶段。 YOLOv8 推理阶段不仅输出类别结果,还会返回丰富的结构化信息: 这些信息可以直接用于: 为实时交互提供基础数据支持。 在很多教学或实验项目中,算法往往只能通过命令行运行,这在真实场景中存在明显问题: 因此,本项目通过 PyQt5 构建完整可视化界面。 这使得整个系统具备“即开即用”的特性。 虽然石头剪刀布看似简单,但该系统本身具备较高的扩展潜力: 在教学、竞赛、毕业设计或原型验证中,都具备较强实用价值。 与单一模型示例不同,本项目的核心价值在于: 它不仅是一个“能跑的 Demo”,更是一个可复用、可扩展的工程模板。 本文围绕“石头剪刀布手势实时识别”这一经典任务,系统性地介绍了一套 基于 YOLOv8 的完整视觉应用方案。通过目标检测而非简单分类的方式,实现了对手势的实时定位与识别,并借助 PyQt5 图形界面完成了从算法到应用的工程化落地。 对于希望深入理解 YOLOv8 实战应用、构建 实时视觉交互系统 或寻找 课程设计 / 毕业设计项目方向的读者而言,该项目具有良好的学习价值和扩展空间。 本文从系统架构与算法实现两个层面,系统阐述了基于深度学习与多 Agent 协同机制的智能感知与决策方案。通过明确各类 Agent 的功能边界、交互方式与协作策略,构建了一个具备感知、分析、决策与执行闭环的智能系统模型。实践表明,多 Agent 架构在复杂动态环境中能够有效提升系统的鲁棒性、扩展性与整体决策效率,为智能交通、智能制造与智慧城市等场景提供了一种具备工程可行性的技术范式。基于 YOLOv8 的石头剪刀布手势识别系统工程实践 [目标检测完整源码]
—— 一套面向实时交互的人机视觉应用完整方案
一、为什么“手势识别”仍然是一个值得做的视觉问题?
手势是人类最自然、最低学习成本的交互方式之一。
源码下载与效果演示
https://www.bilibili.com/video/BV1fn8tzqEm6/
包含:二、从分类到检测:为什么选择 YOLOv8?
2.1 手势识别不只是“分类问题”
裁剪一只手 → 输入分类网络 → 输出类别

2.2 YOLOv8 的技术适配性
三、系统整体架构设计
图像 / 视频 / 摄像头输入
↓
YOLOv8 手势检测模型
↓
识别结果解析(类别 / 置信度 / 位置)
↓
PyQt5 可视化交互界面
↓
实时显示 / 结果保存
四、数据集构建:决定模型上限的关键环节
4.1 数据多样性的重要性
4.2 YOLO 标注格式说明

五、模型训练流程与调优思路
5.1 训练流程概览
yolo detect train \
data=gesture.yaml \
model=yolov8n.pt \
epochs=100 \
batch=165.2 训练效果评估指标
六、实时推理与结果解析机制
results = model(frame)
for box in results[0].boxes:
cls_id = int(box.cls)
conf = float(box.conf)
x1, y1, x2, y2 = box.xyxy[0]
七、PyQt5 图形界面:让算法“能被使用”
7.1 为什么一定要做 GUI?
7.2 界面核心能力
八、从学习项目到应用系统的价值提升


九、工程化总结与实践意义

总结
在计算机视觉领域,目标检测、行为识别、三维重建等方向不断演进,但手势识别始终占据着一个非常特殊的位置。 原因在于: 在实际应用中,手势识别被广泛用于: 而“石头 / 剪刀 / 布”这一经典手势集合,具有类别明确、动作差异明显、语义简单等特点,是一个非常适合用于实时视觉系统工程化验证的任务。 哔哩哔哩视频下方观看: 📦完整项目源码 📦 预训练模型权重 🗂️ 数据集地址(含标注脚本 在很多初学项目中,手势识别往往被简化为: 但在真实使用场景中,这种方式存在明显局限: 因此,从工程角度看,“检测 + 识别”一体化方案更具实用价值。 YOLOv8 在本项目中承担了“实时感知引擎”的角色,主要原因包括: 在综合考虑实时性、精度与开发效率后,YOLOv8 成为非常合适的选择。 本项目并不是单纯“跑一个模型”,而是按照完整应用系统的思路进行设计,整体结构如下: 这种设计方式,使系统具备以下特性: 在手势识别任务中,数据集质量直接决定模型表现。本项目在数据采集与整理时,重点关注: 通过引入多样性,降低模型对特定环境的依赖。 项目采用标准 YOLO Detection 标注方式,每一类手势(石头 / 剪刀 / 布)作为独立目标类别进行标注。 这种方式相比“纯分类”具备明显优势: 训练阶段主要包括: 标准训练命令如下: 在本项目中,重点关注以下指标: 当模型在验证集上表现稳定,即可进入部署阶段。 YOLOv8 推理阶段不仅输出类别结果,还会返回丰富的结构化信息: 这些信息可以直接用于: 为实时交互提供基础数据支持。 在很多教学或实验项目中,算法往往只能通过命令行运行,这在真实场景中存在明显问题: 因此,本项目通过 PyQt5 构建完整可视化界面。 这使得整个系统具备“即开即用”的特性。 虽然石头剪刀布看似简单,但该系统本身具备较高的扩展潜力: 在教学、竞赛、毕业设计或原型验证中,都具备较强实用价值。 与单一模型示例不同,本项目的核心价值在于: 它不仅是一个“能跑的 Demo”,更是一个可复用、可扩展的工程模板。 本文围绕“石头剪刀布手势实时识别”这一经典任务,系统性地介绍了一套 基于 YOLOv8 的完整视觉应用方案。通过目标检测而非简单分类的方式,实现了对手势的实时定位与识别,并借助 PyQt5 图形界面完成了从算法到应用的工程化落地。 对于希望深入理解 YOLOv8 实战应用、构建 实时视觉交互系统 或寻找 课程设计 / 毕业设计项目方向的读者而言,该项目具有良好的学习价值和扩展空间。 本文从系统架构与算法实现两个层面,系统阐述了基于深度学习与多 Agent 协同机制的智能感知与决策方案。通过明确各类 Agent 的功能边界、交互方式与协作策略,构建了一个具备感知、分析、决策与执行闭环的智能系统模型。实践表明,多 Agent 架构在复杂动态环境中能够有效提升系统的鲁棒性、扩展性与整体决策效率,为智能交通、智能制造与智慧城市等场景提供了一种具备工程可行性的技术范式。基于 YOLOv8 的石头剪刀布手势识别系统工程实践 [目标检测完整源码]
—— 一套面向实时交互的人机视觉应用完整方案
一、为什么“手势识别”仍然是一个值得做的视觉问题?
手势是人类最自然、最低学习成本的交互方式之一。
源码下载与效果演示
https://www.bilibili.com/video/BV1fn8tzqEm6/
包含:二、从分类到检测:为什么选择 YOLOv8?
2.1 手势识别不只是“分类问题”
裁剪一只手 → 输入分类网络 → 输出类别

2.2 YOLOv8 的技术适配性
三、系统整体架构设计
图像 / 视频 / 摄像头输入
↓
YOLOv8 手势检测模型
↓
识别结果解析(类别 / 置信度 / 位置)
↓
PyQt5 可视化交互界面
↓
实时显示 / 结果保存
四、数据集构建:决定模型上限的关键环节
4.1 数据多样性的重要性
4.2 YOLO 标注格式说明

五、模型训练流程与调优思路
5.1 训练流程概览
yolo detect train \
data=gesture.yaml \
model=yolov8n.pt \
epochs=100 \
batch=165.2 训练效果评估指标
六、实时推理与结果解析机制
results = model(frame)
for box in results[0].boxes:
cls_id = int(box.cls)
conf = float(box.conf)
x1, y1, x2, y2 = box.xyxy[0]
七、PyQt5 图形界面:让算法“能被使用”
7.1 为什么一定要做 GUI?
7.2 界面核心能力
八、从学习项目到应用系统的价值提升


九、工程化总结与实践意义

总结
这几天在整理物品清单,往 Excel 里录入数字的时候,右手在鼠标和小键盘之间来回切换有点烦,于是又单独找了个数字小键盘放在了主键盘左侧,用左手输数据舒适了很多,等忙完了再想想就很好奇,为什么小键盘默认就放在了键盘的右侧呢? AI 给的解释是因为那个时候鼠标还没问世,等鼠标发明后,数字在右侧就已经成默认的行业标准了。但还是很好奇啊,键盘已经发展这么多年了,分体式、客制化,那么多奇奇怪怪的键盘都有了,为什么把数字键盘放左侧的这种设计没看见什么市场呢?
其中获取您的指纹的一个方法居然是: 检查你装了下面三千插件的哪些
够狠 如果您尝试手动访问 LinkedIn 或许能看到上百的报错
椰子按照安装量排行中整理了一下这三千个插件
或许我们能反向利用 随手分享 新年大吉
开盘每天猜,有实力就来
老规矩 收>开 就是红
主要优化在手机端整体显示的大小问题
| 优化前(字体太小) | 优化后(字体适中) |
|---|---|
![]() | ![]() |
具体设置,非常简单,这里是以 chrome 浏览器为例。



整体大小根据自己使用习惯调整即可!
顺便玩一个回复帖子随机奖励金币的游戏 👾
排名 3000 多,真的是

核心功能总结:
支持 YouTube 视频链接输入
自动生成视频内容摘要
提炼关键信息,节省观看时间
适合学习、研究、内容创作等场景

左边是一个 YouTube 视频,右边是 TLDW 的实时的视频播放和动态分析的内容,分析和总结的速度非常快,除了基础的内容分析标签之外,还可以根据自己的兴趣让 AI 总结自己设定的标签。
它的实时字幕,可以更加方便阅读,同时可以直接跟 AI 以聊天(图 2)的方式随时问它关于这个视频的内容,还可以做笔记(图 3),哈哈。这个是真不错,等于结合了几个小工具的功能,让你在 YouTube 上的学习效率倍增。

图 2

图 3
个人 Blog 原文出处: https://evan.xin/4112
免费体验一把当站长的快乐,但是有限制,就是 discourse 框架,free 计划的存储只有 5G,不太够用,而且数据还不在自己手上,所以,玩玩就好;
免费建站传送门: https://id.discourse.com/create-site
祝各位心想事成!!!
先贴几个小丑




评论区看到喜欢的可以点 ❤️,呼声高的更有机会入选?
之前用的雨燕云,后来经常 timeout,这不昨天下午开始又全 timeout 了。
白嫖的宝可梦不太稳定。
大家推荐点价格实惠,又稳定的梯子吧。
需求:在 Azure 上部署 Prometheus
但是不知道是该用 Container Apps 还是 Container Instance 亦或者是 Azure Managed Prometheus。
有没有用过的小伙伴,想参考一下意见。

总价格: 球拍和球总共 $1.10。
差价: 球拍比球贵 $1.00。
问题: 球多少钱?
参与规则:OP 给出一个【人物】、【地点】、【事件】中任意两个关键信息,请楼下使用上述关键信息造句,并给出下一层的两个关键信息进行造句。
关键信息:【葫芦娃的爷爷和二师兄】、【外包办公区】