开源一个 AI 驱动的每日资讯自动推送agent
本来是用来连接到自己的博客每天定时发文章的,发出后看到一些人也有需求,就整理了一下发出来,让大家也能从中获得便利
- 可以自定义添加RSS源和板块,让AI检索哪些RSS源你说了算!
这里分享一个比较全面的RSS源地址项目,佬友们也可以自己查找
支持定时任务,可以自定义时间,每日自动推送释放双手,也可以立即采集即刻获得
做的没那么华丽,佬友们可以根据自己需要进行修改
希望这个项目对大家有一些帮助
xiaohack博客专注前沿科技动态与实用技术干货分享,涵盖 AI 代理、大模型应用、编程工具、文档解析、SEO 实战、自动化部署等内容,提供开源项目教程、科技资讯日报、工具使用指南,助力开发者、AI 爱好者获取前沿技术与实战经验。
本来是用来连接到自己的博客每天定时发文章的,发出后看到一些人也有需求,就整理了一下发出来,让大家也能从中获得便利
这里分享一个比较全面的RSS源地址项目,佬友们也可以自己查找
支持定时任务,可以自定义时间,每日自动推送释放双手,也可以立即采集即刻获得
做的没那么华丽,佬友们可以根据自己需要进行修改
希望这个项目对大家有一些帮助
AutoGLM-GUI v1.5 正式发布啦。这个版本主要聚焦在生产力场景,让 AI
自动化真正可以投入日常使用。
从 v1.4.1 到 v1.5.5,经过 65 个提交,新增了大量功能:
核心功能更新
现在可以设置定时任务,让 AI 自动执行重复性操作。比如:
使用场景:
一行命令部署到服务器,配合定时任务实现真正的无人值守:
docker run -p 8000:8000 Package autoglm-gui · GitHub
特性:
实际场景:
你可以把 AutoGLM-GUI 部署在家里的 NAS 或者云服务器上,通过 ADB WiFi 连接手机,实现:
现在所有的对话和操作都会自动保存到本地数据库,支持:
实用价值:
Android 模拟器(Android Studio、雷电、夜神等)现在可以直接连接,无需任何配置:
开发者友好:
如果你在开发环境测试自动化流程,现在可以直接用模拟器,省去真机配对的麻烦。
AutoGLM-GUI 现在内置了 MCP (Model Context Protocol) 服务器,可以作为工具被其他 AI
应用调用。
工作原理
MCP 服务器集成在 AutoGLM-GUI 的 FastAPI 应用中,通过 HTTP 协议提供服务。你需要先启动 AutoGLM-GUI 服务,然后其他 AI 应用就能通过 MCP 协议调用它的功能。
提供的能力
・chat (device_id, message) - 向设备发送自然语言任务
・list_devices () - 列出所有已连接的设备和状态
使用示例
场景 1:从 Claude Desktop 控制手机
你:帮我用手机打开微信
Claude:[调用 MCP chat 工具] → AutoGLM-GUI 执行 → 返回结果
场景 2:在 Cursor/Cline 中集成
agent.run("帮我清理后台应用")
# → 自动调用 MCP 工具操作你的设备 场景 3:自定义 AI 工作流
配置方式
首先启动 AutoGLM-GUI 服务:
autoglm-gui --base-url YOUR_API_ENDPOINT --port 8000
MCP 服务器端点为 http://localhost:8000/mcp(使用 SSE 传输协议)。
根据你使用的 MCP 客户端(Claude Desktop、Cursor、Cline 等),在配置文件中添加 MCP 服务器连接。具体配置方式请参考各客户端的 MCP 集成文档。
作者:齐海智 在 618 大促的技术战场上,每一行代码、每一个配置都影响着一线的实实在在的业务。一次看似平常的发版,却意外暴露了我们系统中的定时任务管理短板,这促使我们深入剖析分布式任务调度中异常重试机制的技术细节,并最终将其转化为守护系统稳定性的坚固防线。 发版次日,业务部门反馈商家未收到门店收货明细邮件,导致门店收货业务收到影响。技术团队迅速启动应急流程,通过全链路日志追踪和系统状态分析,发现了问题的根源是:发版过程中,由于服务重启,中断了定时任务进程,正在执行的邮件发送任务被意外终止。而该任务在管理平台上并未配置任何重试策略,业务代码上也没有进行相关的检测和重试,这就导致任务失败后无法自动恢复执行,也未被及时感知到,进而引发业务阻断。 为解决燃眉之急,研发人员立即登录任务管理平台,手工触发邮件发送任务,确保业务及时恢复。但这次事件给我们敲响了警钟:在分布式任务调度场景下,面对网络抖动、进程异常终止等场景,异常重试机制是保障业务可靠性的关键。 在复盘问题的过程中,我们发现了EasyJob分布式任务是具有重试策略的,只是默认不开启,而不是默认开启。 该策略以三个核心参数为基础:首次重试间隔时间 F、重试间隔乘数 M 和最大重试次数 C。 通过这三个参数的组合,我们可以灵活控制任务重试节奏,平衡系统负载与任务恢复效率。 例如:配置t=10s, M=2, C=10,则间隔时间依次是: 验证日志: 与上面计算的一致。 验证方案: 1、实现接口:com.wangyin.schedule.client.job.ScheduleFlowTask,并设置任务返回失败: 2、创建CRON触发器 3、设置自动重试参数 4、暂停任务并手工触发一次 根据上述策略,简单实现了一个灵活可配置的任务重试机制。 在上述代码中: 1.TaskRetryExecutor类封装了任务重试的核心逻辑。构造函数接收三个关键参数:firstRetryInterval、intervalMultiplier和maxRetryCount,用于配置重试策略,对应于EasyJob的F、M、C参数。 2.submitRetryableTask方法接收一个可执行任务,并启动重试流程。它调用executeWithRetry方法,初始重试次数为1。 3.executeWithRetry方法是重试逻辑的核心。它使用ScheduledExecutorService来调度任务执行: ◦如果任务执行成功,记录成功日志。 ◦•如果任务执行失败且未超过最大重试次数,计算下一次重试的延迟时间,并递归调用自身进行重试。 ◦•如果超过最大重试次数,记录最终失败日志。 4.calculateRetryDelay方法实现了重试间隔的计算规则: ◦第一次重试使用firstRetryInterval。 ◦之后的重试间隔是前一次间隔乘以intervalMultiplier。 ◦如果超出最大重试次数,返回-1表示错误。 通过这种设计,我们实现了一个可复用、可配置的任务重试机制。它能够根据配置的参数自动调整重试间隔,在任务失败时进行有策略的重试,同时避免无限重试导致的资源浪费。 详细代码可在以下Git仓库中找到:mailto:git@coding.jd.com:newJavaEngineerOrientation/TaskRetryStrategies.git 在对EasyJob也进行了重试的验证中发现: 1.每次重做的乘数取值范围是[1,8],可以是具有一位小数位的浮点数,比如3.5, 2.最多重做次数是[1,16]间的整数,第一次重试的间隔没有限制,单位是秒。 通过上面的验证和重试相关概念的定义,可以得到:第n次重试的间隔时间=第一次间隔时间*乘数^(n-1),即: 其中: 对乘数M的梯度: 对重试次数n的梯度: 详细推导: http://xingyun.jd.com/codingRoot/newJavaEngineerOrientation/T... 从下图可以看出,重试次数n较大时(比如8),乘数 M 的细微变化都会导致,任务的间隔时间发生剧烈变化,因此n超过8之后,M基本不可调。 同样的,从下图可以看到,乘数M较大时(比如4),n的细微变化也会导致任务的间隔时间爆发式的增加。 过小乘数 (<1.5) 的问题: 当乘数 = 1.2,重试 10 次的间隔时间是:1次:1, 2次:1.2, 3次:1.44, ..., 10次:5.16, 10 次重试总间隔仅 5 倍,接近固定间隔,可能导致 "惊群效应"(大量请求同时重试)。 过大乘数 (>4) 的问题 当乘数 = 8,重试 5 次的间隔时间:1次:1, 2次:8, 3次:64, 4次:512, 5次:4096 5 次重试后间隔已超 1 小时(假设初始间隔时间是最小的1s,4096s>1小时),可能导致请求长时间等待,用户体验差。 因此,乘数 = 1.5-4 在 "退避效率" 和 "资源消耗" 间取得平衡,一般取乘数= 2 (标准指数退避)。 行业实践:AWS SDK 默认乘数 = 2,Google gRPC 重试策略推荐乘数 = 1.5-3,多数 HTTP 客户端库 (如 requests) 默认乘数 = 2。 假设单次重试成功概率为P(比如网络/服务临时故障,重试成功概率通常较高),重试 n次至少成功 1 次的概率为: 当 p=0.5,(单次重试 50% 成功概率): n=3 时,成功概率 =1−(0.5)^3=87.5% n=5 时,成功概率 =1−(0.5)^5=96.875% n=10 时,成功概率 =1−(0.5)^10≈99.9% 实际场景中,临时故障的单次成功概率远高于 50% (比如网络抖动重试成功概率可能达 80%) 若 p=0.8,n=3时成功概率已达 1−0.2^3=99.2%几乎覆盖所有临时故障。 因此,3 - 10 次重试,能以极高概率(99%+)覆盖“临时故障”场景,再增加次数对成功概率提升极有限(边际效应递减)。 因为已知的任务延迟时间的公式是: n从1到C进行累加得到总耗时: , 根据等比数列求和公式可以得到: 令 M=2(常用乘数),F=1 秒(最小可能值): n=3时,T=(2^3-1)/(2-1)=7秒 n=5时,T=(2^5-1)/(2-1)=31秒 n=10时,T=2^10-1=1023秒≈17分钟 n=13时,T=2^13-1≈2.3小时 n=15时,T=2^15-1≈9.1小时 当n超过10后,每次增加都会导致总耗时急剧增长,很容易超过业务的容忍上限(具体业务具体分析),也可能因为重试过多,导致被调用的系统压力增加,甚至造成系统崩溃。 故:3 - 10 次重试可将总耗时控制在“业务可接受范围”(几秒到十几分钟),同时避免资源过载。 行业实践:Kafka 消费者重试:默认 10 次、Redis 客户端重试:默认 5 次、Hadoop 任务重试:默认 3-5 次、RFC 建议:RFC 6582(HTTP 重试)建议:3-5 次重试。 通过这次实践和对行业方案的研究,我们总结出异常重试机制设计的四大核心原则: 1.动态适应性原则:重试策略应支持参数化配置,根据业务场景和系统负载动态调整重试间隔和次数,避免 “一刀切” 的重试策略对系统造成冲击。 2.幂等性保障原则:确保任务在多次重试过程中不会产生重复数据或副作用,通过唯一标识、状态机等技术手段,实现任务的幂等执行。 3.故障隔离原则:将重试逻辑与业务逻辑分离,通过消息队列、异步调度等方式,降低重试操作对主线程的影响,避免因重试失败导致系统整体崩溃。 4.可观测性原则:建立完善的监控和告警体系,实时追踪任务重试状态,在达到最大重试次数时及时发出告警,便于运维人员快速定位和解决问题。 这次线上异常事件,犹如一面镜子,让我们清晰地看到了系统中的潜在风险,也为我们提供了一次宝贵的技术提升机会。通过对异常重试机制的深入研究和实践,我们不仅解决了当前问题,更将这些经验转化为团队的技术资产。在未来的 618 大促及其他关键业务场景中,我们将以更完善的技术方案、更严谨的设计原则,守护系统的稳定运行,为业务发展提供坚实的技术保障。一、异常事件回溯:隐藏在发版背后的定时炸弹
二、重试策略设计:从理论到代码的深度解析
2.1 验证EasyJob的重试策略

重试次数 nn 间隔时间计算方式 间隔时间结果 1 10s(初始间隔,无计算) 10s 2 10s×2 20s 3 20s×2 40s 4 40s×2 80s 5 80s×2 160s 21:45:29.990 [main-schedule-worker-pool-1-thread-1] INFO cn.jdl.tech_and_data.EmailSendingTask - 开始执行发送邮件任务
21:45:40.204 [main-schedule-worker-pool-1-thread-2] INFO cn.jdl.tech_and_data.EmailSendingTask - 开始执行发送邮件任务
21:46:00.674 [main-schedule-worker-pool-1-thread-3] INFO cn.jdl.tech_and_data.EmailSendingTask - 开始执行发送邮件任务
21:46:41.749 [main-schedule-worker-pool-1-thread-4] INFO cn.jdl.tech_and_data.EmailSendingTask - 开始执行发送邮件任务
21:48:02.398 [main-schedule-worker-pool-1-thread-5] INFO cn.jdl.tech_and_data.EmailSendingTask - 开始执行发送邮件任务
21:50:43.008 [main-schedule-worker-pool-1-thread-1] INFO cn.jdl.tech_and_data.EmailSendingTask - 开始执行发送邮件任务
任务序号 开始时间 与前一任务的间隔 第 1 个任务 21:45:29.990 - 第 2 个任务 21:45:40.204 10.214 秒 第 3 个任务 21:46:00.674 20.47 秒 第 4 个任务 21:46:41.749 41.075 秒 第 5 个任务 21:48:02.398 80.649 秒(约 1 分 20.65 秒) 第 6 个任务 21:50:43.008 160.61 秒(约 2 分 40.61 秒) 




2.2 实现一个简单的重试策略
public class TaskRetryExecutor {
@Getter
private final ScheduledExecutorService executor = newScheduledThreadPool(10);
private final long firstRetryInterval;
private final int intervalMultiplier;
private final int maxRetryCount;
public TaskRetryExecutor(long firstRetryInterval, int intervalMultiplier, int maxRetryCount) {
this.firstRetryInterval = firstRetryInterval;
this.intervalMultiplier = intervalMultiplier;
this.maxRetryCount = maxRetryCount;
}
public void submitRetryableTask(Runnable task) {
executeWithRetry(task, 1);
}
private void executeWithRetry(Runnable task, int currentRetryCount) {
executor.schedule(() -> {
try {
task.run();
log.info("任务在第{}次尝试时成功执行", currentRetryCount);
} catch (Exception e) {
log.error("任务在第{}次尝试时执行失败", currentRetryCount, e);
if (currentRetryCount <= maxRetryCount) {
long delay = calculateRetryDelay(currentRetryCount);
log.info("计划在{}毫秒后进行第{}次重试", delay, currentRetryCount);
executeWithRetry(task, currentRetryCount + 1);
} else {
log.error("超过最大重试次数。任务执行最终失败。");
}
}
}, currentRetryCount == 1 ? 0 : calculateRetryDelay(currentRetryCount), TimeUnit.MILLISECONDS);
}
public long calculateRetryDelay(int retryCount) {
if (retryCount == 1) {
return firstRetryInterval;
} else if (retryCount > 1 && retryCount <= maxRetryCount) {
long previousDelay = calculateRetryDelay(retryCount - 1);
return previousDelay * intervalMultiplier;
}
return -1; // 超出最大重试次数,返回错误标识
}
}
2.3 重试策略的理论分析
2.3.1 EasyJob对乘数和最大重试次数的限制

2.3.2 梯度分析






1、乘数在1.5-4 的合理性
2、最大重试次数3-10的合理性




3、最佳实践速查表
参数 短期任务(分钟级) 中期任务(小时级) 长期任务(天级) 乘数 2 2 1.75 重试次数 3 - 5 5 - 8 8 - 12 初始间隔(秒) 1 - 5 30 - 60 300 - 600 总耗时范围 <60秒 5 - 10分钟 1 - 2小时 适用场景 临时网络波动 服务重启、发版 服务短暂过载 资源密集型操作 三、经验沉淀:异常重试机制的设计原则
四、结语:以技术沉淀筑牢大促防线
流量统计功能用于统计网站前台的访问数据,包括真人访问和爬虫访问。系统会自动区分访问者类型,并记录详细的访问信息,帮助管理员了解网站的访问情况。 系统会自动排除以下请求: 系统能够识别以下类型的爬虫: 搜索引擎爬虫: 社交媒体爬虫: 其他爬虫: 每条流量记录包含以下信息: 中间件 ( 批量写入任务 ( 数据清理命令 ( 数据模型 ( 管理界面 中间件已在 在 表名: 主要字段: 可以查看: 支持筛选: 支持筛选: 如果需要立即将缓存数据写入数据库,可以执行: 清理超过指定天数的数据: A: 系统会自动排除以下请求: 如果您的访问路径符合以上条件,将不会被统计。 A: 系统每5分钟自动批量写入一次。如果需要立即写入,可以手动执行 A: 有两种方式: A: 可以修改 A: 可以使用 Laravel Tinker: 然后执行: A: 系统采用了以下优化措施: 如果数据量仍然很大,可以考虑: A: 从 A: 可以修改 文档版本:1.0流量统计功能文档

仓库地址:https://gitee.com/teanary/teanary_service目录
功能概述
主要功能
功能特性
1. 智能过滤
/manager/*)/user/*)/api/*).css, .js, .jpg, .png 等)2. 爬虫识别
3. 数据记录
path): 访问的页面路径method): HTTP 方法(通常为 GET)ip): 访问者的 IP 地址user_agent): 浏览器或爬虫的用户代理字符串referer): 来源页面的 URLlocale): 访问时使用的语言代码is_bot): 是否为爬虫访问spider_source): 爬虫的具体来源(如 google、bing 等)count): 同一分钟内相同路径的访问次数stat_date): 统计日期(精确到分钟)技术架构
数据流程
用户访问 → TrackTraffic 中间件 → 缓存数据 → 批量写入队列 → 数据库核心组件
TrackTraffic)app/Http/Middleware/TrackTraffic.phpBatchWriteTrafficStatsJob)app/Jobs/BatchWriteTrafficStatsJob.phpCleanOldTrafficStats)app/Console/Commands/CleanOldTrafficStats.phpTrafficStatistic)app/Models/TrafficStatistic.phpapp/Filament/Manager/Pages/TrafficStatistics.phpapp/Filament/Manager/Resources/TrafficStatisticResource.php缓存机制
traffic:queue:Y-m-d-H-i配置说明
1. 中间件注册
routes/web.php 中注册:Route::prefix('{locale}')->middleware([
SetLocaleAndCurrency::class,
\App\Http\Middleware\TrackTraffic::class
])->group(function () {
// 前台路由
});2. 定时任务配置
routes/console.php 中已配置:// 流量统计批量写入任务(每5分钟执行一次)
Schedule::command('app:batch-write-traffic-stats --queue')
->everyFiveMinutes()
->withoutOverlapping()
->runInBackground();
// 流量统计数据清理任务(每天凌晨2点执行,清理90天前的数据)
Schedule::command('app:clean-old-traffic-stats')
->dailyAt('02:00')
->withoutOverlapping();3. 数据库表结构
traffic_statisticsid: 主键(雪花ID)path: 访问路径(索引)method: HTTP 方法(索引)ip: IP 地址(索引)user_agent: 用户代理referer: 来源页面locale: 语言代码(索引)is_bot: 是否为爬虫(索引)spider_source: 爬虫来源(索引)count: 访问次数stat_date: 统计时间(索引,精确到分钟)使用方法
1. 查看统计看板
2. 查看详细列表
3. 手动触发批量写入
php artisan app:batch-write-traffic-stats4. 手动清理数据
# 清理90天前的数据(默认)
php artisan app:clean-old-traffic-stats
# 清理30天前的数据
php artisan app:clean-old-traffic-stats --days=30
# 清理180天前的数据
php artisan app:clean-old-traffic-stats --days=180数据管理
数据保留策略
数据统计方法
获取指定时间范围内的统计数据
use App\Models\TrafficStatistic;
use Illuminate\Support\Carbon;
// 获取最近7天的所有数据
$startDate = Carbon::today()->subDays(6);
$endDate = Carbon::today()->endOfDay();
$stats = TrafficStatistic::getStatsByDateRange($startDate, $endDate);
// 只获取真人访问数据
$humanStats = TrafficStatistic::getStatsByDateRange($startDate, $endDate, false);
// 只获取爬虫访问数据
$botStats = TrafficStatistic::getStatsByDateRange($startDate, $endDate, true);获取热门页面
// 获取最近7天的热门页面 Top 10
$topPages = TrafficStatistic::getTopPages($startDate, $endDate, 10);
// 只获取真人访问的热门页面
$topHumanPages = TrafficStatistic::getTopPages($startDate, $endDate, 10, false);
// 只获取爬虫访问的热门页面
$topBotPages = TrafficStatistic::getTopPages($startDate, $endDate, 10, true);常见问题
Q1: 为什么有些访问没有被统计?
Q2: 数据多久写入一次数据库?
php artisan app:batch-write-traffic-stats 命令。Q3: 如何修改数据保留时间?
routes/console.php,修改 --days 参数php artisan app:clean-old-traffic-stats --days=天数Q4: 爬虫识别不准确怎么办?
app/Http/Middleware/TrackTraffic.php 中的 isBot() 和 getSpiderSource() 方法,添加或修改爬虫识别规则。Q5: 如何查看缓存中的数据?
php artisan tinker// 查看某个时间点的队列
Cache::get('traffic:queue:2026-01-17-14-30');
// 查看所有流量相关的缓存键(需要 Redis)
Redis::keys('traffic:*');Q6: 数据量很大,会影响性能吗?
Q7: 如何禁用流量统计?
routes/web.php 中移除 TrackTraffic::class 中间件即可。Q8: 可以统计其他路径吗?
app/Http/Middleware/TrackTraffic.php 中的 shouldTrack() 方法,调整过滤规则。相关文件
app/Http/Middleware/TrackTraffic.phpapp/Jobs/BatchWriteTrafficStatsJob.phpapp/Console/Commands/CleanOldTrafficStats.phpapp/Models/TrafficStatistic.phpapp/Filament/Manager/Pages/TrafficStatistics.phpapp/Filament/Manager/Resources/TrafficStatisticResource.phpdatabase/migrations/2026_01_17_204550_create_traffic_statistics_table.php更新日志
2026-01-17
最后更新:2026-01-17
自己日常用青龙面板搞自动化,看到好项目都忍不住想往上搬
这次发现佬友 mumuladu 的 A 股 AI 分析神器,可惜不支持青龙,于是手痒改了一版,分享给同样用青龙的朋友们~
- 适配青龙定时任务,收盘自动跑
- 支持 20+ 推送渠道,报告直达手机
感谢原作者开源!开源精神万岁!
附上几个截图
这次不发 github 了,佬友们自己私下里用用吧
自动登录介绍:
首次登录需要通过 reqable 在微信小程序断点抓包获取 code
目前没有完全绕过 code 的方案
但是聪明的我找了个便捷的方法
只需要填写一次 code,运行登录脚本后,后面就可以一直获取新 session 了,也算得上一劳永逸
后续的账密登录使用了智谱的免费视觉模型进行四则运算识别
设备信息最好填自己的手机设备,如果不填手机设备的话好像是没法签到的
今晚跟这个项目的作者进行了愉快的交流,然后搞了自动登录版
填好配置之后可以在本地运行一下。运行成功直接把 json,一起打包到服务器,就可以愉快的摸鱼了
上面作者当前的版本是 1.6.39,最新版是 1.6.40,映射表有些改变
建议使用最新版
自动签到介绍:
这个脚本我是放在定时任务里 1 分钟执行一次的
默认配置是 8 点 30-9 点的区间进行随机签到
签到的 8 小时后,会在 30 分钟内进行随机的签退
贴心的增加了企业微信的 webhook,可以用来当提示
运行效果:
明天睡醒看看脚本有没有执行,应该是没有 bug
感谢反重力的大力支持
有使用问题可以留言提问
————————————
睡醒一觉发现签到失败了,这 session 连 8 小时都撑不住。。。
改成一个小时更新一次 session 了
手动获取了 session 之后签到时没有问题的