【开源】Reddit 生意调研 Agent: 收集和分析数据来解析市场需求 - 完全免费助 lao 出海赚美金
Reddit_Business_Idea_Validator
为什么出海看 reddit?
Reddit 是欧美年轻人扎堆的兴趣社区,类似国内贴吧,但更垂直。用户以 24-44 岁男性为主,爱科技、游戏、亚文化,消费力强且反感硬广。出海人可通过创建兴趣小组(Subreddit)、发干货帖子、办 AMA 问答活动自然引流,但需长期互动,避免直接推销
reddit 的数据获取:
PRAW (Python Reddit API Wrapper) 是一个 Python 库,它封装了 Reddit 的 API, 让我们能够轻松地与 Reddit 进行交互。使用 PRAW, 我们可以获取帖子、评论,甚至可以发布内容或管理 subreddit。PRAW 不仅简化了 Reddit API 的使用,还提供了许多便利功能,使得 Reddit 数据抓取变得轻而易举。
参考: https://blog.csdn.net/m0_73693562/article/details/147905146
我的开源项目介绍
核心功能
- Reddit 数据抓取: 自动抓取相关帖子和评论数据(使用用户输入作为搜索关键词)
- AI 内容分析: 使用 LLM 分析用户痛点和市场需求
- 自动化报告生成: 生成专业的市场验证报告
系统流程图
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 系统入口 │
│ python run_agent.py "业务创意" │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 环境配置与初始化 │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Config │ │ Context │ │ MCP Clients │ │ Storage │ │
│ │ Manager │ │ Store │ │ │ │ Server │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘ │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ Orchestrator Agent 启动 │
│ ┌─────────────────────────────────────────────────────────────────────────┐ │
│ │ 任务: validate_business_idea │ │
│ │ 业务创意: "用户输入的业务创意" │ │
│ └─────────────────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 1. 数据抓取阶段 (Scraper Agent) │
│ ┌─────────────────────────────────────────────────────────────────────────┐ │
│ │ 任务: scrape_data │ │
│ │ - 使用业务创意作为搜索关键词 │ │
│ │ - 通过 Reddit MCP Server 抓取 Reddit 帖子和评论 │ │
│ │ - 保存 checkpoint: scraping_complete.json │ │
│ └─────────────────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 2. 数据分析阶段 (Analyzer Agent) │
│ ┌─────────────────────────────────────────────────────────────────────────┐ │
│ │ 任务: analyze_data │ │
│ │ ├── analyze_posts: 分析帖子内容,提取用户痛点和需求 │ │
│ │ ├── analyze_comments: 分析评论情感和用户反馈 │ │
│ │ ├── comments_tag_analysis: 评论标签分析 │ │
│ │ └── combined_analysis: 综合分析生成市场验证评分 │ │
│ │ 保存 checkpoint: analysis_complete.json, comments_tag_analysis_complete.json│ │
│ └─────────────────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 3. 报告生成阶段 (Reporter Agent) │
│ ┌─────────────────────────────────────────────────────────────────────────┐ │
│ │ 任务: generate_and_save_report │ │
│ │ ├── generate_html_report: 生成 HTML 格式报告 │ │
│ │ ├── save_report: 保存报告到 reports/ 目录 │ │
│ │ └── 保存 checkpoint: report_saved.json │ │
│ └─────────────────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 4. 结果输出与存储 │
│ ┌─────────────────────────────────────────────────────────────────────────┐ │
│ │ 输出文件: │ │
│ │ ├── reports/{business_idea}_{timestamp}.html │ │
│ │ ├── agent_context/checkpoints/{run_id}/ │ │
│ │ │ ├── scraping_complete.json │ │
│ │ │ ├── analysis_complete.json │ │
│ │ │ ├── comments_tag_analysis_complete.json │ │
│ │ │ ├── combined_analysis_complete.json │ │
│ │ │ └── report_saved.json │ │
│ │ └── 小提示: 相关资料请到 agent_context/checkpoints/{run_id}/ 目录下查看 │ │
│ └─────────────────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────────┐
│ 任务完成 │
│ 返回 TaskResult 包含执行结果 │
└─────────────────────────────────────────────────────────────────────────────────┘




