本文将尽可能简洁地介绍智能代理人工智能架构,并包含示例。
以下是对前面提到的四种智能体架构的简要说明,并使用示例数据进行逐步演示。
- 迭代搜索智能体(基本循环)
这就像一个侦探,每次只搜索一条线索,直到破案为止。它采用 ReAct 模式(原因 + 行动)。
问题:对于复杂的问题,它的速度太慢,因为它一次只能执行一个操作。
示例数据:
用户问题:“新款 iPhone X 的价格是多少?”
步骤 1(原因):我需要找到价格。
步骤 2(行动):搜索 “iPhone X 价格”。
步骤 3(观察):结果显示 “999 美元”。
步骤 4(原因):就这些吗?
步骤 5(行动):搜索 “iPhone X 发布日期”(以防万一)。
最终答案:“iPhone X 的价格是 999 美元。”
- 仅规划器架构(主控)
主控 AI(规划器)不会立即进行搜索,而是先将大问题分解成更小的子任务。这解决了工作量过大或过小的问题。
问题:如果没有规划器,一个简单的问题可能需要进行 5 次搜索才能解决,从而浪费时间。
示例数据:
用户问题:“规划一次为期 3 天的东京之旅。”
规划器(主控)输入:分析复杂度。
规划器输出(计划):
子任务 1:查找航班。
子任务 2:查找酒店。
子任务 3:查找餐厅。
执行:智能体现在完成这 3 个具体任务。
- 规划器 + 评估器(质量控制)
此架构在之前的系统中添加了一个 “评判者”(评估器)。它决定何时停止搜索,以避免智能体陷入循环或过早放弃。
问题:有时智能体过早停止(答案错误)或无限期地搜索(浪费资源)。
示例数据:
用户问题:“特斯拉的首席执行官是谁?”
迭代 1:智能体找到 “埃隆・马斯克是创始人之一”。
评估者(评判者):
这是否足够?否。
知识缺口:没有说明他是现任首席执行官。
迭代 2:智能体搜索 “特斯拉现任首席执行官”,找到 “埃隆・马斯克”。
评估者(评判者):
这是否足够?是。
最终答案:“特斯拉的首席执行官是埃隆・马斯克。”
- 递归搜索智能体(ROMA - 树状结构)
这种架构像家谱一样将问题分解。子问题可以有 “子” 问题。它用于非常深入、复杂的研究,其中一个答案依赖于另一个答案。
问题:对于步骤 B 依赖于步骤 A 结果的大型项目,简单的线性结构并不适用。
示例数据:
用户问题:“分析 A 公司的财务状况。”
一级(主任务):获取财务报告。
二级(子任务):检查 “收入”。
三级(子子任务):将收入与去年同期进行比较。
二级(子任务):检查 “负债”。
三级(子子任务):计算负债权益比率。
最后一步:将三级结果合并,生成最终的一级分析报告。