AI Agent 知识体系概览
问题
什么是 AI Agent?它和普通的 LLM 调用有什么区别?
答案
AI Agent 是能够自主规划、使用工具、迭代执行的 LLM 应用。与单次问答不同,Agent 可以根据目标自主决定下一步动作,直到任务完成。
一、Agent vs 普通 LLM 调用
| 维度 | 普通 LLM 调用 | AI Agent |
|---|---|---|
| 交互模式 | 单轮输入→输出 | 多步循环,自主决策 |
| 工具使用 | 无 | 可调用搜索、API、代码执行等 |
| 规划能力 | 无 | 可分解任务、制定计划 |
| 记忆 | 无(或仅 Context) | 短期+长期记忆 |
| 迭代 | 无 | 根据结果调整下一步 |
二、Agent 核心架构
核心循环:Think → Act → Observe → Repeat
三、Agent 知识全景
| 模块 | 核心内容 | 文档 |
|---|---|---|
| 核心循环 | ReAct、Think-Act-Observe | Agent 核心循环 |
| 工具调用 | Function Calling、Tool Use | 工具调用机制 |
| 规划 | 任务分解、计划生成 | 规划与推理 |
| 记忆 | 短期/长期记忆管理 | 记忆系统 |
| 多 Agent | 协作、分工、通信 | 多 Agent 系统 |
| 框架 | LangGraph、CrewAI 等 | Agent 框架对比 |
| 评估 | 评估指标、Benchmark | Agent 评估 |
| 安全 | 权限控制、沙箱隔离 | Agent 安全 |
四、Agent 应用场景
| 场景 | 示例 | 关键能力 |
|---|---|---|
| 编程助手 | Cursor、GitHub Copilot Agent | 代码生成 + 文件操作 + 终端 |
| 数据分析 | Code Interpreter | 代码执行 + 可视化 |
| 客服 | 自动查订单、退款 | API 调用 + 多步流程 |
| 研究助手 | 搜索 + 阅读 + 总结 | 搜索 + RAG + 推理 |
| 自动化运维 | 日志分析 + 告警处理 | 工具链 + 决策 |