# L01 通用型智能体的定义 > **对应视频:** 00:00 — 01:00 > **学习目标:** 理解什么是通用型智能体,以及它和"传统AI"的本质区别 --- ## 🎬 课前预习 看视频 **00:00-01:00** 章节: - 引言 - 通用型智能体的定义 ## 📖 课堂笔记 ### 什么是通用型智能体? 视频里的定义: > **通用型智能体包括对话机器人和聊天类输入输出,结果比较单一的交互形式。** 但它的本质不止于此——它能够**理解复杂目标、自主规划、调用工具**,最终完成任务。 对比我们手上的 Hermes Agent: | 特性 | 视频里的定义 | Hermes 的实际对应 | |------|------------|-----------------| | 输入 | 自然语言对话 | 飞书/终端/Webhook 多通道输入 | | 理解意图 | 任务目标解析 | 用户消息 → 上下文理解 → 工具选择 | | 输出 | 不只是文字 | 文字回复 + 执行动作 + 文件产出 | | 交互形式 | 多轮对话 | 上下文窗口延续,循环执行 | ### 传统AI vs 通用型智能体 **传统AI(你以前用过的):** - 单一任务(比如:只做翻译、只做客服) - 定死的工作流 - 不能调用外部工具 - 失败就报错 **通用型智能体(我们正在做的):** - 开放式任务 - 自主规划执行 - 可以调用工具/API/浏览器/命令行 - 失败自动重试或回退 ### 视频没说的——但你要知道的 这个视频作者是前端背景,所以举的例子偏"对话机器人"。但"通用型智能体"的范畴远比这大: **我们的 Hermes Agent 就是通用型智能体的完整实现:** - 能搜网页(web_search) - 能写代码(terminal/execute_code) - 能操作浏览器(browser_navigate/click) - 能读写文件(read_file/write_file/patch) - 能调度子任务(delegate_task) - 能归档记忆(memory) 你已经**在用**通用型智能体了——现在只是补理论课。 ## 🛠️ 动手环节 在 Hermes 里试试这几个能力,感受"通用型"的含义: ``` 1. 说一句:搜索最近的AI新闻 → 观察它用了 web_search 工具 2. 说一句:帮我写一个Python脚本,打印1到10 → 观察它用了 terminal 或 execute_code 3. 说一句:打开抖音看看有什么新闻 → 观察它用了 browser_navigate ``` 每个指令都触发了**不同的工具**——这就是通用型智能体的本质:**同一个大脑,驱动不同的能力。** ## ✅ 验收标准 学完这节,你能回答: - [ ] 通用型智能体和传统AI的本质区别是什么? - [ ] Hermes Agent 是哪种?为什么? - [ ] 你刚才动手试了哪3个指令?每个用了什么工具? ## 📚 下节预告 L02:「与传统型智能体的区别」—— 五个维度的对比框架,帮你建立评估智能体的能力模型。