# L01 通用型智能体的定义

> **对应视频：** 00:00 — 01:00
> **学习目标：** 理解什么是通用型智能体，以及它和"传统AI"的本质区别

---

## 🎬 课前预习

看视频 **00:00-01:00** 章节：
- 引言
- 通用型智能体的定义

## 📖 课堂笔记

### 什么是通用型智能体？

视频里的定义：
> **通用型智能体包括对话机器人和聊天类输入输出，结果比较单一的交互形式。** 但它的本质不止于此——它能够**理解复杂目标、自主规划、调用工具**，最终完成任务。

对比我们手上的 Hermes Agent：

| 特性 | 视频里的定义 | Hermes 的实际对应 |
|------|------------|-----------------|
| 输入 | 自然语言对话 | 飞书/终端/Webhook 多通道输入 |
| 理解意图 | 任务目标解析 | 用户消息 → 上下文理解 → 工具选择 |
| 输出 | 不只是文字 | 文字回复 + 执行动作 + 文件产出 |
| 交互形式 | 多轮对话 | 上下文窗口延续，循环执行 |

### 传统AI vs 通用型智能体

**传统AI（你以前用过的）：**
- 单一任务（比如：只做翻译、只做客服）
- 定死的工作流
- 不能调用外部工具
- 失败就报错

**通用型智能体（我们正在做的）：**
- 开放式任务
- 自主规划执行
- 可以调用工具/API/浏览器/命令行
- 失败自动重试或回退

### 视频没说的——但你要知道的

这个视频作者是前端背景，所以举的例子偏"对话机器人"。但"通用型智能体"的范畴远比这大：

**我们的 Hermes Agent 就是通用型智能体的完整实现：**
- 能搜网页（web_search）
- 能写代码（terminal/execute_code）
- 能操作浏览器（browser_navigate/click）
- 能读写文件（read_file/write_file/patch）
- 能调度子任务（delegate_task）
- 能归档记忆（memory）

你已经**在用**通用型智能体了——现在只是补理论课。

## 🛠️ 动手环节

在 Hermes 里试试这几个能力，感受"通用型"的含义：

```
1. 说一句：搜索最近的AI新闻
   → 观察它用了 web_search 工具
   
2. 说一句：帮我写一个Python脚本，打印1到10
   → 观察它用了 terminal 或 execute_code

3. 说一句：打开抖音看看有什么新闻
   → 观察它用了 browser_navigate
```

每个指令都触发了**不同的工具**——这就是通用型智能体的本质：**同一个大脑，驱动不同的能力。**

## ✅ 验收标准

学完这节，你能回答：
- [ ] 通用型智能体和传统AI的本质区别是什么？
- [ ] Hermes Agent 是哪种？为什么？
- [ ] 你刚才动手试了哪3个指令？每个用了什么工具？

## 📚 下节预告

L02：「与传统型智能体的区别」—— 五个维度的对比框架，帮你建立评估智能体的能力模型。