1.发展阶段
第一阶段:基于规则的聊天机器人(Rule-Based)
代表作:ELIZA
(1966)
原理:通过大量 if-else
规则 或 模式匹配 来"应答"
能力:模拟心理医生,用模板回复你输入的句子
示例:
txt
你说:"我觉得很难过"
它回复:"为什么你觉得难过?"
这些机器人没有理解力,只是简单替换关键词。
第二阶段:基于检索的问答系统(Retrieval-based)
时间:2000s
-2010s
原理:对用户输入用关键词搜索预定义的回答集合
代表产品:早期客服机器人、Siri
初代
缺点:回答死板、不通顺、无法泛化
第三阶段:基于神经网络的对话生成模型(Neural Dialogue Models)
标志:使用深度学习模型来生成回复
- Seq2Seq 模型(2014):用在机器翻译,后来迁移到聊天任务
- 代表作:Google 的 Smart Reply、Facebook 的 ParlAI
缺点:
- 容易生成无意义或重复的回复(比如 "I don't know"、"That's interesting.")
- 对上下文记忆很弱
💥 第四阶段:大语言模型(LLM)驱动的对话系统
里程碑模型 | 发布时间 | 特点 |
---|---|---|
GPT-2 | 2019 | 开始展现通用文本生成能力,但没法聊天 |
GPT-3 | 2020 | 可对话、会写作,回答能力强大 |
InstructGPT | 2022 | 会听指令,比 GPT-3 更"听话" |
ChatGPT (GPT-3.5) | 2022 | 专为多轮对话优化的 LLM,效果大幅提升 |
GPT-4 | 2023 | 支持多模态输入,逻辑更强,更安全 |
GPT-4o | 2024 | 实时语音、图像理解,支持 Function Calling 和 MCP |
✅ 演变趋势总结
阶段 | 特征 | 是否理解用户意图 | 是否能灵活生成 |
---|---|---|---|
规则机器人 | 模板匹配 | ❌ | ❌ |
检索机器人 | 查询库中答案 | ❌ | ❌ |
神经生成模型 | 自动生成文本 | ⚠️ 有限 | ✅ 一定程度 |
LLM(ChatGPT) | 多轮理解 + 工具调用 | ✅ 很强 | ✅ 非常好 |
LLM + Function Calling + MCP | 具备上下文、行动力、记忆能力 | ✅ | ✅+具备工具调用能力 |