大语言模型推理演示 - 理解AI如何生成回答 | 洛小山

二维码

大语言模型推理过程演示

用户看到的 - 对话界面

请介绍一下大语言模型。

|

AI 实际在做的 - 预测下一个词

输入文本：

用户：请介绍一下大语言模型。助手：

|

模型预测过程

大语言模型的本质：预测补全

大语言模型并不真正理解"对话"的概念，它的本质功能是：

补全预测：
- 基于已有文本预测下一个最可能出现的词元
- 不断重复这个预测过程，直到生成完整内容
对话的本质：
- 所谓的"对话"只是一种特定格式的文本补全
- 通过"用户："和"助手："这样的提示词引导模型生成特定格式的内容
概率分布：
- 每一步都会生成多个候选词元及其概率
- 选择概率最高的词元作为输出
- 这个过程是完全基于统计的，而非真正的理解

通过左右对比可以看到：看似是在进行对话，实际上模型只是在不断预测下一个最合适的词元。它并不知道自己在"回答问题"，而只是在完成一个补全任务。

© 2024 动画版权归洛小山所有
允许转载但必须注明署名 · 未经允许请勿翻录