大语言模型推理过程演示
大语言模型的本质:预测补全
大语言模型并不真正理解"对话"的概念,它的本质功能是:
- 补全预测:
- 基于已有文本预测下一个最可能出现的词元
- 不断重复这个预测过程,直到生成完整内容
- 对话的本质:
- 所谓的"对话"只是一种特定格式的文本补全
- 通过"用户:"和"助手:"这样的提示词引导模型生成特定格式的内容
- 概率分布:
- 每一步都会生成多个候选词元及其概率
- 选择概率最高的词元作为输出
- 这个过程是完全基于统计的,而非真正的理解
通过左右对比可以看到:看似是在进行对话,实际上模型只是在不断预测下一个最合适的词元。它并不知道自己在"回答问题",而只是在完成一个补全任务。
© 2024 动画版权归洛小山所有
允许转载但必须注明署名 · 未经允许请勿翻录