| 随笔

LLM的对齐、幻觉和可控文本生成

弄清楚关于大模型的对齐、幻觉和可控文本生成三者的含义，并区分三者的区别和重合之处，并对三者的技术解决方案进行阐述以及目前已有的技术解决方案存在的改进空间。

定义：对齐是指使模型符合人类的偏好和价值观

解决方案：

优点：泛化效果好

缺点：不稳定的训练效率和数据利用率

优点：训练效率高，收敛快

缺点：泛化性差

优点：很小的对齐tax

缺点：效果依靠模型的能力，难以应用到不同场景

定义：幻觉是一种现象，指生成无意义和不忠于原内容的文本

分类

原因

缓解事实性幻觉的方法叫做知识注入（不是教授全新的知识，而是通过诱导偏见来刷新记忆）

知识注入分为两种：

RAG的挑战

定义：可控文本生成是指能够指导模型按照特定的要求或条件生成文本。这包括控制文本的风格、情感、主题、长度等属性。

对齐关注的是模型输出的道德和社会可接受性，幻觉关注的是模型输出的准确性和真实性，而可控文本生成关注的是模型输出的定制化和用户需求的满足。

这三者在实践中是相互关联的。为了实现可控文本生成，模型需要在对齐的基础上避免幻觉，确保生成的内容既符合用户的期望，又准确无误。同时，对齐和幻觉的解决也有助于提高可控文本生成的质量，因为用户期望的输出首先应该是真实和合理的。

例子：

人类命令LLM跑步去将地上的苹果捡起来

对齐：LLM确实是去捡东西了，可能捡错对象或者没捡起来，但是确实是去捡东西了，而不是去把苹果踩碎，与人类的命令一致

幻觉：LLM将梨捡起来了

可控文本生成：LLM确实是将苹果捡起来了，但是不是跑过去的，是爬过去的或者跳过去的