0%

想法

Posted on 2024-03-05

在训练大模型的时候，可以从一些老师的课程视频中将字幕识别下来，作为LLM的训练数据
历史告诉我们会怎么样，科学告诉我们怎么改变
一个预训练模型在两批数据上训练，训练的顺序先后颠倒得到的模型还是一样的吗（大模型的遗忘问题）
预训练模型的预训练数据的前后训练顺序对模型有影响吗
人类的所有创新都是排列组合
幻觉就是创新？
大模型如何在跟人类对话的同时进行训练，推理即微调, 实时更新
指令冲突时，大模型听哪个指令？