
AI是如何具有对话补全能力的训练AI和小孩说话类似先在小孩面前不断重复正确的语句再让小孩模仿着学说话小孩模仿正确时进行肯定小孩模仿错误时进行纠正。训练AI需要大量的语言材料简称语料比如新闻、论文、产品说明书、小说、诗歌、数学题等都是语料用海量的语料训练AI这一步称为预训练AI学会了语法、掌握了海量知识甚至能预测下一句话是什么。预训练结束后的AI还不能直接拿来用。它虽然“博学”但往往不懂礼貌、不会听指令甚至会胡说八道AI幻觉。接下来的工作就是要把AI调教成“懂事、听话、能干活”的助手。这个阶段通常被称为后训练或微调与对齐。后训练有多种方式常用的有问答示范术语监督微调准备大量的“指令-回答”让AI明白遇到这样的问题应该如何回答。评价术语强化学习问AI问题让AI给出几个不同的回答然后由人对这些回答进行打分让AI学会人类的价值观。学专业知识术语领域适配比如希望AI成为医生就用大量的医学相关的语料训练AI让AI掌握这些专业知识。AI的衍生能力用大量语料训练完毕的AI能够胜任文本生成、对话、翻译、代码编写、逻辑推理等与语言相关的任务。具体使用语料时先将语料切割成词元英文名Token可以简单理解为具有独立意义的词或字词元也是AI工作量的计算单位。训练后的AI就是用这些词元来回答用户提出的各种问题。把词元的概念延伸到非语言方面比如图片切割的小块、小段音频、小段视频、现实中的各种物体特征等等用这些非语言的词元形成的语料来训练AI就可以得到各种各样的AI模型。以AI图片生成模型为例用大量视觉词元为语料来训练AI训练后的AI就学会了用视觉词元来回答用户提出的图片要求最后将回答的视觉词元还原成像素并形成图片就像它生成文字一样直接“写”出了图片。AI前景展望