0%

Power of ChatGPT

Posted on 2023-03-27 Edited on 2023-09-21 In MarkdownNotes , Engineering , Computer Science , AI

1. GPT3

三个重要能力

Text Generation, using prompt
In-Context learning
World knowledge, factual knowledge and common sense

来源：大量的数据

2. From GPT3 to ChatGPT

不同的微调指令激发出了不同的能力，这些能力本来就已经有了

上下文学习
对话
代码

3. Code-Davinci

通过指令微调，直接产物是能够响应人类指令

泛化能力：指令数量超过一定范围自动出现

复杂推理能力是训练代码的神奇副产物
面向对象和面向过程

4. Text-Davinci, RLHF

人类反馈（一种训练手段）带来的能力：

更长的回答
公正的回应
拒绝不当问题
拒绝知识范围之外的问题

能力是模型本来就有的，RLHF（人类反馈）触发了新的能力

5. Can’t Do

非常严谨的数学推导

纠正错误的事实