[State of GPT] OpenAI讲座随笔记

这篇具有很好参考价值的文章主要介绍了[State of GPT] OpenAI讲座随笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

原版:State of GPT
B站翻译版:【精校版】Andrej Karpathy微软Build大会精彩演讲: GPT状态和原理 - 解密OpenAI模型训练

1 GPT Training Pipeline图解

记录一下对这个图的理解:

[State of GPT] OpenAI讲座随笔记
大模型训练的四个阶段:

  • Pretraining 阶段,数据:低质量的大量文本,模型任务:Predict Next Token任务;这个阶段的模型更多是模型补全,不等于问答;最漫长的训练步骤,需要个把月,底层模型的选择与训练代价非常大了
  • SFT监督学习 ,Prompt问答对的数据,训练集采集的难度较大
  • Reward Modeling反馈式模型,判别式模型
  • RL learning 强化学习,在RM基础上继续强化

2 阶段一:Pretraining 阶段

预训练阶段的模型目标是预测下一步,
[State of GPT] OpenAI讲座随笔记
虽然不能跟问答一样,当然可以给一些提示,达到类似回答的效果:
[State of GPT] OpenAI讲座随笔记


3 阶段二:SFT监督学习

supervised finetuning

[State of GPT] OpenAI讲座随笔记
prompt 是人类指令,response 是标注员写得针对人类指令的示例回复;
高质量问答:
[State of GPT] OpenAI讲座随笔记
这个数据集整理难度蛮高,对于标注员来说需要高质量的回答


4 阶段三:Reward Modeling反馈式模型

[State of GPT] OpenAI讲座随笔记
模型采用的是分类判别式模型,
写一个判断字符串是否是回文字符串的 python 程序,
基于 SFT 模型生成多个回复,比如下面生成了三个回复后让标注员来对生成结果进行排名(排名难度较大,一个 prompt 的答案甚至可能需要几个小时来标注)
[State of GPT] OpenAI讲座随笔记


5:阶段四: RL learning 强化学习

基于上一步的 RM 模型进行强化学习训练,对于prompt之后补齐的文章进行给分,不太好的就负分,好的给高分
[State of GPT] OpenAI讲座随笔记

6 一些结论

RLHF强化学习 相关:

  • 【阶段三 RM】 与 【阶段四 RL】 都是对结果进行特定的“强化”,不过RLHF 模型效果比较好,所以需要加上
  • karpathy 认为 RLHF 有用的原因是判别比生成更容易,让标注员去写一些 SFT 的 QA 数据对是比较难的,如果有一个 SFT 模型生成一些数据让标注员判断哪个更好就简单很多
  • RLHF 模型降低了熵,对输出文本的确定性更强,SFT 模型更善于给出有区分度的回答
    [State of GPT] OpenAI讲座随笔记
    其他还有:
  • SFT 相对容易;RLHF 很难,非常不稳定,很难训练,对初学者不友好,而且可能变化快,不推荐一般人来做

7 一些使用建议

讲座还说了一些写prompt的技巧

推理任务的Prompt方式:Chain of thought

两种方式:

  • few-shot CoT
    就是根据QA给出一些推理逻辑,然后再问下一个问题,相当于有一个例子可以学习一下
  • zero-shot-CoT
    最简单就是Prompt最后加一句话 【 Let’s think step by step】
    [State of GPT] OpenAI讲座随笔记

答案不满意,多生成几次

如果对答案不满意,可以多生成几次
[State of GPT] OpenAI讲座随笔记

反思答案,模型其实并不管生成的内容是否正确,所以你可以反问他,或者prompt的时候多加一句,让他自己检查

[State of GPT] OpenAI讲座随笔记

[State of GPT] OpenAI讲座随笔记

Constrained prompting,按规则模型输入、输出

[State of GPT] OpenAI讲座随笔记

参考材料:文章来源地址https://www.toymoban.com/news/detail-513103.html

  • State of GPT (OpenAI Karpathy 介绍 ChatGPT 原理及现状)

到了这里,关于[State of GPT] OpenAI讲座随笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • OpenAI文档翻译——核心概念(提示词、令牌、模型)

    OpenAI API几乎可以应用于任何涉及理解或生成自然语言、代码或图像的任务。它提供了一系列适合不同任务的不同算力的模型来适应各种任务,这个能力也支持你去调节自己定义的模型。而不同类型的模型可以用于从内容生成到语义搜索和分类的所有事情。 关键概念 在了解关

    2023年04月16日
    浏览(5)
  • OpenAI 生成视频模型 Sora 论文翻译

    视频生成模型作为世界模拟器 本技术报告的重点是 (1) 将所有类型的视觉数据转换为统一表示,以便对生成模型进行大规模训练的方法,以及 (2) 对索拉的能力和局限性的定性评估。 该报告不包括模型和实现细节。 许多先前的工作使用各种方法研究了视频数据的生成建模,包

    2024年02月20日
    浏览(16)
  • 深度解读 ChatGPT、技术原理(AIGC | State Of ChatGPT)

    深度解读 ChatGPT、技术原理(AIGC | State Of ChatGPT)

     图来自:State of GPT | BRK216HFS :  https://www.youtube.com/watch?v=bZQun8Y4L2A State of GPT | BRK216HFS [bZQun8Y4L2A]   目录 类ChatGPT产品的研发过程

    2024年02月09日
    浏览(21)
  • OpenAI Translator | 基于ChatGPT API全局翻译润色解析及ORC上传图像翻译插件

    OpenAI Translator | 基于ChatGPT API全局翻译润色解析及ORC上传图像翻译插件

    OpenAI Translator,一款基于 ChatGPT API 的划词翻译的浏览器插件和跨平台桌面端应用,使用 ChatGPT API 进行划词翻译和文本润色,借助了 ChatGPT 强大的翻译能力,帮助用户更流畅地阅读外语和编辑外语,允许跨 55 种不同语言进行相互翻译、润色和总结,支持浏览扩展、Mac和Windows等

    2023年04月13日
    浏览(16)
  • OpenAI Translator 基于 ChatGPT API 的划词翻译工具

    OpenAI Translator 基于 ChatGPT API 的划词翻译工具

    OpenAI Translator,一款基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用,使用 ChatGPT API 进行划词翻译和文本润色,借助了 ChatGPT 强大的翻译能力,帮助用户更流畅地阅读外语和编辑外语,允许跨 55 种不同语言进行相互翻译、润色和总结,支持浏览扩展、Mac和Windows等等

    2023年04月17日
    浏览(12)
  • OpenAI Whisper + FFmpeg + TTS:动态实现跨语言视频音频翻译

    本文作者系360奇舞团前端开发工程师 本文介绍了如何结合 OpenAI Whisper、FFmpeg 和 TTS(Text-to-Speech)技术,以实现将视频翻译为其他语言并更换声音的过程。我们将探讨如何使用 OpenAI Whisper 进行语音识别和翻译,然后使用 FFmpeg 提取视频音轨和处理视频,最后使用 TTS 技术生成新

    2024年02月09日
    浏览(10)
  • State of the Art Natural Language Processing Tools: A C

    作者:禅与计算机程序设计艺术 Natural language processing (NLP) has become a crucial component in various application domains such as speech recognition, text-based chatbots, information retrieval, and document understanding. There are many open-source NLP tools available for developers to build their applications with ease. In this article we w

    2024年02月08日
    浏览(18)
  • AI大模型探索之路-实战篇1:基于OpenAI智能翻译助手实战落地

    AI大模型探索之路-实战篇1:基于OpenAI智能翻译助手实战落地

    在全球化的浪潮中,语言翻译需求日益增长。市场上涌现出各式各样的翻译工具和平台,然而,免费的解决方案往往局限于简短文本的翻译。面对长篇文档,用户通常不得不转向付费服务。鉴于大型预训练语言模型(LLMs)在自然语言翻译上的显著优势,利用这些模型打造一款

    2024年04月26日
    浏览(13)
  • GPT最佳实践-翻译官网

    https://platform.openai.com/docs/guides/gpt-best-practices/gpt-best-practices 本指南分享了从 GPT 获得更好结果的策略和战术。有时可以结合使用此处描述的方法以获得更大的效果。我们鼓励进行实验以找到最适合您的方法。 此处演示的一些示例目前仅适用于我们功能最强大的模型 gpt-4 .如果

    2024年02月09日
    浏览(23)
  • GPT翻译网站的加载与使用

    GPT翻译网站的加载与使用

    Sider: ChatGPT侧边栏 + GPTs, GPT-4 Turbo, 联网, 绘图 sider.ai https://chromewebstore.google.com/detail/sider-chatgpt%E4%BE%A7%E8%BE%B9%E6%A0%8F-±gpts-g/difoiogjjojoaoomphldepapgpbgkhkb?hl=zh-CN 加入与移除 第二个翻译网站 https://chromewebstore.google.com/detail/openai-translator/ogjibjphoadhljaoicdnjnmgokohngcc

    2024年02月21日
    浏览(8)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包