当前位置: 首页 > news >正文

做舞美的好素材网站j网站 集约化平台建设方案的通知

做舞美的好素材网站j,网站 集约化平台建设方案的通知,seo优化seo外包,免费做直播网站最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。 节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。 针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了…

最近已有不少大厂都在秋招宣讲了,也有一些在 Offer 发放阶段。

节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。

总结链接如下:

  • 《大模型面试宝典》(2024版) 正式发布

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球


图片

大语言模型的构建过程一般分为两个阶段,即:预训练、人类对齐(对齐再细分为指令微调+基于人类反馈强化学习)

预训练-数据准备流程

图片

  1. 原始语料库:为了构建功能强大的语言模型,需要从多元化的数据源中收集海量数据来进行训练。网页、书籍、代码、对话语料是主要的预训练数据。根据来源不同,可以分为通用文本数据和专用文本数据。

  2. 数据预处理:质量过滤、敏感内容过滤、数据去重。这一环节主要通过数据的规则特征、垂直定向小模型训练识别并去除质量差、有毒性、隐私的数据。

  3. 词元化:将文本内容处理为最小基本单元,用于后续的训练准备。

预训练-Transformer模型架构

Transformer是由多层的多头注意力(Multi-head Self-attention)模块堆叠而成的神经网络模型。原始Transformer模型由编码器和解码器两个部分构成,而这两个部分实际上可以独立使用,例如基于编码器架构的BERT模型和解码器架构的GPT模型(后续文章再对Transformer进行详尽解析)

图片

指令微调

指令微调(Instruction Tuning)是指使用自然语言形式的数据对预训练后的大语言模型进行参数微调,也称为有监督微调或多任务提示训练。

指令微调的数据集构建

  1. 基于现有的NLP任务数据集构建:学术界围绕传统NLP任务(如机器翻译、文本摘要和文本分类等)发布了大量的开源数据集合,这些数据是非常重要的监督学习数据资源,可以用于指令数据集构造。

  2. 基于日常对话数据构建:用户在日常对话中的实际需求作为任务描述,与人类真实诉求较为匹配,增加数据的多样性。

  3. 基于合成数据构建:借助已有高质量指令数据作为上下文学习示例,输入给大语言模型,进而生成大量多样化的任务描述和输入-输出数据。

指令微调的训练策略

  1. 优化设置:指令微调中的优化器设置(AdamW或Adafactor)、稳定训练技巧(权重衰减和梯度剪裁)和训练技术(3D并行、ZeRO和混合精度训练)都与预训练保持阶段一致,可以完全沿用。下面列出指令微调与预训练的不同之处。

  2. 数据组织:平衡数据分布

  3. 参数高效微调:如 低秩适配微调方法、适配器微调、前缀微调(这里我们也留到后文进行详细介绍,本文优先关注整体流程)

人类对齐RM/RL(强化学习阶段)

人类对齐是一个较为抽象的概念,难以直接进行形式化建模,代表性的是有用性(Helpfulness)、诚实性(Honesty)和无害性(Harmlessness),主要由以下两个阶段

奖励模型训练

这一步是使用人类反馈数据训练奖励模型

首先,使用语言模型针对任务指令生成一定数量的候选输出

然后,邀请标注员对于输出文本进行偏好标注(形式多种)

最后,使用偏好数据进行奖励模型的训练,使其建模人类偏好。

强化学习训练

这一步,语言模型对齐被转化为一个强化学习问题。具体来说:

待对齐语言模型担任策略实施者角色(称为策略模型),它接收提示作为输入并返回输出文本,其动作空间是词汇表中所有词元,状态指的是当前已生成的词元序列。

奖励模型则根据当前语言模型的状态提供相应的奖励分数,用于指导策略模型的优化。

为了避免当前训练轮次的语言模型明显偏离初始(强化学习训练之前)的语言模型,通常会在原始优化目标中加入一个惩罚项(如KL离散度)

例如:Instruct GPT使用PPO算法来优化待对齐语言模型,以最大化奖励模型的奖励。对于每个输入提示,InstructGPT计算当前语言模型与初始语言模型生成结果之间的KL离散度作为惩罚项。KL散度越大,意味着当前语言模型越偏离初始语言模型。

http://www.yayakq.cn/news/33355/

相关文章:

  • 做网站怎么接活求职简历在哪个网站做
  • 苏州前几天网站建设东莞网站建设培训学校
  • 网站设计与网页制作教程开发软件多少钱一个月
  • 网站建设的目入图片wordpress ssl
  • 网站怎么做舆情监测网站设计一般多少钱
  • 中山网站建设的企业百度seo公司
  • 宝塔Linux面板清理建设的网站电商平台如何引流推广
  • 南阳网站优化wordpress apply_filters
  • 湘潭网站建设 多少钱磐石网络wordpress认证系统
  • 自媒体平台网站开发怎么做网站导航外链
  • 提升网站打开速度怎么做电商网站开发缓存
  • 营销型网站建设的特别之处都有哪些手机网站 焦点图
  • 基础建设的网站有哪些内容企业名录网站 优帮云
  • vs2019怎么创建网站wordpress用户注册邮件内容自定义
  • 网站验证码系统湖南网站建设公司 地址磐石网络
  • 主任说到学校新网站的建设工作营销型网站策划怎么做
  • 建设单位网站值得浏览的外国网站
  • 节约化网站群建设情况代码在wordpress
  • 宁波网站建设的公司网站开发与设计入门
  • dw2019怎么做网站南平网站怎么做seo
  • 找人做网站一套多少钱湖南常德邮编
  • 网站动态小图标52麻将官方网站做代理
  • 宁夏银川做网站的公司长沙网站搭建
  • 关于做女装的网站福建省新特建设工程有限公司网站
  • 做网站行业如何跟客户交流wordpress主页修改主页
  • 电子商务网站建设期末作业转发文章赚钱的网站建设
  • 自己怎么创建网站有创意的网络公司名字大全
  • 淘宝客如何做返积分制网站品牌广告文案
  • 求职网站排名毕业设计代做的网站
  • 电子商务网站建设第一章课后在线视频网站怎么做