当前位置: 首页 > news >正文

无锡好的网站公司googleseo服务

无锡好的网站公司,googleseo服务,租赁网站空间,教学系统设计 网站开发关于GPT的代码细节,这里梳理了一下: 数据集构造 原始数据集schema: inputwho is your favorite basketball player? outputOf course Kobe Bryant!那么在构造训练集时,根据chunk size构造多个输入: input_1who is …

关于GPT的代码细节,这里梳理了一下:

数据集构造

原始数据集schema:

input=who is your favorite basketball player?
output=Of course Kobe Bryant!

那么在构造训练集时,根据chunk size构造多个输入:

input_1=who is your favorite basketball player? Of
input_2=who is your favorite basketball player? Of course
......
input_n-1=who is your favorite basketball player? Of course Kobe Bryant!
input_n=who is your favorite basketball player? Of course Kobe Bryant! <EOS>

由于训练任务是下一个单词预测,所以 x = i n p u t [ : − 1 ] , y = i n p u t [ 1 : ] x=input[:-1], y=input[1:] x=input[:1],y=input[1:]

loss

x x x是模型可见已知的,需要mask掉,不算入loss:

y[:-1] = -1
loss = F.cross_entropy(logits.view(-1, logits.size(-1)), targets.view(-1), ignore_index=-1)

生成

在karpathy/minGPT项目中,是直接粗暴地生成固定长度的文本。这样做的问题就是生成的文本无法判断何处阶段。

在构造模型输入的时候,我们就加入了 <EOS> token,来标记文本的结束。那么在推理阶段,如果碰到该token,则结束生成:

if token == "<EOS>":break

参考

  • GPT2LMHeadModel
  • mingpt
  • GPT2-NewsTitle
http://www.yayakq.cn/news/719328/

相关文章:

  • 网站的系统建设方式有哪些方面安装完wordpress主题
  • 做网站需要用到ps吗电商网站的建设与运营
  • 一家做土产网站百度推广怎么提高关键词排名
  • 深圳建设网站的公司静态网站举例
  • 网站建设与网页设计...跨境电商无货源怎么做
  • 网站模板做的比较好的app域名在哪里注册
  • 青海专业的网站建设公司网站建设高考题
  • 外贸seo网站网站建设 软文
  • solusvm做网站wordpress mingle
  • 河北做wap网站wordpress 页面 背景图
  • 随州网站建设哪家便宜互联网是做什么工作的
  • 网站开发属于什么部门wordpress数据库字典
  • 宠物论坛网站策划书郴州新网房屋出租
  • 学校门户网站作用企业网站的职能主要有
  • 用vs2010做网站导航网站优化公司收费
  • 网站查询进入上海发乐门网站建设公司
  • 怎么做网站的优化只做同城交易的网站
  • 咋样做网站视频工业产品设计图片欣赏
  • 扶贫网站建设的意义wordpress商业授权价格
  • 建设网站犀牛云手机app下载平台哪个好
  • 海淘网站是谁做的搭建英文网站
  • 公司建设网站策划书东莞网站网络推广
  • 网站压缩做ppt配图好用的网站
  • 网站换主机美化网页制作教程
  • 做网站需要学会些什么新闻摘抄2022最新20篇
  • 喊别人做的网站不肯给代码现在最火的电商平台是什么
  • 室外建筑网站大兴做网站
  • 阿里巴巴外贸网站登录网页传奇推荐
  • mysql php网站开发公司团建拓展训练
  • 用php开发网站教程wordpress品牌分类