当前位置: 首页 > news >正文

大型行业门户网站开发建设方案wordpress 搭建多站点

大型行业门户网站开发建设方案,wordpress 搭建多站点,阿里云网站如何建设,dede网站移动端怎么做Huggingface的GenerationConfig 中的top_k与top_p详细解读 Top_kTop_p联合共用 Top_k top-k是指只保留概率最高的前k个单词,然后基于剩余单词的概率进行归一化,从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度,并仍然保持…

Huggingface的GenerationConfig 中的top_k与top_p详细解读

  • Top_k
  • Top_p
  • 联合共用

Top_k

top-k是指只保留概率最高的前k个单词,然后基于剩余单词的概率进行归一化,从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度,并仍然保持样本的一定多样性。

举个例子,在使用语言模型生成「这个周末天气很」的句子时,top-k保留概率最高的三个单词为「好」「热」「冷」,此时将剩余单词进行概率归一化,把它们的概率设定为0,之后在三个保留的单词中随机选择一个,比如选择了「好」后,这个句子就变成了「这个周末天气很好」。这个过程可以反复进行,直到生成的句子已经满足需要。

通过使用top-k,我们可以限制输出序列的长度,并尽可能地保持语句的一定多样性,同时控制结果的生成质量。需要注意的是,取值过小会导致结果过于随机,而过大可能会限制生成的单词种类和多样性,这个超参的设定需要根据任务需求和经验进行调整。

Top_p

top-p是一种用于在文本生成中控制输出的策略。top-p算法保留累计概率之和达到一个给定阈值p的概率分布中的词汇,然后在这个分布中进行随机采样,从而生成一个单词。

举一个例子,假设我们选择的p值为0.8,然后通过语言模型预测下一个单词。假设根据模型,我们得到了10个可选单词,它们分别具有不同的概率分布。下面是假设的10个单词和它们的概率:

  • 单词1: 0.25
  • 单词2: 0.20
  • 单词3: 0.15
  • 单词4: 0.1
  • 单词5: 0.07
  • 单词6: 0.06
  • 单词7: 0.05
  • 单词8: 0.04
  • 单词9: 0.03
  • 单词10: 0.01

根据top-p算法,我们会按照概率从大到小的顺序,逐个累加单词的概率,直到累计概率达到0.8。上面10个单词累计概率为:

  • 单词1: 0.25
  • 单词1+单词2: 0.45
  • 单词1+单词2+单词3: 0.60
  • 单词1+单词2+单词3+单词4: 0.70
  • 单词1+单词2+单词3+单词4+单词5: 0.77
  • 单词1+单词2+单词3+单词4+单词5+单词6: 0.83

累加到单词6时,累计概率已经达到了0.83,因此我们会从这6个单词中进行随机抽样,以选择最终的输出。

top-p算法可以控制输出单词的多样性,因为它可以保留给定阈值下的累计概率的单词。如果阈值设置的比较小,如0.3,则选择的单词就更少,结果可能不够多样化;如果阈值设置的比较大,如0.9,则选择的单词就更多,结果可能会过于随机。因此,选择一个合适的阈值需要结合任务需求和实际情况进行测试和调整。

联合共用

假设我们要生成一个关于水果的简短文本,我们的模型输出了以下10个单词和它们的概率分别是:

  • 苹果:0.2
  • 橙子:0.2
  • 香蕉:0.1
  • 葡萄:0.1
  • 草莓:0.1
  • 芒果:0.1
  • 桃子:0.05
  • 菠萝:0.05
  • 柚子:0.04
  • 火龙果:0.03

我们想要生成多样性的语句,那么可以在top-k和top-p的约束下进行采样,下面来具体说明。

首先,我们可以设置top-k为5,表示保留概率最高的5个单词。这样就会保留苹果、橙子、香蕉、葡萄和草莓这5个单词,并去掉其他单词,也就是

  • 苹果:0.2
  • 橙子:0.2
  • 香蕉:0.1
  • 葡萄:0.1
  • 草莓:0.1

接下来,我们可以使用top-p的方法,保留概率的累计和达到0.9的单词,也就是选取橙子、苹果、草莓三种水果。我们对这三种水果重新进行归一化,概率分别为:

  • 苹果:0.4
  • 橙子:0.4
  • 草莓:0.2

接着,我们可以从上述分布中进行随机采样,选取一个单词作为最终的生成结果。最终生成的水果可能是苹果或橙子或草莓,并且橙子和苹果的概率要比草莓的概率高一些,因为它们的概率更大。

从这个例子可以看出,top-k和top-p可以结合使用,确保我们生成的语句既具有多样性,又具有合理性,同时可以吸引读者的注意力。在不同的任务和需求中,我们可以根据实际情况来调节参数,从而得到更好的输出结果。

http://www.yayakq.cn/news/881776/

相关文章:

  • 丹阳网站建设咨询内蒙古建设厅建筑网站
  • 黑龙江网络公司网站建设wordpress 国内知名
  • 凌云县城乡建设局网站海口网站建设哪家最好
  • 网站谷歌优化怎么做营销网络广告
  • 成都市微信网站建设公司seo培训机构排名
  • 给客户做非法网站建设网站需要租用服务器
  • 门户网站建设培训简报新乡市建设局网站
  • 养车网站开发如何找做网站的客户
  • 商务网站主页设计公司wordpress关闭评论窗口
  • 个人网站需要多大空间wordpress auto
  • logo灵感网站怎么做关键词优化排名
  • app如何推广以及推广渠道莱芜网站优化方案
  • 怎么把自己做的网站登录到网上网站优化要素
  • 龙岗网站建设深圳信科广西建设工程协会网站查询
  • 网站建设公司不让放自己空间站网络营销策划方案展示
  • 建设一个班级网站的具体步骤网站制作公司排行榜
  • 购物网站二级店铺mvc高端品牌衣服有哪些牌子
  • 用lnmp做网站高中教学网站
  • 做流媒体视频播放网站求助wordpress 百度云盘
  • 公司网站服务器选择有哪些下载软件的应用
  • 淘宝客网站程序购米搜索微信公众号平台
  • 网站建设的常见技术有哪些临安区建设局网站
  • 小米网站开发流程书海南网络推广评估
  • 巴彦淖尔市网站建设百度制作网站
  • 网站备案哪个部门网页设计制作素材下载
  • 张家界建设网站的公司安溪住房和城乡建设网站
  • 建站公司一般用什么框架电商是做什么的工作内容是什么
  • 在网站建设论文的基本分析wordpress页面教程视频教程
  • 建设大型门户网站重庆seo关键词排名
  • 营销型网站名词解释天津网站建设方案优化