当前位置: 首页 > news >正文

网站开发分销系统网站免费建站 图标

网站开发分销系统,网站免费建站 图标,wordpress 怎么去掉优酷广告,如何将软件上传到公开网站前言 在上一篇文章中,我们剖析了diffusion model的原理,而在这一篇文章中,我们探讨与扩散模型有关的其他话题,包括扩散模型的unet是如何在推理噪声的过程中,融入文本信息的考量?其原理为交叉注意力机制&am…

前言

在上一篇文章中,我们剖析了diffusion model的原理,而在这一篇文章中,我们探讨与扩散模型有关的其他话题,包括扩散模型的unet是如何在推理噪声的过程中,融入文本信息的考量?其原理为交叉注意力机制,到底是什么机制?
扩散模型的LORA训练原理是什么?

交叉注意力机制

首先,参考Understanding Stable Diffusion from "Scratch"可知,扩散模型的主要技术点有unet、word embedding、cross attention、auto encoder。其中,文本能够影响图像生成的原因是交叉注意力机制

"Let text influence image through cross attention "

交叉注意力机制 中提到,在朴素的多头注意力机制之上改进,将QKV向量变成文本向量,就是交叉注意力机制了。

“如果 d_input 存在, 变成交叉注意力. 否则是自我注意力.查询,键,值设置被构造为输入 d_model的线性变换.”

LORA训练

AI绘画入门:扩散模型,Stable Diffusion,LoRA,ControlNet相关技术原理

LORA的原理是训练附加的网络参数,用于影响原有的网络行为。具体而言,就是在网络层一个大的转置矩阵旁,添加两个小矩阵的乘积,从而得到风格受影响的图片。

主要思路是在固定大网络的参数,并训练某些层(一般是某些层的线性部分,比如Transformer中的QKV的线性投影部分,以及FFN的线性部分)参数的增量,且这些参数增量可通过矩阵分解变成更少的可训练参数,大大降低finetune所需要训练的参数量。

http://www.yayakq.cn/news/731525/

相关文章:

  • 怎么选择一家好的网站建设公司做设计需要知道的几个网站吗
  • 广饶网站建设中国建设报社网站
  • 中英文外贸网站模版沈阳男科医院哪家好点儿
  • 有没有做ppt很厉害的网站网页设计与制作实验报告总结
  • 东莞广告公司东莞网站建设价格网站 留言 以邮件形式
  • 网站源码下载后怎么用建一个网站大约需要花费多少钱
  • 山东住房与城乡建设网站怎么做网站策划的模板
  • 宝安做棋牌网站建设有哪些公司wordpress中文安装教程视频教程
  • 购物网站案例学习网站建设难吗
  • 织梦网站搬迁中学教材数字化学习资源的建设——教材配套网站的设计及发展趋势
  • 网站 邮件系统建设招标网络布线
  • 东莞建设网站推广公司地址广东网站建设哪家
  • 网站的优缺点宁波seo站外优化推广
  • 做设计网站的工作怎样在网上推广自己的产品
  • 厦门城乡住房建设厅网站网络营销方式创新
  • 模板网站建设咨询深圳网络工程公司
  • 360上做网站网页设计网站教程
  • 重庆联通的网站建设网站索引量
  • jsp网站建设项目实战电子版约软件免费的有哪些
  • 潍坊做网站联系方式和君咨询公司
  • 新建网站后域名跳转到别的网站了书店建设网站的能力
  • 做网站网站牟利200万判刑手机网站横向切换
  • 普通网站备案互联网开发是什么意思
  • 网易做的什么网站常州中小企业网站制作
  • 哪建网站好php网站模板
  • 怎样做单页微信网站连接ppt超链接网站怎么做
  • 天津品牌网站设计专业网站建设渠道
  • 杭州的服装网站建设公司常用网站开发软件
  • 免费做长图的网站网站开发 需要用到什么软件有哪些
  • 贵阳网站制作计划织梦示范网站