当前位置: 首页 > news >正文

网站目录结构设计应注意的问题广州网站建设便宜

网站目录结构设计应注意的问题,广州网站建设便宜,旅游搜索网站开发,南昌做兼职的网站设计BLIP2的任务是基于已有的固定参数的图像encoder和语言大模型(LLM)搭建一个具有图像理解能力的图文模型,输入是图像和文本,输出是文本。 BLIP2基于Q-Former结构,如下图所示。Q-Former包含图像transformer和文本transfo…

BLIP2的任务是基于已有的固定参数的图像encoder和语言大模型(LLM)搭建一个具有图像理解能力的图文模型,输入是图像和文本,输出是文本。

BLIP2基于Q-Former结构,如下图所示。Q-Former包含图像transformer和文本transformer两个transformer。两个transformer的self-attention layer是共享的。图像transformer的输入是固定数量的可学习的query embedding。query embedding先通过self-attention和文本交互,再并通过cross-attention和图像特征交互。Q-Former的cross-attention的参数随机初始化,其他参数用bert的参数初始化。Q-Former的优势是可以从图像encoder中提取出固定长度的特征。

BLIP2的训练分为两步:

  1. 从固定参数的图像encoder学习视觉文本编码,有Image-Text Contrastive Learning (ITC)、Image-grounded Text Generation (ITG) 、Image-Text Matching (ITM)三个训练目标。
  2. 从固定参数的LLM学习理解图片生成文本。通过FC层连接Q-Former将queries的映射到和文本token相同维度,拼接在文本前面。

 图像encoder选择了CLIP的ViT-L/14和EVA-CLIP的ViT-G/14。LLM选择了OPT和FlanT5。

训练数据包含129M幅图片,来自COCO、Visual Genome、CC3M、 CC12M、SBU、 LAION400M。互联网图片使用CapFilt方法生成文本描述。

http://www.yayakq.cn/news/667641/

相关文章:

  • 专业轻电商网站建设公司华为云建站视频教程
  • 南昌那个公司做网站好wordpress登录修改
  • 网站栏目建设图折扣手游平台app排行榜
  • 网站开发用用什么语言最好pc网站建设哪个好
  • 企业网站设计seo微信开发小程序教程
  • 上海企业建站咨询服务器cpu天梯图
  • 工作室网站建设的意义天津宁河区建设网站
  • 梅州网站建设wlwl抖音宣传推广
  • 网页设计与网站建设教学视频wordpress网银插件下载
  • 网站开发行业怎么样网站一般用什么工具做
  • 谷歌seo网站推广怎么做做医疗器械网站怎么找高清大图
  • 手机建站免费百度指数在哪里看
  • 炉石做任务抽奖网站网站开发设计比赛
  • wordpress 3.5 漏洞seo外链论坛
  • 油画网站模板页面跳转的两种方式
  • 男周志做网站网站建设认知与理解
  • 上海免费做网站网站设计有限公司
  • 怎么用cms做网站淘宝优惠券网站建设教程
  • 做出口网站2022新闻热点10条
  • 六色网站怎么做网站dns加速
  • 网站制作论文题目做类似58同城的网站
  • 黄页推广引流网站wordpress媒体库的目录错误
  • 郑州网站推广价西安做网站朋朋
  • 上海网站商城建设加盟哪家装修公司好
  • 网站建设答辩ppt模板台州外包加工网
  • 网站怎么做移动的图片网页设计实验报告书
  • 北京市网站建设东莞住建局官方网站
  • 网站流量降低社保局网站建设意义
  • 西安网站建设培训班谷歌网站流量分析
  • 中山做网站哪家便宜视频课程网站建设