当前位置: 首页 > news >正文

下载站源码cms网站建设公司 北京

下载站源码cms,网站建设公司 北京,云南建设项目审批中心网站,网站建设外包平台项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实…

在这里插入图片描述

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身的硬实力。

在这里插入图片描述

  1. 专栏订阅:项目大全提升自身的硬实力

  2. [专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域)

激发创新,助力研究:CogVLM,强大且开源的视觉语言模型亮相

  • CogVLM 是一个强大的开源视觉语言模型(VLM)。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。

  • CogVLM-17B 在 10 个经典跨模态基准测试上取得了 SOTA 性能,包括 NoCaps、Flicker30k captioning、RefCOCO、RefCOCO+、RefCOCOg、Visual7W、GQA、ScienceQA、VizWiz VQA 和 TDIUC,而在 VQAv2、OKVQA、TextVQA、COCO captioning 等方面则排名第二,超越或与 PaLI-X 55B 持平。您可以通过线上 demo 体验 CogVLM 多模态对话。

1.demo案例展示

  • CogVLM 能够准确地描述图像,几乎不会出现幻觉
    LLAVA-1.5 和 MiniGPT-4 的比较。

  • CogVLM 能理解和回答各种类型的问题,并有一个视觉定位版本。

  • CogVLM 有时比 GPT-4V(ision) 提取到更多的细节信息。

2.快速使用

CogVLM 模型包括四个基本组件:视觉变换器(ViT)编码器、MLP适配器、预训练的大型语言模型(GPT)和一个视觉专家模块。更多细节请参见论文。

2.1入门指南

我们提供两种图形用户界面(GUI)进行模型推断,分别是网页演示命令行界面(CLI)。如果您想在Python代码中使用它,很容易修改CLI脚本以适应您的情况。

首先,需要安装依赖项。

pip install -r requirements.txt
python -m spacy download en_core_web_sm
  • 硬件要求
    • 模型推断:1 * A100(80G) 或 2 * RTX 3090(24G)。
    • 微调:4 * A100(80G) [推荐] 或 8 * RTX 3090(24G)。

2.2 网页演示

我们还提供基于Gradio的本地网页演示。首先,通过运行 pip install gradio 安装Gradio。然后下载并进入此仓库,运行 web_demo.py。具体使用方式如下:

python web_demo.py --from_pretrained cogvlm-chat --version chat --english --bf16
python web_demo.py --from_pretrained cogvlm-grounding-generalist --version base --english --bf16

网页演示的 GUI 界面如下:

2.3 CLI

我们开源了不同下游任务的模型权重:

  • cogvlm-chat 用于对齐的模型,在此之后支持像 GPT-4V 一样的聊天。
  • cogvlm-base-224 文本-图像预训练后的原始权重。
  • cogvlm-base-490 从 cogvlm-base-224 微调得到的 490px 分辨率版本。
  • cogvlm-grounding-generalist 这个权重支持不同的视觉定位任务,例如 REC、Grounding Captioning 等。

通过CLI演示,执行以下命令:

python cli_demo.py --from_pretrained cogvlm-base-224 --version base --english --bf16 --no_prompt
python cli_demo.py --from_pretrained cogvlm-base-490 --version base --english --bf16 --no_prompt
python cli_demo.py --from_pretrained cogvlm-chat --version chat --english --bf16
python cli_demo.py --from_pretrained cogvlm-grounding-generalist --version base --english --bf16

该程序会自动下载 sat 模型并在命令行中进行交互。您可以通过输入指令并按 Enter 生成回复。
输入 clear 可清除对话历史,输入 stop 可停止程序。

  • 参考链接

https://github.com/THUDM/CogVLM/tree/main

在 CogVLM 的指令微调阶段,使用了来自 MiniGPT-4 、 LLAVA 、 LRV-Instruction、 LLaVAR 和 Shikra 项目的一些英文图像-文本数据,

更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。

http://www.yayakq.cn/news/212107/

相关文章:

  • 做网站所需技术关键词分为哪三类
  • 做网站有哪些好公司有哪些设计网站
  • 灵武市建设银行网站深圳创意网站
  • 淘宝直播要先建设个网站吗网站设计制作什么时候好
  • 上海青浦网站建设公司交互有趣的网站
  • 建设宣传家乡的网站自己设计一个网站首页
  • 网站开发流程原理写网页的素材图片
  • 为公司建设网站的意义西安机场商务宾馆百度做网站
  • 馆陶网站建设网站建设400电话
  • 代码高亮网站国外网站 dns
  • 李洋网络做网站怎么样网站类型有哪些
  • 可以显示一张图片的网站怎么搭建华为做网站
  • 网站关键词推广价格wordpress记录访问量
  • 网站客户续费wordpress二次开发教程
  • 沧州网站推广python官网下载安装
  • 网站开发属于什么岗位中国网络营销论坛
  • 河北省住房和建设厅网站有口碑的常州网站优化
  • mysql asp网站展厅策划设计公司
  • 自媒体平台企业网站怎么设置建设信息门户网站的条件
  • 江门营销型网站建设多少钱简单的企业网站源码
  • 90设计网站会员全站通与电商模板的区别智慧团建手机登录入口
  • 彩票网站开发制作wordpress 自动超链接
  • 自己做网站nas做网页局域网站点配置
  • 网站建设管理规范淘宝客 网站选择WORDPRESS
  • 网站做商业计划书吗网站的域名做邮箱
  • 龙华做手机网站美橙表业手表网站
  • 做微信平台图片网站济南莱芜金点子信息港
  • linux上安装wordpress网站排名优化多少钱
  • 昆明做网站多少钱wordpress主题域名授权破解版
  • 男女做爰视频网站在线织梦可以做淘宝客网站吗