当前位置: 首页 > news >正文

福建建设人才市场官方网站nas可做网站服务器吗

福建建设人才市场官方网站,nas可做网站服务器吗,丹东做网站的,高端网站 设计在此之前,我们已成功利用Docker与Ollama框架,在内网环境中部署了Qwen2模型。下面我们再来看一下使用Docker与vLLM框架部署Qwen2模型。 准备vLLM镜像 在一台具备网络环境的机器上执行以下命令,拉取vLLM的镜像: # 官方镜像 docke…

在此之前,我们已成功利用Docker与Ollama框架,在内网环境中部署了Qwen2模型。下面我们再来看一下使用Docker与vLLM框架部署Qwen2模型。

准备vLLM镜像

在一台具备网络环境的机器上执行以下命令,拉取vLLM的镜像:

# 官方镜像
docker pull vllm/vllm-openai:latest# 如果因为墙的原因,以上命令拉取不到,可以去看看下面这些仓库
Docker仓库:https://docker.1panel.live ✅网友自建
Docker仓库:https://docker.agsv.top  ✅网友自建
Docker仓库:https://docker.agsvpt.work  ✅网友自建
Docker仓库:https://dockerpull.com ✅网友自建
Docker仓库:https://dockerproxy.cn ✅网友自建

下载Qwen2-7B-Instruct模型

我这里下载的是Qwen2-7B-Instruct-GPTQ-Int4的模型。下载地址:

https://huggingface.co/Qwen/Qwen2-7B-Instruct-GPTQ-Int4

编写Dockerfile

我们将Qwen2模型打包上传到服务器,然后编写Dockerfile:

# 基础镜像
FROM vllm/vllm-openai:latest# 暴露端口
EXPOSE 8000# 将模型上传到基础镜像
ADD Qwen2-7B-Instruct-GPTQ-Int4 /home/Qwen2-7B-Instruct-GPTQ-Int4# 容器启动要执行的命令,注意这里一定要是python3
ENTRYPOINT ["python3","-m","vllm.entrypoints.openai.api_server","--served-model-name","Qwen2-7B-Instruct-GPTQ","--model","/home/Qwen2-7B-Instruct-GPTQ-Int4"]

构建镜像

执行docker build命令,构建docker镜像:

docker build -t vllm_qwen2_7b:1.0 -f Dockerfile .

启动容器

执行以下命令,启动docker容器:

docker run -itd --runtime nvidia --gpus all --name vllm_qwen2 --env "HUGGING_FACE_HUB_TOKEN=<secret>" -p 8000:8000 vllm_qwen2_7b:1.0 --max-model-len 8129

经过启动、测试,模型运行没问题。

然后,我们就可以将镜像导出,提供给内网环境使用了:

# 镜像导出
docker save -o vllm_qwen2.tar vllm_qwen2_7b:1.0
# 镜像导入
docker load -i vllm_qwen2.tar

问题解决

问题1、No CUDA GPUs are available

解决方法:

(1)检查是否正确安装了CUDA驱动,执行nvidia-smi可查看。

(2)docker run命令中没有添加--runtime nvidia --gpus all。

问题2:unknown or invalid runtime name: nvidia

解决方法:

当Docker容器需要使用GPU时,需要配置Docker的default-runtimenvidia,然后重启Docker。

{"runtimes":{
"nvidia":{
"path":"nvidia-container-runtime",
"runtimeArgs":[]
}
},
"default-runtime":"nvidia"
}

 如果是Windows版Docker,需要在Docker Desktop中点击右上角的Setting,然后点击Docker Engine,在这里设置完上述配置后,点击restart

 

问题3、Try increasing gpu_memory_utilization or decreasing max_model_len when initializing the engine.

解决方法:

因为GPU内存限制而需要调整模型的最大序列长度。在docker run命令最后加--max-model-len限制。

--max-model-len 8129
http://www.yayakq.cn/news/740606/

相关文章:

  • 国外模板网站石家庄菜谱设计公司
  • 微信商城网站建设网站推广优化开发建设
  • 百度收录网站要多-邵阳网络公司-邵阳网站建设|邵阳网站制作
  • 凉山住房和城乡建设局网站大连网站建设领超最好
  • 建设网站 宣传平台织梦做仿站时 为何会发生本地地址跳转网站地址
  • 北京做电商网站设计网站做担保交易 是否资质
  • 创新创业教育课程网站建设方案小程序招商加盟
  • 做网站需要哪些步骤微信自带小程序商城
  • 什么样的企业需要做网站东莞网页制作招聘信息
  • 如何搭建一个视频网站有没有什么需要推广的平台
  • 什么是网站建设外包西安培训机构
  • 自己做的网站验证码出不来怎么东台网页定制
  • 贵阳网站搜索优化wordpress添加轮播图
  • 京东网站建设框架图湖南郴州
  • 发布工程信息的网站有哪些永久免费的crm软件系统
  • 网站建设安全规划js音乐网站模板
  • 专业网站开发哪里有wordpress 公网贷款
  • 昆明广告网站制作今天体育新闻直播
  • 平顶山建设局网站软件开发工程师和程序员的区别
  • 学校网站群建设方案筑成建设集团网站
  • 西安网站建设网站建设html5制作网站谁的好
  • 做网站需要会编程吗手机网站开发怎么样
  • 网站建设 logowordpress用户数据
  • 郑州网站建设seo优化购物网站排名第一
  • 做网站有弹窗叫什么做图像网站
  • 网站搬家图片怎么做关联词有哪些三年级
  • 隆尧网站建设淮北论坛
  • 动易网站首页制作wordpress 订餐模板
  • 北京seo网站结构优化做网站虚拟主机推荐
  • 贵阳企业自助建站系统wordpress连接微博专业版 破解