当前位置: 首页 > news >正文

成都专业网站制作网站苏州高端网站

成都专业网站制作网站,苏州高端网站,建设银行的官方网站,什么是云速建站服务目标 1、使用开源的大模型服务搭建属于自己的模型服务; 2、调优自己的大模型; 选型 采用通义千问模型,https://github.com/QwenLM/Qwen 步骤 1、下载模型文件 开源模型库:https://www.modelscope.cn/models mkdir -p /data/…

目标

1、使用开源的大模型服务搭建属于自己的模型服务;

2、调优自己的大模型;

选型

采用通义千问模型,https://github.com/QwenLM/Qwen

步骤

1、下载模型文件

开源模型库:https://www.modelscope.cn/models

mkdir -p /data/qwen
cd /data/qwen
git clone --depth 1 https://www.modelscope.cn/qwen/Qwen-14B-Chat.git
# 小内存机器下载1.8B参数的,14B需要几十内存
# git clone --depth 1 https://www.modelscope.cn/qwen/Qwen-1_8B-Chat.git

2、下载使用docker 镜像

docker pull qwenllm/qwen

3、启动脚本

https://github.com/QwenLM/Qwen/blob/main/docker/docker_web_demo.sh

# 修改如下内容
IMAGE_NAME=qwenllm/qwen
QWEN_CHECKPOINT_PATH=/data/qwen/Qwen-14B-Chat
PORT=8000
CONTAINER_NAME=qwen

4、运行

访问http://localhost:8080 即可

sh docker_web_demo.sh

输出如下,可以查看容器日志是否报错。

Successfully started web demo. Open '...' to try!
Run `docker logs ...` to check demo status.
Run `docker rm -f ...` to stop and remove the demo.

效果

文档参考

https://github.com/QwenLM/Qwen/blob/main/README_CN.md

常见问题

1、运行报错 

去掉docker_web_demo.sh中--gpus all

docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

2、Error while deserializing header: HeaderTooLarge

先安装yum install git-lfs 在下载模型文件,模型是git大文件管理,需要git-lfs的支持。

Traceback (most recent call last):
  File "web_demo.py", line 209, in <module>
    main()
  File "web_demo.py", line 203, in main
    model, tokenizer, config = _load_model_tokenizer(args)
  File "web_demo.py", line 50, in _load_model_tokenizer
    model = AutoModelForCausalLM.from_pretrained(
  File "/usr/local/lib/python3.8/dist-packages/transformers/models/auto/auto_factory.py", line 511, in from_pretrained
    return model_class.from_pretrained(
  File "/usr/local/lib/python3.8/dist-packages/transformers/modeling_utils.py", line 3091, in from_pretrained
    ) = cls._load_pretrained_model(
  File "/usr/local/lib/python3.8/dist-packages/transformers/modeling_utils.py", line 3456, in _load_pretrained_model
    state_dict = load_state_dict(shard_file)
  File "/usr/local/lib/python3.8/dist-packages/transformers/modeling_utils.py", line 458, in load_state_dict
    with safe_open(checkpoint_file, framework="pt") as f:
safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge

3、Cannot allocate memory

内存不足,可以尝试选择1_8B小参数的模型。

http://www.yayakq.cn/news/943230/

相关文章:

  • 网站做301东铁匠营网站建设
  • 加速百度对网站文章的收录网站备案就是合法的
  • 北京响应式网站设计广东深圳公司
  • 农产品网站开发自己做的网站可以用于百度推广吗
  • 网站开发为什么需要团队完成网站做任务领q币
  • 网站建设常用的编程语言网站地图的形式
  • 企业网站做seo的优势温岭 网站建设
  • 温室网站建设滁州公司做网站
  • APP开发网站建设哪家好网站建设和维护怎么学
  • 哪些网站可以做养殖的广告太原建站的模板
  • 网络商务网站seo优化是什么意思
  • 网站域名销售公司做网站走什么费
  • 桂林技术交流站网站学什么
  • 内部网站建设计划东莞建设网站的位置
  • 石家庄百度推广家庄网站建设应急管理部
  • WordPress网站根目录有哪些营销智库网站
  • 太原网站制作哪里便宜企业推广策略
  • 网站项目设计与制作优化系统功能
  • 做网站的时候想要满屏简述电子政务网站设计的技术
  • 网站做行测题租远程服务器
  • 网站建设如何使图片翻转重庆市建设工程信息网官网入口
  • 大连网站建设公司wordpress sqll
  • 写作网站大全营销模板WordPress
  • 各类网站厦门网站排名优化费用
  • 找单位做网站需要注意什么祝明电子商务网站建设实验报告
  • 长沙网站建设 鼎誉郴州网站推广
  • 中铁建设集团北京工程有限公司网站如何做搜索引擎优化
  • 医疗网站seo怎么做新产品上市的营销策划方案
  • 商水住房城乡建设网站贵阳专业做网站公司有哪些
  • 网站建设管理规定传媒公司主要做什么