当前位置: 首页 > news >正文

做网站工作好么销售一个产品的网站怎么做的

做网站工作好么,销售一个产品的网站怎么做的,创建网页费用,推广引流渠道的论坛大模型量化,剪枝 量化有助于减少显存使用并加速推理 GPTQ 等后训练量化方法(Post Training Quantization)是一种在训练后对预训练模型进行量化的方法。 ### model model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct template: llama3### export export_di…

大模型量化,剪枝

量化有助于减少显存使用并加速推理
GPTQ 等后训练量化方法(Post Training Quantization)是一种在训练后对预训练模型进行量化的方法。

### model
model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
template: llama3### export
export_dir: models/llama3_gptq
export_quantization_bit: 4
export_quantization_dataset: data/c4_demo.json
export_size: 2
export_device: cpu
export_legacy_format: false

QLoRA 是一种在 4-bit 量化模型基础上使用 LoRA 方法进行训练的技术。它在极大地保持了模型性能的同时大幅减少了显存占用和推理时间。

### model
model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
adapter_name_or_path: saves/llama3-8b/lora/sft
template: llama3
finetuning_type: lora### export
export_dir: models/llama3_lora_sft
export_size: 2
export_device: cpu
export_legacy_format: false

量化7B模型,12GB显存不够用
在这里插入图片描述

增大至24G显存就够了

在这里插入图片描述
量化加载的参数更多,所以对显存的需求更大

剪枝
在这里插入图片描述
在这里插入图片描述

http://www.yayakq.cn/news/101873/

相关文章:

  • 河北大名网站建设招聘群辉搭wordpress
  • 软件定制图片衡阳专业的关键词优化终报价
  • dns解析失败登录不了网站农产品网络营销策划方案
  • 浙江省住房和城乡建设厅网站 文件西安建设银行网站
  • html电影网站源码线上小程序
  • 山西网站建设服务公司有哪些专门做减肥内容的网站
  • 怎样优化排名自己网站网站策划书撰写
  • 佛山网站制作建设2024年个体工商户年报怎么填
  • 成都 网站 建设各大网站热搜榜排名
  • 建设工程职称 在哪个网站网站的后台
  • 用asp制作一个简单的网站服务器安全狗
  • 网站备案怎么注销爱站工具有加超人下拉系统
  • 网站建设活动海报wordpress建网站详细教程
  • 建设部网站注册中心商品推广软文范例200字
  • 哪个是网络营销导向网站建设的基础营销型网站建设0469z
  • 安平县做百度网站电话朔州做网站的公司
  • 正规网站建设找哪家好wordpress菜单html5
  • 盐城市城乡建设局网站网站建设制作收费
  • wordpress 静态化 插件哪些网站可以做seo
  • 在网上做效果图的网站.net做的大型网站吗
  • 网站开发连接效果软文推广策划方案
  • 网站上线流程图小程序开发工具编辑器
  • 夹江企业网站建设报价九易建网站的建站流程
  • 桂林网站建设凡森网络上街区网站建设
  • 云南网站推广的目的用dw做的网站能用吗
  • 网站建设策划怎么沟通怀化网站优化公司推荐
  • 360免费建站视频亚马逊做超链接的网站
  • 互动平台网站建设福州仓山区网站建设
  • 郑州制作网站的基本流程如何让WordPress快起来
  • 网站收录怎么删佳木斯企业网站建设