当前位置: 首页 > news >正文

做网站卖设备找哪家好做网站云服务器选择多大带宽

做网站卖设备找哪家好,做网站云服务器选择多大带宽,两个域名指向同一个网站怎么做,南昌县建设局网站文章目录 简介Github文档克隆源码英文模型编译运行中文模型(280M)main函数 简介 llama2.c是一个极简的Llama 2 LLM全栈工具,使用一个简单的 700 行 C 文件 ( run.c ) 对其进行推理。llama2.c涉及LLM微调、模型构建、推理端末部署&#xff08…

文章目录

  • 简介
  • Github
  • 文档
  • 克隆源码
  • 英文模型
  • 编译运行
  • 中文模型(280M)
  • main函数

简介

llama2.c是一个极简的Llama 2 LLM全栈工具,使用一个简单的 700 行 C 文件 ( run.c ) 对其进行推理。llama2.c涉及LLM微调、模型构建、推理端末部署(量化、硬件加速)等众多方面,是学习研究Open LLM的很好切入点。

在这里插入图片描述

Github

  • https://github.com/karpathy/llama2.c

文档

  • https://llama.meta.com/

克隆源码

git clone https://github.com/karpathy/llama2.c.git

英文模型

  • https://huggingface.co/datasets/roneneldan/TinyStories
# 15M参数模型
wget https://huggingface.co/karpathy/tinyllamas/resolve/main/stories15M.bin
# 42M参数模型
wget https://huggingface.co/karpathy/tinyllamas/resolve/main/stories42M.bin
# 110M参数模型
wget https://huggingface.co/karpathy/tinyllamas/resolve/main/stories110M.bin

编译运行

make run
# 15M参数模型
./run stories15M.bin
# 42M参数模型,运行并输入提示词
./run stories42M.bin -i "One day, Lily met a Shoggoth"

中文模型(280M)

  • https://huggingface.co/flyingfishinwater/chinese-baby-llama2
    在这里插入图片描述
# 下载模型
git clone https://huggingface.co/flyingfishinwater/chinese-baby-llama2
  • 安装 python 相关依赖
pip3 install numpy
pip3 install torch torchvision torchaudio
pip3 install transformers
  • 将模型hf格式转换为bin格式
# 将hf模型文件转换成.bin文件
python export.py ./chinese-baby-llama2.bin --hf ./chinese-baby-llama2
  • 修改 llama2.c/run.c
// 将 main() 中的 tokenizer.bin 改为 chinese-baby-llama2 目录下的tokenizer.bin
char *tokenizer_path = "chinese-baby-llama2/tokenizer.bin";

在这里插入图片描述

  • 编译 c
make run
  • 运行并输入提示词
./run chinese-baby-llama2.bin -i "今天是武林大会,我是武林盟主"

在这里插入图片描述

main函数

  • 默认参数设置: 定义了一些默认参数值,例如模型路径、分词器路径、温度、top-p 值、步数等。
  • 命令行参数解析: 通过检查命令行参数,更新默认参数值。命令行参数的格式为 flag value,例如 -t 0.5 表示设置温度为 0.5。
  • 参数验证和覆盖: 对解析后的参数进行验证和覆盖。例如,确保随机数种子大于 0、温度在合理范围内、步数为非负数等。
  • 构建 Transformer 模型: 使用给定的模型文件构建 Transformer 模型,并根据需要调整步数。
  • 构建 Tokenizer: 使用给定的分词器文件构建 Tokenizer。
  • 构建 Sampler: 构建 Sampler,并设置相应的参数,如词汇表大小、温度、top-p 值等。
  • 执行功能: 根据模式选择执行生成或者聊天功能。如果模式是 generate,则执行生成功能;如果是 chat,则执行聊天功能。
  • 内存和文件句柄清理: 释放动态分配的内存和关闭文件句柄,确保程序执行结束时资源被正确释放。
http://www.yayakq.cn/news/921670/

相关文章:

  • 南宁建站官网dedecms 网站地图插件
  • 东莞网站网站建设简历生成器在线制作
  • 婚纱类网站素材域名拍卖网站
  • 个人网站优秀作品承德信息港
  • 克隆网站怎么导入wordpress网站谷歌优化怎么做
  • 网站建设服装项目设计书开发一个电商网站
  • 网站开发与软件开发电商平台哪个好
  • 网站制作好公司什么是电商?
  • 网站title的作用用jsp做网站用什么软件
  • 洛阳建公司网站wordpress演示地址转换短网址
  • 重庆建设厅网站首页选片 网站 建设
  • 移动互联网应用程序个人信息保护管理暂行规定大连唐朝网站优化公司
  • 城建公司建设网站基础资料华为公司网站建设分析评价
  • 湖南网站建设平台58同城最新招聘网找工作招聘信息
  • 网站加载等待上海建设银行网站上班时间表
  • 通过备案号查网站如何设计网店店面
  • 简述商务网站建设温州网站开发技术
  • 北京网站建设公司 蓝纤科技 网络服务广告公司名字大全20000个
  • 不建议网站营销网站定制
  • 前端网站开发wordpress商品左移窗口
  • 网站前台做好以后用什么生成后台管理系统申请免费网站空间
  • 信息手机网站模板怎么做销售网站
  • 做美食网站有哪些无锡关键词优化报价
  • 网站目标定位分析工作室设计图
  • 做网站 每月赚 钱广东网站备案进度查询
  • 北京工商网站网站建设 长春
  • 西安网站建设gj单位网站建设框架
  • 网站优化软件排名优化搜索不到我的网站
  • 海外营销方案seo建站技巧
  • 信息类网站怎么做湘潭做网站价格咨询磐石网络