当前位置: 首页 > news >正文

成都有没有做网站建设的电子商务网站定制

成都有没有做网站建设的,电子商务网站定制,石家庄网站建设兼职,收录平台在NVIDIA Jetson平台离线部署大模型,开启离线具身智能新纪元。 本项目提供一种将LMDeploy移植到NVIDIA Jetson系列边缘计算卡的方法,并在Jetson计算卡上运行InternLM系列大模型,为离线具身智能提供可能。 最新新闻🎉 [2024/3/1…

在NVIDIA Jetson平台离线部署大模型,开启离线具身智能新纪元。

本项目提供一种将LMDeploy移植到NVIDIA Jetson系列边缘计算卡的方法,并在Jetson计算卡上运行InternLM系列大模型,为离线具身智能提供可能。

最新新闻🎉

  • [2024/3/15] 更新了对LMDeploy-v0.2.5。
  • [2024/2/26] 本项目被LMDeploy官方社区收录。

已验证模型/平台

  • ✅:已验证可运行
  • ❌:已验证不可运行
  • ⭕️:待验证
ModelsInternLM-7BInternLM-20BInternLM2-1.8BInternLM2-7BInternLM2-20B
Orin AGX(32G)
Jetpack 5.1

Mem:??/??
14.68 token/s

Mem:??/??
5.82 token/s

Mem:??/??
56.57 token/s

Mem:??/??
14.56 token/s

Mem:??/??
6.16 token/s
Orin NX(16G)
Jetpack 5.1

Mem:8.6G/16G
7.39 token/s

Mem:14.7G/16G
3.08 token/s

Mem:5.6G/16G
22.96 token/s

Mem:9.2G/16G
7.48 token/s

Mem:14.8G/16G
3.19 token/s
Xavier NX(8G)
Jetpack 5.1

Mem:4.35G/8G
28.36 token/s

未来工作

  • 更新更多型号Jetson板卡的Benchmark测试数据
  • 制作Jetson专用whl发行版
  • 跟进更新版本的LMDeploy

部署教程

Jetson端离线运行InternLM大模型

创建模型保存目录:

mkdir -p ~/models

将S1.服务器端模型W4A16量化得到的internlm-chat-7b-turbomind.tgz上传到models目录下。

解压模型文件:

tar zxvf internlm-chat-7b-turbomind.tgz -C .

0.Bug解决:修改MMEngine库

Jetson端的pytorch不支持分布式的reduce算子,这会导致MMEngine库中与分布式有关的部分出现错误。

错误为:

AttributeError: module 'torch.distributed' has no attribute 'ReduceOp'

激活conda环境:

conda activate lmdeploy

用解释器方式运行python:

python

输入如下内容:

import mmengine
print(mmengine.__file__)

这就输出了MMEngine库的安装位置,笔者的是/home/nvidia/miniconda3/envs/lmdeploy/lib/python3.8/site-packages/mmengine/__init__.py,那么相应位置就是home/nvidia/miniconda3/envs/lmdeploy/lib/python3.8/site-packages/mmengine/,咱们用<path/to/mmengine>代替。

修改<path/to/mmengine>/logging/logger.py第208行:

- global_rank = _get_rank()
+ global_rank = 0

在运行就不会报错了。

注意:该方式过于粗暴,仅适用于Jetson平台部署推理,在服务器端会影响分布式功能!

1.终端运行

激活conda环境:

conda activate lmdeploy

运行模型:

lmdeploy chat turbomind ./internlm-chat-7b-turbomind

在这里插入图片描述

2.Python集成运行

编写运行脚本run_model.py,内容如下:

from lmdeploy import turbomind as tmif __name__ == "__main__":model_path = "./internlm-chat-7b-turbomind" # 修改成你的路径tm_model = tm.TurboMind.from_pretrained(model_path)generator = tm_model.create_instance()while True:inp = input("[User] >>> ")if inp == "exit":breakprompt = tm_model.model.get_prompt(inp)input_ids = tm_model.tokenizer.encode(prompt)for outputs in generator.stream_infer(session_id=0, input_ids=[input_ids]):res = outputs[1]response = tm_model.tokenizer.decode(res)print("[Bot] <<< {}".format(response))

激活conda环境:

conda activate lmdeploy

运行脚本:

python run_model.py

在这里插入图片描述

附录

  • 为Jetson重装Jetpack
  • LMDeploy-Jetson基准测试

引用

如果本项目对您的工作有所帮助,请使用以下格式引用:

@misc{2024lmdeployjetson,title={LMDeploy-Jetson:Opening a new era of Offline Embodied Intelligence},author={LMDeploy-Jetson Community},url={https://github.com/BestAnHongjun/LMDeploy-Jetson},year={2024}
}

致谢

  • 书生·浦语大模型实战营
  • 上海人工智能实验室
  • trt-llm
http://www.yayakq.cn/news/264281/

相关文章:

  • 应用商店网站模板凡科建站网站
  • php网站源码模板网站备案服务码口令是什么意思
  • 青岛网站设计电话兔巴兔装修网
  • 最佳商城ui网站设计企业微信小程序如何开发
  • 国内最好软件网站建设网站链接做投票
  • 长沙网站优化seo网站开发需求文档模板
  • 宁夏网站建设怎么样本地做网站
  • 安全中国asp.net网站开发项目实战培训班重庆网站建设建站收费
  • 太原中小学网站建设手机网站推广法
  • 百度网站建设解决方案wordpress菜单文件导入
  • 城镇建设部网站自由建网站的网络程序
  • 做饲料机械的网站个人域名怎么做社交网站
  • 做企业网站所要注意什么wordpress cms 布局
  • 北京建设工程教育中心网站腾讯广点通
  • 营销型网站定制外贸网站适合用数字域名吗
  • 烟台定制网站建设公司在线crm
  • .我爱你 网站做冷库的网站
  • 网站建设教程pdf做python一个网站
  • 网站做的好有什么用wordpress 推广提成
  • 做一年的网站维护价格校园网自助网站
  • 美食网站开发的目的招聘网站建设人员的要求
  • 网站改版升级总结做网站送的手机站是什么
  • 网站后台添加查看爬虫的痕迹智能模板网站建设价格
  • 网站设计 趋势视频网站主持人
  • 做企业网站国内发展wordpress基于
  • 做游戏网站定位免费网站建设软件推荐
  • 甘肃省建设厅职业资格注册中心网站深圳有名的建筑公司
  • 电脑网站兼职在哪里做网站中英文切换怎么做
  • 精品课程网站建设 碧辉腾乐网站建设合作加盟
  • 中创高科官方网站贵州建设公司网站