当前位置: 首页 > news >正文

注册网站名称软件的开发定制

注册网站名称,软件的开发定制,wordpress 前台发布,网站建设网页链接一、bge-reranker-v2-m3 模型 bge-reranker-v2-m3 是一个基于深度学习的文本排序模型,由北京智源人工智能研究院(BAAI)开发。该模型主要用于信息检索和自然语言处理任务,特别是在需要重新排序候选文本的场景中表现优异。 bge-re…

一、bge-reranker-v2-m3 模型

bge-reranker-v2-m3 是一个基于深度学习的文本排序模型,由北京智源人工智能研究院(BAAI)开发。该模型主要用于信息检索和自然语言处理任务,特别是在需要重新排序候选文本的场景中表现优异。

bge-reranker-v2-m3 主要用于对检索结果进行重新排序,能够根据查询与候选文本的相关性进行更精准的排序。它适用于问答系统、文档检索、推荐系统等场景。该模型采用了先进的预训练语言模型架构,结合了大规模语料库的微调。v2-m3 版本在性能和效率上进行了优化,支持多语言处理能力,能够更好地处理跨语言检索任务。

bge-reranker-v2-m3 在多个公开基准测试中表现出色,特别是在中文文本排序任务中展现了较强的性能。模型对长文本和复杂查询具有较好的适应性,能够捕捉更细粒度的语义相关性。

二、Docker 与 vLLM 的作用

Docker 提供容器化环境,解决依赖冲突和部署一致性问题,适合快速部署复杂模型。
vLLM 是高效推理框架,针对大语言模型优化,支持高吞吐量推理和显存管理,能加速 bge-reranker-v2-m3 这类大规模模型的本地运行。

三、本地运行的核心优势

  1. 隐私保护:数据无需上传云端,适合敏感场景。
  2. 定制化:可调整模型参数或微调以适应特定任务。
  3. 成本可控:长期使用比云服务成本更低。

此方案适合开发者、研究人员快速验证 bge-reranker-v2-m3 能力,或集成到本地 NLP pipeline 中。

四、Docker 安装与配置

下载并执行 Docker 官方安装脚本:

curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh# 启动Docker服务
sudo systemctl start docker
sudo systemctl enable docker

配置国内 Docker 镜像源与 GPU:

vim /etc/docker/daemon.json
{"dns": ["8.8.8.8","8.8.4.4"],"registry-mirrors": ["https://docker.m.daocloud.io/","https://huecker.io/","https://dockerhub.timeweb.cloud","https://noohub.ru/","https://dockerproxy.com","https://docker.mirrors.ustc.edu.cn","https://docker.nju.edu.cn","https://registry.docker-cn.com","http://hub-mirror.c.163.com"],"runtimes": {"nvidia": {"args": [],"path": "nvidia-container-runtime"}}
}

五、使用 vLLM 官方 Docker 镜像

vLLM 提供了用于部署的官方 Docker 镜像,该镜像可用于运行与 OpenAI 兼容的服务器,官方示例脚本如下:

docker run --runtime nvidia --gpus all \-v ~/.cache/huggingface:/root/.cache/huggingface \--env "HUGGING_FACE_HUB_TOKEN=<secret>" \-p 8000:8000 \--ipc=host \vllm/vllm-openai:latest \--model mistralai/Mistral-7B-v0.1

官方脚本从 huggingface 下载模型,可能会遇到网络问题,因此我们从 modelscope 下载 BAAI/bge-reranker-v2-m3,对脚本修改一点点细节:

docker run --name bge-reranker-v2-m3 -d --runtime nvidia --gpus all \-v ~/.cache/modelscope:/root/.cache/huggingface \--env "VLLM_USE_MODELSCOPE=True" \-p 8001:8000 \--ipc=host \vllm/vllm-openai:latest \--model BAAI/bge-reranker-v2-m3  \--gpu_memory_utilization 0.9

这里我们可以使用 ipc=host 标志或 --shm-size 标志来允许容器访问主机的共享内存。vLLM 使用 PyTorch,它在底层使用共享内存来在进程之间共享数据,特别是对于张量并行推理。镜像标签 (vllm/vllm-openai:latest) 之后添加引擎参数 (engine-args)。

在这里插入图片描述

六、GPU 使用情况

nvidia-smi

在这里插入图片描述

参考文档

  • https://docs.vllm.com.cn/en/latest/deployment/docker.html
  • https://modelscope.cn/models/BAAI/bge-reranker-v2-m3/summary
  • https://www.runoob.com/docker/ubuntu-docker-install.html
http://www.yayakq.cn/news/987175/

相关文章:

  • 专注网站建设16年健康生活网站开发系统背景
  • 淘宝优惠券网站怎么做 知乎徐州简欧室内设计公司排名
  • 给人做网站挣钱吗广东建设继续教育网站
  • 上海阔达网站建设公司盐城网站关键词优化
  • 公司设计网站有什么好处网站被管理员权限
  • 天津网站制作网页驻马店住房和城乡建设厅网站
  • 怎么网站建设怎么样网络营销策划书800字
  • 上海网站建设价位制作游戏需要什么软件
  • 建设网站公司专业服务朝阳网站开发
  • vs 网站项目wordpress图片上传地址
  • 沈阳企业自助建站系统济南制作网站软件
  • 白云地网站建设嵌入式培训心得
  • 如何开发电商网站公司做个官网要多少钱
  • 专业做网站 上海wordpress网站做成app6
  • 丰县建设局规划局网站wordpress食谱门户
  • 镇江网站设计买个网页多少钱
  • 如何用自己的电脑做网站服务器网站建设2017主流代码语言
  • 惠州做企业网站的网站内容是怎么吸引用户的
  • 网站开发维护合同书厦门 外贸网站
  • 五屏网站建设价位怎么在浏览器注册网址
  • 广西网站建设原创制作一个景点的网站
  • 网站规划与建设ppt模板深圳品牌营销型网站建设
  • 料远若近网站建设尚海整装为啥口碑那么差
  • 昆山专业网站建设公司哪家好深圳网站平台建设
  • 外贸网站违反谷歌规则青岛网上注册公司官网
  • 佛山网站推广怎么做网站建设的基本流程包括
  • 桂城网站建设制作建筑英才网官方
  • shopex网站备份做美容有哪些网站
  • 河北住房与城乡建设厅网站360建筑网登录
  • 户外产品销售公司网站建设h5生成