当前位置: 首页 > news >正文

网站的种类传奇如何做网站

网站的种类,传奇如何做网站,岚山建设网站,中国建设银行甘肃省分行网站搭建一个本地中文大语言模型(LLM)涉及多个关键步骤,从选择模型底座,到运行机器和框架,再到具体的架构实现和训练方式。以下是一个详细的指南,帮助你从零开始构建和运行一个中文大语言模型。 本地离线模型搭…

搭建一个本地中文大语言模型(LLM)涉及多个关键步骤,从选择模型底座,到运行机器和框架,再到具体的架构实现和训练方式。以下是一个详细的指南,帮助你从零开始构建和运行一个中文大语言模型。

本地离线模型搭建指南将按照以下四个部分展开

  1. 中文大语言模型底座选择依据
  2. 本地运行显卡选择
  3. RAG架构实现
  4. LLaMA-Factory训练框架及工具

3 RAG架构实现

3.1 什么是RAG

检索增强生成(Retrieval Augmented Generation, RAG) 是当前最热门的大语言模型(LLM)应用方案之一。RAG结合了信息检索和生成模型的优势,旨在增强生成式模型的知识覆盖和输出准确性。

3.2 为什么使用RAG

使用RAG的主要原因有以下几点:

  1. 知识的局限性:
    1. 现有的大模型(如ChatGPT、文心一言、通义千问等)的知识来源于它们的训练数据,这些数据主要是公开的网络数据。
    2. 对于一些实时性、非公开或离线的数据,大模型无法直接获取和使用。
  2. 幻觉问题:
    1. 大模型的输出基于数学概率,有时会出现“幻觉”——即生成看似合理但实际上错误的回答。
    2. 这种问题难以区分,尤其是在用户不具备相关领域知识的情况下。
  3. 数据安全性:
    1. 企业非常注重数据安全,不愿意将私有数据上传到第三方平台进行训练。
    2. 使用通用大模型可能会在数据安全和效果之间产生取舍。

RAG通过结合检索和生成的方式,能够有效解决上述问题。

3.3 RAG架构

RAG架构主要包括以下几个部分:

  1. 向量化:
    1. 将文本数据转化为向量矩阵,这个过程会直接影响后续检索的效果。
    2. 常见的embedding模型包括BERT、RoBERTa等,可以满足大部分需求。
    3. 对于特殊场景,可以选择微调现有的开源embedding模型,或直接训练适合自己场景的模型。
  2. 数据入库:
    1. 数据向量化后构建索引,并写入数据库。
    2. 适用于RAG场景的数据库包括FAISS、ChromaDB、Elasticsearch(ES)、Milvus等。
    3. 选择合适的数据库时,需要综合考虑业务场景、硬件和性能需求等因素。
  3. 检索模块:
    1. 在用户提出问题时,首先检索相关的文档或信息片段。
    2. 这些检索到的信息将作为生成模型的辅助输入。
  4. 生成模块:
    1. 利用检索到的信息和用户输入的问题,生成更加准确和相关的回答。
    2. 生成模型可以是预训练的大语言模型,如GPT-3等。
      在这里插入图片描述

3.4 RAG的工作流程

  1. 用户输入问题。
  2. 检索模块从数据库中检索相关信息。
  3. 生成模块结合用户输入和检索到的信息生成答案。
  4. 返回生成的答案给用户。

通过这种方式,RAG不仅能利用大模型的强大生成能力,还能结合实时、私有的数据源,提供更加精准和安全的解决方案。

3.5 embedding模型链接

模型名称描述获取地址
ChatGPT-EmbeddingChatGPT-Embedding由OpenAI公司提供,以接口形式调用。https://platform.openai.com/docs/guides/embeddings/what-are-embeddings
ERNIE-Embedding V1ERNIE-Embedding V1由百度公司提供,依赖于文心大模型能力,以接口形式调用。https://cloud.baidu.com/doc/WENXINWORKSHOP/s/alj562vvu
M3EM3E是一款功能强大的开源Embedding模型,包含m3e-small、m3e-base、m3e-large等多个版本,支持微调和本地部署。https://huggingface.co/moka-ai/m3e-base
BGEBGE由北京智源人工智能研究院发布,同样是一款功能强大的开源Embedding模型,包含了支持中文和英文的多个版本,同样支持微调和本地部署。https://huggingface.co/BAAI/bge-base-en-v1.5

更多详细信息和具体模型的链接,请访问

【关于NLP】那些你不知道的事

大模型RAG问答技术架构及核心模块:从Embedding、prompt-embedding到Reranker

RAG技术全解析:打造下一代智能问答系统

RAG 与微调在大模型应用中如何抉择

http://www.yayakq.cn/news/213209/

相关文章:

  • 惠州建设工程造价管理协会网站做网站怎么融资
  • 网站悬挂备案号电子商务网站建设外包服务的企业
  • 网站制作的合同关于用户网站建设的论文
  • 电子商务网站建设文案天津定制网站建设商店设计
  • 毕节市网站建设定制wordpress主题多少钱
  • 沈阳网站建站wordpress ping optimizer
  • 网站搭建就来徐州百度网络非常好crm排名
  • 商贸公司网站建设五百人建站
  • 济南做网站软件做网站网页的公司
  • 长春网站建设团队四合一网站建设
  • 燕郊个人做网站临沂做商城网站的公司
  • 专做hip hop音乐的网站百度公司做网站优化多少钱
  • 移动网站二级域名m开头怎么做广州网站建设定制多少钱
  • onedrive做网站下载盘wordpress 文章 作者
  • 网站开发前端兼职无锡网站设计无锡网站建设
  • h5网站动画怎么做开发公司清除地上树木侵犯了谁的权利
  • 政务网站平台建设 招标住建厅官网证件查询
  • 建设银行网站链接怎么做网络推广营销
  • 网站开发专业培训学校辅料企业网站建设费用
  • 学校网站建设调查表随州做网站
  • 东莞品牌网站建设费用如何做网站水晶头
  • 石家庄桥西区网站建设有什么手机网站
  • 企业网站的建立多少钱购物网站开发可行性
  • 在linux系统上用什么做网站h5网站开发软件下载
  • 网站建设域名申请wordpress插件放在主题的哪里
  • 成都网站制作费用交互型网站
  • 谷歌优化 网站建设济南做网站的好公司
  • 建设银行深圳天健世纪支行网站梭子手做鱼网站
  • 网站获取访客qq号品牌策划与推广实训报告
  • 帮做试卷的网站南昌网站维护制作