当前位置: 首页 > news >正文

如何 做网站动漫制作专业要多少分

如何 做网站,动漫制作专业要多少分,游戏ui设计是做什么的,蓝色风格企业网站模板目录 前言 text2vec开源项目 核心能力 文本向量表示模型 本地试用 安装依赖 下载模型到本地(如果你的网络能直接从huggingface上拉取文件,可跳过) ​运行试验代码 前言 在上一篇文章中介绍了,如何从不同格式的文件里提取…

目录

前言

text2vec开源项目

核心能力

文本向量表示模型

本地试用

安装依赖 

下载模型到本地(如果你的网络能直接从huggingface上拉取文件,可跳过)

​运行试验代码


前言

 在上一篇文章中介绍了,如何从不同格式的文件里提取文本信息。

本篇文章将介绍,如何将提取出的文本信息转换为vector,以便后续基于vector做相似性检索。

​​​​​​文档向量化工具(一):Apache Tika介绍icon-default.png?t=N7T8https://mp.csdn.net/mp_blog/creation/editor/134488150

text2vec开源项目

text2vec是github上很受欢迎的一个开源项目。

text2vec:Text to Vector。

【GitHub地址】

https://github.com/shibing624/text2vec

【开源协议】

 Apache-2.0 license

核心能力

Text to Vector, Get Sentence Embeddings. 文本向量化,把文本(包括词、句子、段落)表征为向量矩阵。

text2vec实现了:

  1. Word2Vec
  2. RankBM25
  3. BERT
  4. Sentence-BERT
  5. CoSENT

等多种文本表征、文本相似度计算模型,并在文本语义匹配(相似度计算)任务上比较了各模型的效果。

文本向量表示模型

  • Word2Vec:通过腾讯AI Lab开源的大规模高质量中文词向量数据(800万中文词轻量版) (文件名:light_Tencent_AILab_ChineseEmbedding.bin 密码: tawe)实现词向量检索,本项目实现了句子(词向量求平均)的word2vec向量表示
  • SBERT(Sentence-BERT):权衡性能和效率的句向量表示模型,训练时通过有监督训练BERT和softmax分类函数,文本匹配预测时直接取句子向量做余弦,句子表征方法,本项目基于PyTorch复现了Sentence-BERT模型的训练和预测
  • CoSENT(Cosine Sentence):CoSENT模型提出了一种排序的损失函数,使训练过程更贴近预测,模型收敛速度和效果比Sentence-BERT更好,本项目基于PyTorch实现了CoSENT模型的训练和预测
  • BGE(BAAI general embedding):BGE模型按照retromae方法进行预训练,参考论文,再使用对比学习finetune微调训练模型,本项目基于PyTorch实现了BGE模型的微调训练和预测

本地试用

推荐用conda管理python环境

conda create -n py3.9 python=3.9 // 安装一个python3.9的环境

安装依赖 

conda install -c pytorch pytorch

pip install -U text2vec

 下载模型到本地(如果你的网络能直接从huggingface上拉取文件,可跳过)

https://huggingface.co/shibing624/text2vec-base-chinese/tree/main

本地建立一个文件夹,名字是shibing624/text2vec-base-chinese

手动点击,逐个下载文件到此文件夹

 运行试验代码

# 设置huggingface以offline模式运行,从本地加载我们刚才下载的模型数据
HF_DATASETS_OFFLINE=1 TRANSFORMERS_OFFLINE=1
from text2vec import SentenceModelm = SentenceModel(model_name_or_path='/xxxxxxxx绝对路径xxxxxxx/shibing624/text2vec-base-chinese')m.encode("如何更换花呗绑定银行卡")

运行效果

http://www.yayakq.cn/news/350704/

相关文章:

  • 做网站的流程视频教程网站右下角代码
  • 有没有人与动物做的电影网站装修设计比较好的网站
  • 龙海市住房和城乡建设局网站广东新闻联播回放
  • h5网站开发 源码杭州app定制开发
  • 青岛做网站定制招商网官网
  • 建设网站要什么手续做新网站怎样提交360
  • 宿迁网站建设案例wordpress彩带背景
  • 能自己做网站接业务吗漳州 网站设计
  • 自己有网站怎么做优化html5手机端开发软件
  • 电影网站的设计与实现论文广西新宇建设项目有限公司网站
  • 怎么样做微网站建设网站服务费会计分录
  • 学校手机网站建设做旅游网站推广
  • angular2.0网站制作关键词网站推广
  • 北京模板网站开发公司网站建设技术课程设计
  • 临近做网站百度做的网站
  • 保定哪里有做网站的搭建网站 在线浏览功能
  • 网站后台模板长沙微信网站
  • 大学网站建设定制网站建设网站如何不需要备案
  • 网站内备案名称 修改做外汇需要了解的网站
  • 在线营销型网站制作备案信息查询官网
  • 做网站 页面自适应外贸网站如何建设
  • angularjs 网站开发做的最好自考网站是哪个
  • ui网站模板网络营销模式案例分析
  • 素材解析网站搭建付费 视频 网站 怎么做
  • 网站建设心得.doc制作开发app需要多少钱
  • 网站开发后端菜鸟教程如果我的网站被百度收录了_以后如何做更新争取更多收录
  • 东莞市研发网站建设公司如何提高网站关键词的排名
  • 电商网站建设特色南京网页设计招聘
  • 哪家做网站做的好关于网站建设的文案
  • 网站前端开发有哪些做汽配的网站