当前位置: 首页 > news >正文

网站入口深圳罗湖网站设计公司

网站入口,深圳罗湖网站设计公司,西安网站建设网晨雨,城市建设最好的网站概念 Hugging Face Hub​​和 Github 类似,都是Hub(社区)。Hugging Face可以说的上是机器学习界的Github。Hugging Face为用户提供了以下主要功能: ​模型仓库(Model Repository)​​:Git仓库可以让你管理代码版本、…

概念

Hugging Face Hub​​和 Github 类似,都是Hub(社区)。Hugging Face可以说的上是机器学习界的Github。Hugging Face为用户提供了以下主要功能:

​模型仓库(Model Repository)​​:Git仓库可以让你管理代码版本、开源代码。而模型仓库可以让你管理模型版本、开源模型等。使用方式与Github类似。
​模型(Models)​​​:Hugging Face为不同的机器学习任务提供了许多​预训练好的机器学习模型​​供大家使用,这些模型就存储在模型仓库中。
​数据集(Dataset)​​:Hugging Face上有许多公开数据集。

hugging face在NLP领域最出名,其提供的模型大多都是基于Transformer的。为了易用性,Hugging Face还为用户提供了以下几个项目:

Transformers(​ ​github​​​,​ ​官方文档​​): Transformers提供了上千个预训练好的模型可以用于不同的任务,例如文本领域、音频领域和CV领域。该项目是HuggingFace的核心,可以说学习HuggingFace就是在学习该项目如何使用。
Datasets(​ ​github​​​,​ ​官方文档​​): 一个轻量级的数据集框架,主要有两个功能:①一行代码下载和预处理常用的公开数据集; ② 快速、易用的数据预处理类库。
Accelerate(​ ​github​​​,​ ​官方文档​​): 帮助Pytorch用户很方便的实现 multi-GPU/TPU/fp16。
Space(​ ​链接​​):Space提供了许多好玩的深度学习应用,可以尝试玩一下。

Transforms

Hugging Face Transformer是Hugging Face最核心的项目,可以用它做以下事情:

  • 直接使用预训练模型进行推理
  • 提供了大量预训练模型可供使用
  • 使用预训练模型进行迁移学习

安装

pip install git+https://github.com/huggingface/transformers 

使用

from transformers import pipelinetranslator = pipeline("translation_en_to_fr")
print(translator("How old are you?"))

对于部分特定任务,官方并没有提供相应的模型,但也可以到​​官网搜索模型​​,然后显示指定即可。在加载模型时,你有可能会因为缺少一些库而报错,这个时候,只需要安装对应的库,然后重启即可。

 

!pip install sentencepiece
translator = pipeline("translation_en_to_zh", model='Helsinki-NLP/opus-mt-en-zh')
translator("I'm learning deep learning.")

Helsinki-NLP/opus-mt-en-zh · Hugging Face

使用Hugging Face模型 

Transformers项目提供了几个简单的API帮助用户使用Hugging Face模型,而这几个简单的API统称为​​AutoClass​​​(​ ​官方文档链接​​),包括:

  • ​​AutoTokenizer​​: 用于文本分词
  • ​​AutoFeatureExtractor​​: 用于特征提取
  • ​​AutoProcessor​​: 用于数据处理
  • ​​AutoModel​​: 用于加载模型

它们的使用方式均为: ​​AutoClass.from_pretrain("模型名称")​​,然后就可以用了。例如:

from transformers import AutoTokenizertokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
tokenizer("I'm learning deep learning.")

通常一个模型会包含上述4个中的部分功能,例如,对于​​bert-base-uncased​​模型,就包含“分词”和“模型”两项功能,我们可以通过代码样例(Use in Transformers) 模块查看:

数据集

Datasets类库可以让你非常方便的访问和分享数据集,也可以用来对NLP、CV、语音等任务进行评价(Evaluation metrics).

pip install datasets#使用语音(Audio)数据集
pip install datasets[audio]#图片(Image)数据
pip install datasets[vision]

查找数据集

Hugging Face的数据集通常包括多个子集(subset),并且分成了train、validation和test三份。你可以通过预览区域查看你需要的子集。

from datasets import load_datasetdataset = load_dataset("glue")

Hugging Face的数据集都是放在github上的,所以国内估计很难下载成功。这就要用到​​load_dataset​​​的加载本地数据集。关于如何离线下载Hugging Face数据集,可参考​ ​该篇文章​

下载

import datasets
dataset = datasets.load_dataset("glue")
dataset.save_to_disk('your_path')

加载离线

import datasets
dataset = load_from_disk("your_path")

参考

Hugging Face快速入门(重点讲解模型(Transformers)和数据集部分(Datasets))_51CTO博客_hugging face transformers

http://www.yayakq.cn/news/547984/

相关文章:

  • 个人网站设计文字内容模板建网站需要什么东西
  • 手机号码网站开发石家庄网站建设推广服务
  • 智慧团登录官方网站让人做网站需要注意哪些问题
  • 浏览器网站有哪些做得好的网站建设公司
  • 外贸网站导航栏建设技巧信宜手机网站建设公司
  • .net网站开发岗位wordpress 读取最新文章
  • 做行业网站如何采集信息wordpress前缀有哪些
  • 浏览器最新大全优化设计四年级语文下册答案
  • 做自己域名的网站很贵吗合肥官方网站优化费用
  • 做卖东西的网站多少钱免费制作app平台
  • 犀牛网站建设建筑施工模板
  • 哪些网站是python做的wordpress两个头部
  • 昆明网站建设注意事项网站建设文献英文
  • 百度站长统计建站网站系统
  • 公司域名备案网站名称分类信息 wordpress
  • 用一个域名免费做网站个人如何在企业网站做实名认证
  • 类似淘宝的网站怎么做的wap盛唐建站
  • 昆明做网站建设的公司排名网络营销创意案例
  • 西北电力建设第一工程公司网站网站备案 快速
  • 自贡做网站公司行业app开发公司
  • 四川省建设厅职改办网站做小程序商城
  • dw如何制作自己的网站网站建设技术团队经验丰富
  • 有后台的网站如何建设天眼查公司注册信息
  • 网店网站技术方案微信公众号对接wordpress教程
  • 用于做网站的软件wordpress 删除边栏
  • 做网站代码第一不淘宝网络营销方案
  • 网站英语培训营销论坛网站建设
  • 怀仁网站建设摄影网站有哪些功能
  • 网站下载免费新版网站网站做庄是怎样做
  • 自学网站免费网络科技公司是做什么的