当前位置: 首页 > news >正文

网站建设属于经营什么范围有做国际网站生意吗

网站建设属于经营什么范围,有做国际网站生意吗,汕头手机网页制作,做网站大公司还是小公司transformers的三个核心抽象类是Config, Tokenizer和Model,这些类根据模型种类的不同,派生出一系列的子类。构造这些派生类的对象也很简单,transformers为这三个类都提供了自动类型,即AutoConfig, AutoTokenizer和AutoModel。三个…

transformers的三个核心抽象类是Config, Tokenizer和Model,这些类根据模型种类的不同,派生出一系列的子类。构造这些派生类的对象也很简单,transformers为这三个类都提供了自动类型,即AutoConfig, AutoTokenizer和AutoModel。三个AutoClass都提供了from_pretrained方法,这个方法则一气完成了模型类别推理、模型文件列表映射、模型文件下载及缓存、类对象构建等一系列操作。

from_pretrained这个类方法,最重要的一个参数叫做pretrained_model_name_or_path。顾名思义,我们可以给出一个模型的短名,也可以给出一个路径。如果给的是模型短名,则它会想办法映射出要下载的文件的URL位置,并将文件下载到本地一个固定的cache目录。第二次再调用的时候,它会检查cache中是否已经存在同样的文件,如果有则直接从cache载入,不再走网络下载。如果给的是路径名,那么它假设该路径之下已经存在自行训练/预下载/经过微调的模型文件,直接载入。

from_pretrained方法实际上提供了丰富的下载辅助功能,

  • cache_dir:自定义的cache路径
  • force_download:强制重新下载
  • resume_download:断点续传
  • proxies:字典形式指定代理
  • ……

AutoConfig.from_pretrained

Config的初次构造相对简单,主要是通过hf_bucket_url函数将函数短名映射成为网络URL,形如'https://s3.amazonaws.com/models.huggingface.co/bert/bert-base-chinese-config.json'的一个json文件。下载它到cache目录,再读取构造对象即可。

AutoTokenizer.from_pretrained

Tokenizer初次构造要复杂一点。

  • 首先它需要先构造Config对象,然后查一张预定义好的表TOKENIZER_MAPPING。这张映射表中,描述了什么样的Config Class对应什么样的Tokenizer Class。
  • 每个Tokenizer Class都定义了一个类变量vocab_files_names,指定了它所用到的词汇文件名有哪些。
  • 另外Tokenizer Class可能还会产生若干附加文件,可能有也可能没有,但这些附加文件名列表是有限的,存在additional_files当中,包括ADDED_TOKENS_FILE, SPECIAL_TOKENS_MAP_FILE, TOKENIZER_CONFIG_FILE, FULL_TOKENIZER_FILE等,后续下载时需要逐一探测一下。
  • 以上所有的文件名,都需要用hf_bucket_url函数转成相应的URL。

AutoModel.from_pretrained

Model的构造也相对简单。

  • 和Tokenizer类似,它也需要先得到Config对象,然后查MODEL_MAPPING映射表,得到实际的Model Class。
  • Model Class定义了类方法from_pretrained。这个方法会根据模型短名以及该模型是从TF还是PT训练的,利用hf_bucket_url函数转成相应的URL。TF2对应的模型文件名为tf_model.h5,PT对应的模型文件名为pytorch_model.bin。由于模型文件一般比较大,转换时采用了CDN域名,下载时采用了分块下载stream的方式。

以 vicuna-7b-v1.5为例

https://huggingface.co/lmsys/vicuna-7b-v1.5/tree/main

其中 config.json

是模型model的 Configuration ,文档https://huggingface.co/transformers/v3.3.1/main_classes/configuration.html

其他

a config.json file, which saves the configuration of your model ;

a pytorch_model.bin file, which is the PyTorch checkpoint (unless you can’t have it for some reason) ;

a tf_model.h5 file, which is the TensorFlow checkpoint (unless you can’t have it for some reason) ;

a special_tokens_map.json, which is part of your tokenizer save;

a tokenizer_config.json, which is part of your tokenizer save;

files named vocab.json, vocab.txt, merges.txt, or similar, which contain the vocabulary of your tokenizer, part of your tokenizer save;

maybe a added_tokens.json, which is part of your tokenizer save.

https://huggingface.co/transformers/v3.3.1/model_sharing.html

参考

【HugBert05】照猫画虎:理解from_pretrained,攒个模型下载器 - 知乎

http://www.yayakq.cn/news/998659/

相关文章:

  • 怎么做酒店网站wordpress 跨域请求
  • 四川做网站的公司有哪些wordpress 分类目录使用英文
  • 怎么查看网站建设时间网站建设公司效果
  • 英文网站建设公司报价wordpress 单页模版
  • 建立网站要什么条件和多少钱网站开发什么语言比较好
  • 宿迁手机网站建设公司网络口碑营销的定义
  • 织梦cms如何搭建网站网站需要什么服务器
  • 石家庄新华区网站建设手机软件制作平台
  • 如何统计网站pv网站如何做服务器授权
  • 网站地图制作方法网页版梦幻西游五色石
  • 个人网站-个人主页作业绚丽的网站欣赏
  • 设计网站栏目如何制作图片
  • 网站接做网站单建设网站是普通办公吗
  • 兴义网站开发将网站发布到微信小程序怎么做
  • 专业网站制作公司采用哪些技术制作网站?自建的电子网站如何做推广
  • 网站开发浏览器兼容平面设计的基本流程是什么
  • wordpress搭建网盘网站优化建设方案
  • 百度蜘蛛网站WordPress好看的404
  • 重点建设专业 专题网站楚雄百度推广电话
  • 手机网站优化指南网红营销的策略
  • 哪里有帮做微课的网站免费空间域名可以做淘宝客网站推广吗
  • 网站建设完成外网无法访问网站设计 中高端
  • 网站制作公司怎么样凡科网h5
  • 郑州建筑公司网站建设网页设计与制作案例教程
  • iis5.1 新建网站温州网页设计公司哪家好
  • 网站开发前台怎么样云南网站开发公司推荐
  • 商标 做网站 是几类五个网络营销方式
  • 温州合作网站长尾关键词搜索网站
  • 建网站要注意的细节包头seo哪家好
  • 网站建设注册小程序长沙做网络推广公司的