当前位置: 首页 > news >正文

合肥广告公司雄安做网站优化的公司

合肥广告公司,雄安做网站优化的公司,重庆专业网站推广公司,做门户网站经验encode和encode_plus的区别可以参考我的另一篇博客:https://blog.csdn.net/weixin_41862755/article/details/120070535 encode和tokenize的区别 区别 encode编码出来的结果,包含开始的[CLS]和结尾的[SEP],所以程序输出结果比原sentence多…

encode和encode_plus的区别可以参考我的另一篇博客:https://blog.csdn.net/weixin_41862755/article/details/120070535

encode和tokenize的区别

区别
  1. encode编码出来的结果,包含开始的[CLS]和结尾的[SEP],所以程序输出结果比原sentence多两位。
  2. tokenize编码出来的结果,就是sentence对应的id,无多余项。
import torch
from transformers import BertTokenizermodel_name = 'bert-base-uncased'# a.通过词典导入分词器
tokenizer = BertTokenizer.from_pretrained(model_name)
sentence = "Hello, my son is laughing."input_ids = torch.tensor(tokenizer.encode(sentence))input_id = tokenizer.tokenize(sentence)
input_id2 = tokenizer.convert_tokens_to_ids(input_id)print("input_ids结果是:",input_ids)
print("input_id2的结果是:",input_id2)

执行结果如下:

input_ids结果是: tensor([ 101, 7592, 1010, 2026, 2365, 2003, 5870, 1012,  102])
input_id2的结果是: [7592, 1010, 2026, 2365, 2003, 5870, 1012]
注意:
input_id2[0:len(input_id2)])  #取得和input_ids一样的结果
http://www.yayakq.cn/news/748092/

相关文章:

  • 做外贸比较好用的网站有哪些牡丹江市住房和城乡建设局网站
  • 南昌的网站推广公司赣州营销网站建设
  • 论坛网站文本抓取怎么做开发公司资质哪里查
  • 建站工具有哪些cms网站seo优化怎么做
  • 宁波自适应网站建设优化建站弹幕网站开发
  • 微信公众平台绑定网站个人做外贸网站平台
  • 编程 朋友 做网站优化seo技术
  • 公司网站包含哪些内容网上开店电商平台有哪些
  • 没有公司个人可以做网站卖东西吗快速优化网站排名搜索
  • 做网站公司 陕西渭南建设银行企业网银网站打不开
  • ipv6改造 网站怎么做禄丰网站建设
  • 上传的网站打不开 index.asp个人开小公司的流程
  • 怎样做网络推广为什么要做网络推广关键词查询优化
  • 深圳微信网站建设cad图纸免费下载网站
  • 仿制别人的竞价网站做竞价犯法吗如何更换网站后台
  • 北京建设部网站网站建设制作开发
  • 成都网站建设司建设一个网站需要哪些软硬件条件
  • 网站建设达到什么水平展览展示设计网站
  • 网站管理助手4.0 mysql株洲制作网站
  • 如何撰写网站建设方案小说网站个人可以做吗
  • 网站淘宝推广怎么做富海人才招聘网官网
  • 外贸出口网站建设电商运营是干嘛的
  • 全屏产品网站宽屏大气网站源码
  • 如何查看网站有没有收录共青城网站建设公司
  • APP客户端网站建设wordpress 文章标题列表
  • 企业品牌类网站大学学科建设网站
  • 海西高端网站建设价格浦东新区网站优化推广
  • wordpress 菜单栏阜阳网站优化
  • 中国纪检监察报记者电话资源企业网站排名优化价格
  • wordpress 企业网站模板国内企业网站设计公司