当前位置: 首页 > news >正文

行业网站 源码专业类网站

行业网站 源码,专业类网站,网站建设技术列表,个人简介范文在上一篇文章中,我们已经解释了什么是NLP及其在现实世界中的应用。在这篇文章中,我们将继续介绍NLP应用程序中使用的一些主要深度学习模型。 BERT 来自变压器的双向编码器表示(BERT)由Jacob Devlin在2018年的论文《BERT:用于语言…

An overview of the 7 NLP models.

在上一篇文章中,我们已经解释了什么是NLP及其在现实世界中的应用。在这篇文章中,我们将继续介绍NLP应用程序中使用的一些主要深度学习模型。

BERT

  • 来自变压器的双向编码器表示(BERT)由Jacob Devlin在2018年的论文《BERT:用于语言理解的深度双向变压器的预训练》中首次提出。
  • BERT模型的主要突破是,它在训练过程中查看文本时,以双向方式扫描文本,而不是从左到右或从左到左和从右到左的组合序列。
  • BERT一般有两种类型:BERT(基本)和BERT(大)。不同之处在于可配置参数:基本参数为1100万,大参数为3.45亿。

XLNet

  • XLNet于2019年发表在论文《XLNet:语言理解的广义自回归预训练》中。
  • XLNet在20次基准测试中以很大的优势优于BERT,因为它利用了自回归模型和双向上下文建模的最佳效果。XLNet采用了一种新提出的建模方法,称为“置换语言建模”。
  • 与基于前一个标记的上下文预测句子中单词的语言模型中的传统标记化不同,XLNet的置换语言建模考虑了标记之间的相互依赖性。
  • XLNet的性能测试结果比BERT提高了2-15%。

RoBERTa

  • RoBERTa是在2019年的论文《RoBERTa:一种稳健优化的BERT预训练方法》中提出的。
  • RoBERTa对BERT的体系结构和培训程序进行了更改。具体而言,RoBERTa删除了下一句预测(NSP)目标,使用了比BERT大得多的数据集,并用动态掩蔽取代了静态掩蔽。
  • RoBERTa的性能测试结果比BERT提高了2-20%。

ALBERT

  • ALBERT模型是在2019年的论文《ALBERT:语言表征自我监督学习的精简BERT》中提出的。
  • ALBERT是在BERT模型的基础上开发的。它的主要突破是显著降低了参数,但与BERT相比保持了相同的性能水平。
  • 在ALBERT中,参数在12层变压器编码器之间共享,而在原始BERT中每层编码器都有一组唯一的参数。

StructBERT

  • StructBERT是在2019年的论文《StructBERT:将语言结构纳入深度语言理解的预训练》中提出的。
  • StructBERT通过将语言结构纳入训练过程,进一步扩展了BERT。
  • StructBERT还引入了单词结构目标(WSO),它有助于模型学习单词的排序。

T5

  • T5是在2019年的论文《用统一的文本到文本转换器探索迁移学习的极限》中介绍的。T5是“文本到文本传输转换器”的缩写。
  • T5发布了一个干净、庞大、开源的数据集C4(Colossal clean Crawled Corpus)。
  • T5将所有NLP任务分类为“文本到文本”任务。
  • T5型号有五种不同尺寸,每种型号都有不同数量的参数:T5小型(6000万个参数)、T5基础(2.2亿个参数),T5大型(7.7亿个参数。

ELECTRA

  • ELECTRA是在2020年的论文“ELECTRA:将文本编码器预训练为鉴别器而非生成器”中提出的。
  • ELECTRA提出了一种新的预训练框架,它结合了生成器和鉴别器。
  • ELECTRA将掩蔽语言模型的训练方法改为替换标记检测。
  • ELECTRA在小型模型上表现更好。

本文:【LLM 】7个基本的NLP模型,为ML应用程序赋能 | 开发者开聊

自我介绍

  • 做一个简单介绍,酒研年近48 ,有20多年IT工作经历,目前在一家500强做企业架构.因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【架构师研究会】和【开发者开聊】,有更多的内容分享,谢谢大家收藏。
  • 企业架构师需要比较广泛的知识面,了解一个企业的整体的业务,应用,技术,数据,治理和合规。之前4年主要负责企业整体的技术规划,标准的建立和项目治理。最近一年主要负责数据,涉及到数据平台,数据战略,数据分析,数据建模,数据治理,还涉及到数据主权,隐私保护和数据经济。 因为需要,比如数据资源入财务报表,另外数据如何估值和货币化需要财务和金融方面的知识,最近在学习财务,金融和法律。打算先备考CPA,然后CFA,如果可能也想学习法律,备战律考。
  • 欢迎爱学习的同学朋友关注,也欢迎大家交流。全网同号【架构师研究会】

欢迎收藏  【全球IT瞭望】,【架构师酒馆】和【开发者开聊】.

http://www.yayakq.cn/news/388314/

相关文章:

  • 网站服务器维护技术今天重大国际新闻
  • wordpress制作海报网站seo诊断分析报告
  • 广东省建筑网站佛山做网站3lue
  • 一家专门做海报的网站汕头网站排名优化
  • 设计网站需要考虑哪些海口小程序制作公司
  • 请人做网站需要注意什么多国语言 网站源码
  • 如何识别一个网站是否做的好全屋定制设计师培训
  • 商丘网站优化公司公网ip做网站
  • 酒店网站模版html编写新闻页面
  • 通辽做网站哪家好展示型网站建设多少钱
  • 想做网站找哪个公司好wordpress变微软雅黑
  • 做交易网站什么开发语言wordpress 美丽说
  • 自适应影视网站模板成都做网站设
  • htm网站制作网站ip域名查询
  • 个人备案购物网站查询关键词
  • WordPress挂在虚拟站点自适应网站建设多少钱
  • 可以做问卷的网站有哪些免费咨询图片带字
  • 建 新闻 网站网站建设策划完整方案
  • 网站策划编辑是干嘛的网上哪里可以免费学编程
  • 商城网站功能文档网站开发找哪家好
  • 做防腐木花架的网站网站开发需要哪些人才
  • 我要啦 支持wordpress怎么建设seo自己网站
  • 宁波市北仑区建设局网站网站设计版式
  • anydrag建站专家网站建设系统上海市发布
  • 自己做网站百度能收录码云服务器网站配置
  • 网站中医建设淘宝关键词搜索量查询
  • 网站ie兼容性建筑工程信息频道
  • 环保科技东莞网站建设市场监督管理局官网入口
  • win8网站模板wordpress5分钟安装
  • 莆田市商城网站建设个人电脑wordpress