当前位置: 首页 > news >正文

php学完可以做网站陕西网络推广公司

php学完可以做网站,陕西网络推广公司,哪些店铺适合交换友情链接,网站域名备案注册证书综述系列2021_A Survey on Neural Speech Synthesis论文:2106.15561.pdf (arxiv.org)论文从两个方面对神经语音合成领域的发展现状进行了梳理总结(逻辑框架如图1所示):核心模块:分别从文本分析(textanalysi…
  1. 综述系列

2021_A Survey on Neural Speech Synthesis

论文:2106.15561.pdf (arxiv.org)

论文从两个方面对神经语音合成领域的发展现状进行了梳理总结(逻辑框架如图1所示):

核心模块:分别从文本分析(textanalysis)、声学模型(acoustic model)、声码器(vocoder)、完全端到端模型(fully end-to-end model)等方面进行介绍。

进阶主题:分别从快速语音合成(fast TTS)、低资源语音合成(low-resourceTTS)、鲁棒语音合成(robust TTS)、富有表现力的语音合成(expressive TTS)、可适配语音合成(adaptive TTS)等方面进行介绍。

TTS 核心模块

研究员们根据神经语音合成系统的核心模块提出了一个分类体系。每个模块分别对应特定的数据转换流程:

1)文本分析模块将文本字符转换成音素或语言学特征;

2)声学模型将语言学特征、音素或字符序列转换成声学特征;

3)声码器将语言学特征或声学特征转换成语音波形;

4)完全端到端模型将字符或音素序列转换成语音波形。

2021_A Survey on Audio Synthesis and Audio-Visual Multimodal Processing(音频合成与视听多模态处理综述)

论文:2108.00443.pdf (arxiv.org)

  1. SOTA

2022_NaturalSpeech: End-to-End Text to Speech Synthesis with Human-Level Quality

论文:2205.04421v2.pdf (arxiv.org)

  1. TTS经典论文

2016_WAVENET: A GENERATIVE MODEL FOR RAW AUDIO

论文:1609.03499.pdf (arxiv.org)

【3,4】本文的四大特点如下:

  1. WaveNet 直接生成自然的语音波形

  1. 提出了一种可以学习和生成长语音波形的新结构。

  1. 训练的模型可以产生各种特征语音,因为状态建模。

  1. 它在各种语音生成(包括音乐)中也表现出色。

WaveNet模型结构

WaveNet 具有 30 个救援块的结构。 将整数数组作为输入,从第一个区域块到第 30 个区域性块依次进入。 从每个区域块生成的输出通过 Skip 连接合并,并将其用作模型的输出。

2018_NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS

论文:2108.00443.pdf (arxiv.org)

随着深度学习方法(如 WaveNet 和 Tacotron)的应用,TTS (TTS) 发展迅速。 因此,现在无需复杂的工作流程即可训练数据,从而从文本中生成高质量的语音【1,2】

论文的三大特点如下:

  1. 基于 Attention 的 Seq-to-Seq提出了TTS模型结构。

  1. <端到端模型>,只需对<语句、语音和对的数据即可进行训练,无需执行任何操作

  1. 在语音合成质量测试 (MOS) 中得分较高。合成质量好。

2017.3_Deep Voice: Real-time Neural Text-to-Speech

论文:https://arxiv.org/abs/1702.07825

2017.5_Deep Voice 2: Multi-Speaker Neural Text-to-Speech

2018_DEEP VOICE 3: SCALING TEXT-TO-SPEECH WITH CONVOLUTIONAL SEQUENCELEARNING

论文:

参考文献

【1】[논문리뷰]Tacotron2 - 새내기 코드 여행 (joungheekim.github.io)

【2】[Speech Synthesis] Tacotron 논문 정리 (hcnoh.github.io)

【3】[논문리뷰]WaveNet - 새내기 코드 여행 (joungheekim.github.io)

【4】Understanding WaveNet architecture | by Satyam Kumar | Medium

References

[1] Sercan Ömer Arik, Mike Chrzanowski, Adam Coates, Gregory Frederick Diamos, Andrew Gibiansky, Yongguo Kang, Xian Li, John Miller, Andrew Y. Ng, Jonathan Raiman, Shubho Sengupta, Mohammad Shoeybi: Deep Voice: Real-time Neural Text-to-Speech. ICML 2017: 195-204

[2] Wei Ping, Kainan Peng, Andrew Gibiansky, Sercan O.Arık, Ajay Kannan, Sharan Naran: DEEP VOICE 3: 2000-SPEAKER NEURAL TEXT-TO-SPEECH. CoRR abs/1710.07654 (2017)

[3] Sercan Ömer Arik, Gregory F. Diamos, Andrew Gibiansky, John Miller, Kainan Peng, Wei Ping, Jonathan Raiman, Yanqi Zhou: Deep Voice 2: Multi-Speaker Neural Text-to-Speech. CoRR abs/1705.08947 (2017)

[4] Aäron van den Oord, Sander Dieleman, Heiga Zen, Karen Simonyan, Oriol Vinyals, Alex Graves, Nal Kalchbrenner, Andrew W. Senior, Koray Kavukcuoglu: WaveNet: A Generative Model for Raw Audio. CoRR abs/1609.03499 (2016)

[5] Soroush Mehri, Kundan Kumar, Ishaan Gulrajani, Rithesh Kumar, Shubham Jain, Jose Sotelo, Aaron C. Courville, Yoshua Bengio: SampleRNN: An Unconditional End-to-End Neural Audio Generation Model. CoRR abs/1612.07837 (2016)

[6] Sotelo, J., Mehri, S., Kumar, K., Santos, J. F., Kastner, K., Courville, A., & Bengio, Y. (2017). Char2Wav: End-to-end speech synthesis.

[7] Yuxuan Wang, R. J. Skerry-Ryan, Daisy Stanton, Yonghui Wu, Ron J. Weiss, Navdeep Jaitly, Zongheng Yang, Ying Xiao, Zhifeng Chen, Samy Bengio, Quoc V. Le, Yannis Agiomyrgiannakis, Rob Clark, Rif A. Saurous: Tacotron: A Fully End-to-End Text-To-Speech Synthesis Model. CoRR abs/1703.10135 (2017)

[8] Wang, W., Xu, S., & Xu, B. (2016). First Step Towards End-to-End Parametric TTS Synthesis: Generating Spectral Parameters with Neural Attention. INTERSPEECH.

http://www.yayakq.cn/news/901239/

相关文章:

  • 工程师招聘网站桂林网站制作公司
  • 酒吧网站建设报价模板wordpress 网站统计
  • 成都网络优化网站个人建 行业 网站
  • 网络营销怎么做网站手机网页页面设计模板
  • 网页建站工具专业的单位网站开发开发
  • 做视频网站需要什么证建设商务网站的理由
  • 湖南彩票网站开发百度竞价ocpc投放策略
  • 石家庄做网站公司商务网站建设联系方式
  • kocool网站开发网站怎样做免费优化有效果
  • 如何做一名合格的网站人wordpress 取消版权
  • 企业网站建设模板网站开发代码 免责声明
  • 国外装修网站模板怎样建自己的网站免费的
  • 淘宝网站框架中天建设哪里的
  • 网站建设公司中企动力推荐南宁市公共资源交易中心网
  • 网站域名的单词庆云网站建设
  • 怎么注册网站账号河北做网站的
  • 网站建设推广有没有彩页印刷
  • 大型网站开发流程活动网站建设
  • 甘肃路桥建设集团网站免费php网站模板下载
  • 企业网站下载免费建设网站有哪些
  • 微信网站界面网校网站建设
  • 沅江网站设计公司外贸平台有哪些排名
  • 青海网站建设企业wordpress 新建侧边栏
  • 专业模板网站制作价格郑州百度关键词seo
  • 软件免费下载网站有哪些长春生物和北京生物是一家吗
  • 环保企业网站模板wordpress 单栏模板
  • 衡阳企业网站建设大学生网站设计论文3000字
  • 吉林做网站公司浙江省建设厅建筑信息网官网
  • 太原中企动力网站建设园林景观设计公司官网
  • 明星网站怎么设计有啥创意可以做商务网站的