当前位置: 首页 > news >正文

企业网站的建设与维护制作网站电话

企业网站的建设与维护,制作网站电话,瑜伽网站设计,百度知识营销文章目录数据文件准备wav.scputt2spkspk2utttext相关代码根据文件生成 utt2spk 和 wav.scputt2spk -- spk2utt 转换数据文件准备 在训练/解码中: 有三个文件是必要的: wav.scp 语音编号 – 路径信息utt2spk 语音编号 – 说话人编号spk2utt 说话人编号 …

文章目录

    • 数据文件准备
      • wav.scp
      • utt2spk
      • spk2utt
      • text
    • 相关代码
      • 根据文件生成 utt2spk 和 wav.scp
      • utt2spk -- spk2utt 转换


数据文件准备

在训练/解码中:
有三个文件是必要的:

  1. wav.scp 语音编号 – 路径信息
  2. utt2spk 语音编号 – 说话人编号
  3. spk2utt 说话人编号 – 说话人的语音编号;可以根据 spk2utt 生成,下面将会介绍

一个标注文件用于测试的:
text


这里以 aishell 为例:

wav.scp

结构

[utterance] [wav_path]

BAC009S0002W0122 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0122.wav
BAC009S0002W0123 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0123.wav
BAC009S0002W0124 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0124.wav

utt2spk

结构:

[utterance] [speaker]

BAC009S0002W0122 S0002
BAC009S0002W0123 S0002

spk2utt

结构:

[speaker] [utterance]

S0002 BAC009S0002W0122 BAC009S0002W0123 BAC009S0002W0124 BAC009S0002W0125 BAC009S0002W0126 BAC009S0002W0127 BAC009S0002W0128 BAC009S0002W0129 BAC009S0002W0130 BAC009S0002W0131 BAC009S0002W0132 ...
S0003 BAC009S0003W0121 BAC009S0003W0122 BAC009S0003W0123 BAC009S0003W0124 BAC009S0003W0125 BAC009S0003W0126 BAC009S0003W0127 BAC009S0003W0128 BAC009S0003W0129 BAC009S0003W0130 BAC009S0003W0131  ...
S0004 BAC009S0004W0121 BAC009S0004W0123 BAC009S0004W0124 BAC009S0004W0125 BAC009S0004W0126 BAC009S0004W0127 BAC009S0004W0128 ...

text

[utterance] [transcript]

BAC009S0002W0122 而 对 楼市 成交 抑制 作用 最 大 的 限 购
BAC009S0002W0123 也 成为 地方 政府 的 眼中 钉
BAC009S0002W0124 自 六月 底 呼和浩特 市 率先 宣布 取消 限 购 后
BAC009S0002W0125 各地 政府 便 纷纷 跟进
BAC009S0002W0126 仅 一 个 多 月 的 时间 里

相关代码

根据文件生成 utt2spk 和 wav.scp

假设文件按 说话人–音频 排列,可以使用下属代码生成 utt2spk 和 wav.scp 文件

import osdata_root_dir = 'data'
utt2spk_path = 'utt2spk'
wav_scp_path = 'wav.scp'for speaker in os.listdir(data_root_dir):if speaker.startswith('.'):continuespearker_dir = os.path.join(data_root_dir, speaker)for wav in os.listdir(spearker_dir):if wav.startswith('.'):continuewav_path = os.path.join(spearker_dir, wav)wav_id = f'{speaker}_{wav}' with open(wav_scp_path, 'a') as fa:fa.write(wav_id + ' ' + wav_path + '\n')with open(utt2spk_path, 'a') as fa:fa.write(wav_id + ' ' + speaker + '\n') 

utt2spk – spk2utt 转换


你可以使用代码 将 utt2spk 转为 文件:

kaldi_root/egs/wsj/s5/utils/utt2spk_to_spk2utt.pl  utt2spk > spk2utt

utt2spk 文件内不能有空行,否则可能报错


同样,你也可以使用 spk2utt_to_utt2spk.pl 反向将 spk2utt 生成 utt2spk


伊织 2023-02-09 (四,晴)

http://www.yayakq.cn/news/146148/

相关文章:

  • 贾汪城乡建设局网站台州h5建站
  • 网站正能量点进去就能看湖北网站建站系统哪家好
  • 京东企业集团网站建设方案厦门建设局网站商品房
  • 南山做网站公司在哪里网站建设服务有哪些方面
  • 建设网站开通网线多少钱wordpress上线
  • 做网站需要登陆服务器网站吗宁波十大口碑最好的装饰公司
  • 诚信网站 互联网建站wordpress所有图片都裁剪
  • 沧州自适应网站建设招商网代理
  • 塘沽建设网站公司自学网站建设哪个网站好
  • 海口网站开发建设平顶山做网站推广
  • 怎么根据网站前端做网站后台可以做网站的公司
  • 怎样做p2p网站2021年室内设计公司全国排名百强
  • 行业应用网站建设成本个人可以做微信小程序吗?
  • 东营seo网站推广分销平台哪个好
  • 南昌网站开发培训学校空间站对接
  • 网站如何做映射建设银行自贡分行网站
  • 网站县区分站点建设北京app网站开发
  • 商丘网站建设设计大型网站服务器多少钱
  • 云建站微网站怎么推广网站
  • 网站用户体验诊断国家重大建设项目库网站
  • 国外外贸网站大全局网站信息内容建设 自查报告
  • 帕绍网站建设东莞网站推广费用
  • 做字体的网站腾讯广告联盟
  • 网站开发软文品牌网站建设帮你大蝌蚪
  • 网站建设官网型好呢还是商城型公司网站建设为什么不直接买模版
  • 深圳网站建设公司哪个做网站的服务器很卡怎么办
  • 忻州建站公司东直门小学的网站建设
  • 湖南网站建设制作公司厦门市建设局官网
  • 自助网站建设哪家好如何免费推广网站
  • 怎么查网站死链接南海区住房城乡建设和水务局网站