气动喷枪网站建设,html5 metro风格网站模板,wordpress 主页设置,全球采购网站GPT-SoVITS 本地搭建踩坑 前言搭建下载解压VSCode打开安装依赖包修改内容1.重新安装版本2.修改文件内容 运行总结 前言
传言GPT-SoVITS作为当前与BertVits2.3并列的TTS大模型#xff0c;于是本地搭了一个#xff0c;简单说一下坑。
搭建
下载
到GitHub点击此处下载 http… GPT-SoVITS 本地搭建踩坑 前言搭建下载解压VSCode打开安装依赖包修改内容1.重新安装版本2.修改文件内容 运行总结 前言
传言GPT-SoVITS作为当前与BertVits2.3并列的TTS大模型于是本地搭了一个简单说一下坑。
搭建
下载
到GitHub点击此处下载 https://github.com/RVC-Boss/GPT-SoVITS 解压
解压到全英文目录
VSCode打开
使用VSCode打开切到conda并clone一个之前BertVits的环境没环境的自己先做一个Python3.10的配好PyTorch的
安装依赖包
使用下面语句安装依赖
pip install -r requirements.txt修改内容
根据issues内大家讨论的结果这样操作是实测可行的但是之后作者应该会优化截止发文这么改是没问题的以后可能不用改了 https://github.com/RVC-Boss/GPT-SoVITS/issues/26
1.重新安装版本
输入下面的指令重新安装一下对应版本的
pip install funasr0.8.7
pip install modelscope1.10.02.修改文件内容
将 tools\damo_asr\cmd-asr.py 文件中的
inference_pipeline pipeline(taskTasks.auto_speech_recognition,modeltools/damo_asr/models/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch,vad_modeltools/damo_asr/models/speech_fsmn_vad_zh-cn-16k-common-pytorch,punc_modeltools/damo_asr/models/punc_ct-transformer_zh-cn-common-vocab272727-pytorch,
)改成
inference_pipeline pipeline(taskTasks.auto_speech_recognition,modeldamo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch,vad_modeldamo/speech_fsmn_vad_zh-cn-16k-common-pytorch,punc_modeldamo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch,
)根据我的研究原因是 git clone 的那几个模型的配置文件和它自动下载的内容不一样 修改后源码如下
# -*- coding:utf-8 -*-from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
import sys,os,traceback
dirsys.argv[1]
# opt_namedir.split(\\)[-1].split(/)[-1]
opt_nameos.path.basename(dir)path_asrtools/damo_asr/models/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch
path_vadtools/damo_asr/models/speech_fsmn_vad_zh-cn-16k-common-pytorch
path_punctools/damo_asr/models/punc_ct-transformer_zh-cn-common-vocab272727-pytorch
path_asrpath_asr if os.path.exists(path_asr)else damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch
path_vadpath_vad if os.path.exists(path_vad)else damo/speech_fsmn_vad_zh-cn-16k-common-pytorch
path_puncpath_punc if os.path.exists(path_punc)else damo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch
# inference_pipeline pipeline(
# taskTasks.auto_speech_recognition,
# modelpath_asr,
# vad_modelpath_vad,
# punc_modelpath_punc,
# )
inference_pipeline pipeline(taskTasks.auto_speech_recognition,modeldamo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch,vad_modeldamo/speech_fsmn_vad_zh-cn-16k-common-pytorch,punc_modeldamo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch,
)opt[]
for name in os.listdir(dir):try:text inference_pipeline(audio_in%s/%s%(dir,name))[text]opt.append(%s/%s|%s|ZH|%s%(dir,name,opt_name,text))except:print(traceback.format_exc())opt_diroutput/asr_opt
os.makedirs(opt_dir,exist_okTrue)
with open(%s/%s.list%(opt_dir,opt_name),w,encodingutf-8)as f:f.write(\n.join(opt))运行
在环境中输入即可正常启动
python webui.py总结
能够有感情的朗读了不错