当前位置: 首页 > news >正文

好点子网站建设昌邑住房和城乡建设局网站

好点子网站建设,昌邑住房和城乡建设局网站,免费发帖论坛大全,二级网站 备案概述 paddlespeech是百度飞桨平台的开源工具包,主要用于语音和音频的分析处理,其中包含多个可选模型,提供语音识别、语音合成、说话人验证、关键词识别、音频分类和语音翻译等功能。 本文介绍利用ps中的asr功能实现批量处理音频文件的demo。…

概述

paddlespeech是百度飞桨平台的开源工具包,主要用于语音和音频的分析处理,其中包含多个可选模型,提供语音识别、语音合成、说话人验证、关键词识别、音频分类和语音翻译等功能。

本文介绍利用ps中的asr功能实现批量处理音频文件的demo。

环境

centos 7.9

Python 3.10.3

paddlepaddle 2.5.1

paddlespeech 1.4.1

demo代码

demo的代码如下,使用python3.10版本运行。

# -*- coding: utf-8 -*-

#required python3.10

###paddlespeech asr demo

# paddlespeech asr -y --lang zh --model conformer_wenetspeech --input $audiofile

### demo基本的业务流程

### 给定目录,扫描目录下的音频文件,对音频文件进行asr接口操作,写入对应的结果文件

import os

from paddlespeech.cli.asr.infer import ASRExecutor

import soundfile as sf

srcPath = r'/home/admin/test'

resultFile = r'/home/admin/test/asr-result-file.txt'

##打开结果文件

rfile = open(resultFile, 'a')

##获取asr对象

asr = ASRExecutor()

for filename in os.listdir(srcPath):

    if filename.endswith('.wav') or filename.endswith('.mp3'):

        audio_file_path = os.path.join(srcPath, filename)

        ##获取文件参数,计算音频长度

        audio_data, sample_rate = sf.read(audio_file_path)

        duration = len(audio_data) / sample_rate

       

        ##当前的asr接口不能处理超过50秒的音频文件,自动跳过

        if duration >= 50:

            resultStr = 'srcFile:{}, duration >= 50, skip.'.format(audio_file_path)

            print(resultStr)

            rfile.write(resultStr + '\n')

        else:

            result = asr(audio_file=audio_file_path, model='conformer_wenetspeech', lang='zh', force_yes='y')

            print('srcFile:{}, asrResult:{}.'.format(audio_file_path, result))

            rfile.write('srcFile:{}, asrResult:{}.\n'.format(audio_file_path, result))

rfile.close()

测试

demo的测试结果如下。

$ python3 ps-asr-demo.py

/usr/local/python3/lib/python3.10/site-packages/librosa/core/constantq.py:1059: DeprecationWarning: `np.complex` is a deprecated alias for the builtin `complex`. To silence this warning, use `complex` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.complex128` here.

Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations

  dtype=np.complex,

2023-09-11 16:10:12.299 | INFO     | paddlespeech.s2t.modules.embedding:__init__:150 - max len: 5000

/usr/local/python3/lib/python3.10/site-packages/paddle/fluid/dygraph/math_op_patch.py:275: UserWarning: The dtype of left and right variables are not the same, left dtype is paddle.int64, but right dtype is paddle.bool, the right dtype will convert to paddle.int64

  warnings.warn(

srcFile:/home/admin/test/zh.wav, asrResult:我认为跑步最重要的就是给我带来了身体健康.

srcFile:/home/admin/test/en.wav, asrResult:那摘了的标准.

[2023-09-11 16:10:20,223] [ WARNING] - The sample rate of the input file is not 16000.

                             The program will resample the wav file to 16000.

                             If the result does not meet your expectations,

                             Please input the 16k 16 bit 1 channel wav file.

/usr/local/python3/lib/python3.10/site-packages/paddle/fluid/dygraph/math_op_patch.py:275: UserWarning: The dtype of left and right variables are not the same, left dtype is paddle.int64, but right dtype is paddle.bool, the right dtype will convert to paddle.int64

  warnings.warn(

srcFile:/home/admin/test/output.wav, asrResult:你好欢迎使用百度非讲深度学习框架.

srcFile:/home/admin/test/test-long-file.mp3, duration >= 50, skip.

...

总结

ps的asr功能中有多个模型可选,目前测试中的“conformer_wenetspeech”识别准确率较高。

识别速度有待提高,音频长度的限制也待解决。

空空如常

求真得真

http://www.yayakq.cn/news/773482/

相关文章:

  • 商丘网站制作费用wap网站模板下载
  • 海口网站建设联系方式手机下载app并安装
  • 深圳电商网站建设网站怎么做背景
  • 新手学做网站图做app一般多少钱
  • 怎么做58同城网站教程长沙互联网公司排名
  • 网站类型分类怎么在国外网站赚钱
  • 建设艺术网站需要多少钱深圳高端女装品牌排行榜
  • 作品集怎么做网站湖州网站制作报价
  • 做app模板网站有哪些试用网站 源码
  • 北京 网站建设咨询顾问公司做门户网站经验
  • 网站免费制作教程wordpress删除用户
  • 做网站建设公司起名成都企业建站系统模板
  • 网站开发层次wordpress当前页询价
  • 做网站按什么收费程序小程序开发
  • 微信分销网站建设用途兰州建设工程信息网站
  • 沧州做企业网站wordpress过滤用户输入数据
  • 网站打开后显示建设中网页显示网站正在建设中怎么做
  • 太原网站优化怎么做网站交易
  • 简述网站建设基本过程jsp网站开发四 酷 全书源码
  • 网站建设 项目经验22 wordpress 模板
  • 上海有名网站建站开发公司昆明网站做的好的公司
  • 织梦网站后台登陆没有办公地点怎么注册自己的公司
  • 西安网址开发 网站制作工业设计公司简介
  • 区块链网站建设无线网络网站dns解析失败
  • 网站推广seo设置面包类网站设计
  • 如何创建网站服务器地址流感用什么药最好
  • 建水县住房和城乡建设局网站如何外贸网络推广
  • 制作七星网站哪里找网站开发团队
  • 五金网站建设制作舟山网站建设免费咨询
  • 做网站需要多长时间网站建设技术公司