素材牛VIP会员
怎样表达一段语音的强度(响度)?
 好***下  分类:Python  人气:1071  回帖:1  发布于6年前 收藏

我希望通过一段语音分析语音的强度(响度)。

因为是工科狗而非理科狗,且对于音频信号分析是外行,只简单看了下FFT,所以对于自己分析语音强度的方法没有安全感。希望这方面的高手能够指导下。非常感谢!!!

以下是我获取语音信号数据的过程。123.wav语音文件来自于百度合成的mp3转码,所以这段语音就算存在噪音也应该是微量的,这里不用再滤波了(就算滤波也不知道滤波器系数该用什么)。我猜想到此应该是没有问题的?

# -*- coding: utf-8 -*-
import numpy as np
import pylab as pl
import wave
f = wave.open("/home/dyan/123.wav", "rb")
# 读取格式信息
# (nchannels, sampwidth, framerate, nframes, comptype, compname)
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
# 读取波形数据
str_data = f.readframes(nframes)
f.close()
wave_data = np.fromstring(str_data, dtype=np.short)
# 在时间轴上画波形图
# 以上nchannels=1, sampwidth=2, framerate=16000
lenth=len(wave_data)
ti=lenth/16000.0
t = np.arange(0, ti, ti/lenth)
pl.plot(t,wave_data)
pl.show()

波形图(时间长度大约1.8s)
我希望在播放这段语音的时候,通知语音的强度,但是显然频率太快了,并不要这么快,比如0.2s一次统计也许是比较合适的。
我有2个想法,但是不确定,没有安全感:

1、每0.2s求振幅绝对值平均值。
2、每0.2s取振幅绝对值最大值。

不了解音频信号处理,所以完全不知道这两种方案中的一种能不能代表语音强度。或者应该用其他的方式。

综上所述,2个问题:

1、这样获取波形数据wav_data是否正确?
2、怎样表达这段语音的强度(响度)?

讨论这个帖子(1)垃圾回帖将一律封号处理……

Lv1 新人
冷***知 职业无 6年前#1

声音就是机械振动波

它的强度就是振幅大小

高音和低音是 频率

 文明上网,理性发言!   😉 阿里云幸运券,戳我领取