语音信号前端处理代码解析 - 代码天地

语音信号前端处理代码解析

其他 2019-02-22 21:19:51 阅读次数: 0

版权声明：本文为博主原创文章，转载请加入原文链接，谢谢。。 https://blog.csdn.net/shawncheer/article/details/85636189

参考：https://haythamfayek.com/2016/04/21/speech-processing-for-machine-learning.html

代码如下：

import numpy
import scipy.io.wavfile
from scipy.fftpack import dct

sample_rate, signal = scipy.io.wavfile.read('OSR_us_000_0010_8k.wav')  # File assumed to be in the same directory
signal = signal[0:int(3.5 * sample_rate)]  # Keep the first 3.5 seconds

pre_emphasis = 0.97
emphasized_signal = numpy.append(signal[0], signal[1:] - pre_emphasis * signal[:-1])

frame_size = 0.025
frame_stride = 0.01

frame_length, frame_step = frame_size * sample_rate, frame_stride * sample_rate  # Convert from seconds to samples

signal_length = len(emphasized_signal)
frame_length = int(round(frame_length))
frame_step = int(round(frame_step))
num_frames = int(numpy.ceil(float(numpy.abs(signal_length - frame_length)) / frame_step))  # Make sure that we have at least 1 frame

pad_signal_length = num_frames * frame_step + frame_length
z = numpy.zeros((pad_signal_length - signal_length))
pad_signal = numpy.append(emphasized_signal, z) # Pad Signal to make sure that all frames have equal number of samples without truncating any samples from the original signal

indices = numpy.tile(numpy.arange(0, frame_length), (num_frames, 1)) + numpy.tile(numpy.arange(0, num_frames * frame_step, frame_step), (frame_length, 1)).T
x = numpy.tile(numpy.arange(0, num_frames * frame_step, frame_step), (frame_length, 1)).T
y = numpy.tile(numpy.arange(0, frame_length), (num_frames, 1))
print num_frames
print x.shape
print y.shape
frames = pad_signal[indices.astype(numpy.int32, copy=False)]

其中，有一行计算每个窗口起点位置的代码非常重要。

indices = numpy.tile(numpy.arange(0, frame_length), (num_frames, 1)) + numpy.tile(numpy.arange(0, num_frames * frame_step, frame_step), (frame_length, 1)).T

猜你喜欢

转载自blog.csdn.net/shawncheer/article/details/85636189

语音信号前端处理代码解析

MATLAB在AI领域的应用，语音信号处理全解析（附代码）

语音信号处理-语音信号的预处理

MATLAB语音信号处理

自学语音信号处理

librosa语音信号处理

语音信号处理分类

三、语音信号处理

语音信号处理（1）

语音信号的预处理

现代语音信号处理笔记 (三)

现代语音信号处理笔记 (一)

基于MATLAB的语音信号处理

语音信号处理--加窗函数

python做语音信号处理

语音信号处理概述及流程

matlab处理语音信号（一）

语音信号处理常识【摘抄|自用】

语音信号的时域处理（三）

语音信号的时域处理（二）

语音信号的时域处理（一）

语音信号的滤波处理matlab源码

语音信号处理——噪声抑制

数字语音信号处理学习笔记——语音信号的同态处理（2）

数字语音信号处理学习笔记——语音信号的同态处理（4）

数字语音信号处理学习笔记——语音信号的同态处理（3）

数字语音信号处理学习笔记——语音信号的同态处理（1）

手撕《语音信号处理》——通俗易懂的语音信号处理章节详解集合

语音信号处理 —— 笔记（一）音频信号处理

数字语音信号处理学习笔记——语音信号的短时时域分析（2）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)