音频数据小波去噪-python

大部分内容参考自https://zhuanlan.zhihu.com/p/157540476
原文中处理的数据类型是一维数据类型，由于wav文件也是一维数据，因此同样适用。

1. 第一种实现方法

1.1 基本介绍

小波层数：5
小波基：sym8
阈值公式：在这里插入图片描述 ,cD1为第一层分解的细节系数，N为数据长度
阈值函数：软硬阈值折中的方法

1.2 代码

# 读excel表格数据进行去噪，并使用自适应阈值计算和软阈值收缩处理
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt

# 封装成函数
def sgn(num):
    if(num > 0.0):
        return 1.0
    elif(num == 0.0):
        return 0.0
    else:
        return -1.0

def wavelet_noising(new_df):
    data = new_df
    data = data.tolist()  # 将np.ndarray()转化为列表
    w = pywt.Wavelet('sym8')  # 选择sym8小波基
    [ca5, cd5, cd4, cd3, cd2, cd1] = pywt.wavedec(data, w, level=5)  # 5层小波分解
    length1 = len(cd1)
    length0 = len(data)

    Cd1 = np.array(cd1)
    abs_cd1 = np.abs(Cd1)
    median_cd1 = np.median(abs_cd1)

    sigma = (1.0/0.6745)*median_cd1
    lamda = sigma * math.sqrt(2.0*math.log(float(length0), math.e))  # 固定阈值计算
    usecoeffs = []
    usecoeffs.append(ca5)  # 向列表末尾添加对象

    # 软硬阈值折中的方法
    a = 0.5
    for k in range(length1):
        if (abs(cd1[k]) >= lamda):
            cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - a*lamda)
        else:
            cd1[k] = 0.0

    length2 = len(cd2)
    for k in range(length2):
        if (abs(cd2[k]) >= lamda):
            cd2[k] = sgn(cd2[k])*(abs(cd2[k])-a*lamda)
        else:
            cd2[k] = 0.0

    length3 = len(cd3)
    for k in range(length3):
        if (abs(cd3[k]) >= lamda):
            cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - a * lamda)
        else:
            cd3[k] = 0.0

    length4 = len(cd4)
    for k in range(length4):
        if (abs(cd4[k]) >= lamda):
            cd4[k] = sgn(cd4[k]) * (abs(cd4[k]) - a * lamda)
        else:
            cd4[k] = 0.0

    length5 = len(cd5)
    for k in range(length5):
        if (abs(cd5[k]) >= lamda):
            cd5[k] = sgn(cd5[k]) * (abs(cd5[k]) - a * lamda)
        else:
            cd5[k] = 0.0

    usecoeffs.append(cd5)
    usecoeffs.append(cd4)
    usecoeffs.append(cd3)
    usecoeffs.append(cd2)
    usecoeffs.append(cd1)
    recoeffs = pywt.waverec(usecoeffs, w)  # 信号重构
    return recoeffs

# 主函数
# path = "" #数据路径

# 提取数据
path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0]  # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)

data_denoising = wavelet_noising(data)  # 调用函数进行小波去噪
plt.plot(data_denoising)  # 显示去噪结果
plt.show()

1.3 去噪效果

去噪前的音频波形
在这里插入图片描述
去噪后的音频波形

2 第二种实现方法

在这里插入图片描述

#模块调用
import librosa
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import pywt
from math import log

#sgn函数
def sgn(num):
    if(num > 0.0):
        return 1.0
    elif(num == 0.0):
        return 0.0
    else:
        return -1.0

def wavelet_noising(new_df):
    data = new_df
    data = data.values.T.tolist()  # 将np.ndarray()转为列表
    w = pywt.Wavelet('dB10')#选择dB10小波基
    ca3, cd3, cd2, cd1 = pywt.wavedec(data, w, level=3)  # 3层小波分解
    ca3=ca3.squeeze(axis=0) #ndarray数组减维：(1，a)->(a,)
    cd3 = cd3.squeeze(axis=0)
    cd2 = cd2.squeeze(axis=0)
    cd1 = cd1.squeeze(axis=0)
    length1 = len(cd1)
    length0 = len(data[0])

    abs_cd1 = np.abs(np.array(cd1))
    median_cd1 = np.median(abs_cd1)

    sigma = (1.0 / 0.6745) * median_cd1
    lamda = sigma * math.sqrt(2.0 * math.log(float(length0 ), math.e))
    usecoeffs = []
    usecoeffs.append(ca3)

    #软阈值方法
    for k in range(length1):
        if (abs(cd1[k]) >= lamda/np.log2(2)):
            cd1[k] = sgn(cd1[k]) * (abs(cd1[k]) - lamda/np.log2(2))
        else:
            cd1[k] = 0.0

    length2 = len(cd2)
    for k in range(length2):
        if (abs(cd2[k]) >= lamda/np.log2(3)):
            cd2[k] = sgn(cd2[k]) * (abs(cd2[k]) - lamda/np.log2(3))
        else:
            cd2[k] = 0.0

    length3 = len(cd3)
    for k in range(length3):
        if (abs(cd3[k]) >= lamda/np.log2(4)):
            cd3[k] = sgn(cd3[k]) * (abs(cd3[k]) - lamda/np.log2(4))
        else:
            cd3[k] = 0.0

    usecoeffs.append(cd3)
    usecoeffs.append(cd2)
    usecoeffs.append(cd1)
    recoeffs = pywt.waverec(usecoeffs, w)#信号重构
    return recoeffs

path = 'G:\实验数据集/5s/fold1/1_001-140.wav'
data, sr = librosa.load(path, sr = 16000)
'''data = pd.read_csv(path)
data = data.iloc[:, 0]  # 取第一列数据'''
plt.plot(data)
plt.show()
print(data)

data_denoising = wavelet_noising(data)#调用小波阈值方法去噪
print(data_denoising)
plt.figure()
plt.plot(data_denoising)#显示去噪结果
plt.show()

去噪前：
在这里插入图片描述
去噪后：

3. 小波阈值去噪简略原理

对信号进行小波分解时，系数分解为近似小波系数（信号的低频成分）和细节小波系数（信号的高频成分）
小波阈值去噪方法认为，信号中的噪声存在于高频成分之中，因此，对于细节小波系数作阈值收缩处理，再将个小波系数进行组合重构就得到去噪后的信号。

如何对细节小波系数做阈值收缩处理呢？

信号经小波分解后：对于每层的小波系数，噪声对应的数值较小，因为，选取合适的阈值，将绝对值小于阈值的小波系数置0，绝对值较大的系数语义保留或收缩（阈值函数的作用），再利用小波逆变换进行重构，即得到去噪后的信号。

小波阈值去噪信号的步骤

（1) 对含噪信号进行小波分解。选择合适的小波基以及分解尺度，进行小波分解，得到一组小波系数。

（2) 对小波分解的各层高频系数进行阈值量化处理，得到小波系数的估计值。

（3）对经阈值量化处理的小波系数，进行逆小波变换以重构信号，得到去噪信号。