语音识别中HMM-GMM的训练过程
本篇将直接分享我在学习传统声学模型:HMM-GMM 的过程中,遇到一些的困惑,和自己的理解。也希望在学习这个模型过程中,遇到同样困惑的同学能够作为参考。
开整。
困惑:语音标注文件以词级为单位,没有标注到每一帧,是怎么训练的?
问题描述:
我们观察语音识别的标注文件,就会发现往往是词级别的标注或者句子级别的标注。而我们的HMM-GMM模型三个状态构成...
kaldi基于GMM的单音素模型 训练部分
1. gmm-init-mono
2. compile-train-graghs
3. align-equal-compiled
4. gmm-acc-stats-ali
5. gmm-sum-accs
6. gmm-est
7.train_mono.sh脚本详解
资料来自kaldi官方文档。
转载注明出处。
1. gmm-init-mono
gmm-i...
kaldi学习 一脚本流学习工具使用
先给出整体脚本如下:
分块详解
kaldi中脚本东西比较多,一层嵌一层,不易阅读。
本文以yesno为例,直接使用kaldi编译的工具,书写简易进行训练,方便学习kaldi工具的使用。
注意:转载请注明出处。
先给出整体脚本如下:
#!/bin/bash
. ./path
# feature extraction:
# a series of l...
DNN在线解码 aishell为例
在kaldi 的工具集里有好几个程序可以用于在线识别。这些程序都位在src/onlinebin文件夹里,他们是由src/online文件夹里的文件编译而成(你现在可以用make ext 命令进行编译)。这些程序大多还需要tools文件夹中的portaudio 库文件支持,portaudio 库文件可以使用tools文件夹中的相应脚本文件下载安装。
注:online官方不再维护,新版本为on...
kaldi - Online Audio Server(服务器客户端建立方法-旧版在线解码)
Example Usage
Command line to start the server:
online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000
--beam=72.0 --acoustic-scale=0.0769 final.mdl graph/HCLG.fs...
kaldi 模型训练工具整理
acc-tree-stats
cluster-phones
compile-questions
build-tree
gmm-init-model
gmm-init-mono
gmm-mixup
convert-ali
compile-train-graphs
acc-tree-stats
Accumulate statistics for phonetic-conte...
kaldi HMM-GMM全部训练脚本分解
train_mono.sh
train_deltas.sh
train_lda_mllt.sh
train_mono.sh
单音素训练脚本:
//初始化,[topo feats] -> [0.mdl tree]
gmm-init-mono
//生成训练图,[0.mdl text l.fst] -> [train.fst]
compile-train-graph...
基于CTC的语音识别系统训练
最小语音识别模型
模型训练
后续
最小语音识别模型
输入
音频特征向量,共计26维的mfcc特征向量
为了使神经网络能够统一格式,将[batch_size, time_step, 26]中的time_step定为一个较大的值,如果实际时长不足,采用补零的方法补齐
输出
输出为一个[batch_size, words_length]的张量,方便训练将word_len...
aishell数据处理为thchs30格式
aishell数据格式对于用神经网络处理数据的同学来说比较不友善,因为他只有文字转录和音素级别的转录,并没有拼音的转录。
aishell数据转换格式
aishell数据转化方法
aishell数据转换格式
废话不多说,转化后数据格式和thchs相同,如下:
thchs30
train.syllable.txt: A11_0 lv4 shi4 yang2 ch...
训练CNN+CTC网络的时候报错:sequence_length(0)
我在使用keras 训练CNN+CTC网络的时候报错:
sequence_length(0) <= X
出现该问题的原因是网络的宽度发生了变化,而ctc层的定义:
def ctc_lambda(args):
labels, y_pred, input_length, label_length = args
y_pred = y_pred[:, :, :]
...
论文参考文献格式说明
(一)期刊类
[序号] 作者. 文章名[J].期刊名,出版年份,卷号(期号):起始页码-终止页码
(二)学位论文
[序号] 作者. 文章名[D].出版地,保存单位,出版年份:起始页码-终止页码
参考文献类型
J - 期刊 D - 学位论文 N - 报纸
M - 专著 R - 报告 C - 论文...
EEMD-GA-BPNN
data = csvread('D:\demo\dataset\train_passenger_volume.csv');
%EEMD(集成经验模态分解):eemd(ts,高斯白噪声标准差[0.01-0.4],噪声次数[50|100])
imfs = eemd(data,0.01,50); %第一列(原时间序列) | 其余列(分解的IMF)
%构造输入向量与输出向量
sample =...
EEMD-PSO-BPNN
data = csvread('D:\demo\dataset\train_passenger_volume.csv');
%EEMD(集成经验模态分解):eemd(ts,高斯白噪声标准差[0.01-0.4],噪声次数[50|100])
imfs = eemd(data,0.01,50); %第一列(原时间序列) | 其余列(分解的IMF)
%构造输入向量与输出向量
sample =...
数学编辑器-MathType
软件下载地址:http://wm.makeding.com/iclk/?zoneid=1728&uid=1428 (6.9b版)
注册码:MTWE691-Sel524-937la
MTWE691-011076-szwud
MTWE691-011352-2nmj7
MTWE691-011524-947...
经验模态分解EMD(Python)
EMD(Python)使用手册
(一)下载EMD模块
下载python模块pyhht,可实现经验模态分解功能
(二)序列分解
import numpy as np
import pandas as pd
from sklearn import datasets
import matplotlib.pyplot as plt
from pyhht.emd import EMD
from py...
ARIMA时间序列分析(Python)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#ADF单位根检验
from statsmodels.tsa.stattools import adfuller
#序列分解(季节+趋势+残差)
from statsmodels.tsa.seasonal import seasonal_decompose
...
knn_classification_model(Python)
import numpy as np
import pandas as pd
from sklearn import datasets
#数据预处理
from sklearn import preprocessing
#划分数据集/网格搜索参数
from sklearn.model_selection import train_test_split,GridSearchCV
#特征选择
from ...
knn_regression_model(Python)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import preprocessing
from sklearn.model_selection import train_test_split,GridSearchCV
...
今日推荐
周排行