语音识别中HMM-GMM的训练过程

    本篇将直接分享我在学习传统声学模型:HMM-GMM 的过程中,遇到一些的困惑,和自己的理解。也希望在学习这个模型过程中,遇到同样困惑的同学能够作为参考。     开整。     困惑:语音标注文件以词级为单位,没有标注到每一帧,是怎么训练的?     问题描述:     我们观察语音识别的标注文件,就会发现往往是词级别的标注或者句子级别的标注。而我们的HMM-GMM模型三个状态构成...
分类: 其他 发布时间: 09-10 23:07 阅读次数: 0

kaldi基于GMM的单音素模型 训练部分

1. gmm-init-mono 2. compile-train-graghs 3. align-equal-compiled 4. gmm-acc-stats-ali 5. gmm-sum-accs 6. gmm-est 7.train_mono.sh脚本详解 资料来自kaldi官方文档。 转载注明出处。 1. gmm-init-mono gmm-i...
分类: 其他 发布时间: 09-10 23:06 阅读次数: 0

kaldi学习 一脚本流学习工具使用

先给出整体脚本如下: 分块详解 kaldi中脚本东西比较多,一层嵌一层,不易阅读。 本文以yesno为例,直接使用kaldi编译的工具,书写简易进行训练,方便学习kaldi工具的使用。 注意:转载请注明出处。 先给出整体脚本如下: #!/bin/bash . ./path # feature extraction: # a series of l...
分类: 其他 发布时间: 09-10 23:06 阅读次数: 0

DNN在线解码 aishell为例

在kaldi 的工具集里有好几个程序可以用于在线识别。这些程序都位在src/onlinebin文件夹里,他们是由src/online文件夹里的文件编译而成(你现在可以用make ext 命令进行编译)。这些程序大多还需要tools文件夹中的portaudio 库文件支持,portaudio 库文件可以使用tools文件夹中的相应脚本文件下载安装。 注:online官方不再维护,新版本为on...
分类: 其他 发布时间: 09-10 23:05 阅读次数: 0

kaldi - Online Audio Server(服务器客户端建立方法-旧版在线解码)

Example Usage Command line to start the server: online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000 --beam=72.0 --acoustic-scale=0.0769 final.mdl graph/HCLG.fs...
分类: 其他 发布时间: 09-10 23:05 阅读次数: 0

kaldi 模型训练工具整理

acc-tree-stats cluster-phones compile-questions build-tree gmm-init-model gmm-init-mono gmm-mixup convert-ali compile-train-graphs acc-tree-stats Accumulate statistics for phonetic-conte...
分类: 其他 发布时间: 09-10 23:05 阅读次数: 0

使用深度学习来破解 captcha 验证码

使用深度学习来破解 captcha 验证码 ...
分类: 其他 发布时间: 09-10 23:04 阅读次数: 0

kaldi HMM-GMM全部训练脚本分解

train_mono.sh train_deltas.sh train_lda_mllt.sh train_mono.sh 单音素训练脚本: //初始化,[topo feats] -> [0.mdl tree] gmm-init-mono //生成训练图,[0.mdl text l.fst] -> [train.fst] compile-train-graph...
分类: 其他 发布时间: 09-10 23:04 阅读次数: 0

深度学习知识树

深度学习知识树,别处传过来,用于自己知识整理。
分类: 其他 发布时间: 09-10 23:04 阅读次数: 0

基于CTC的语音识别系统训练

最小语音识别模型 模型训练 后续 最小语音识别模型 输入 音频特征向量,共计26维的mfcc特征向量 为了使神经网络能够统一格式,将[batch_size, time_step, 26]中的time_step定为一个较大的值,如果实际时长不足,采用补零的方法补齐 输出 输出为一个[batch_size, words_length]的张量,方便训练将word_len...
分类: 其他 发布时间: 09-10 23:04 阅读次数: 0

aishell数据处理为thchs30格式

aishell数据格式对于用神经网络处理数据的同学来说比较不友善,因为他只有文字转录和音素级别的转录,并没有拼音的转录。 aishell数据转换格式 aishell数据转化方法 aishell数据转换格式 废话不多说,转化后数据格式和thchs相同,如下: thchs30 train.syllable.txt: A11_0 lv4 shi4 yang2 ch...
分类: 其他 发布时间: 09-10 23:03 阅读次数: 0

训练CNN+CTC网络的时候报错:sequence_length(0)

我在使用keras 训练CNN+CTC网络的时候报错: sequence_length(0) <= X 出现该问题的原因是网络的宽度发生了变化,而ctc层的定义: def ctc_lambda(args): labels, y_pred, input_length, label_length = args y_pred = y_pred[:, :, :] ...
分类: 其他 发布时间: 09-10 23:03 阅读次数: 0

论文参考文献格式说明

(一)期刊类 [序号] 作者. 文章名[J].期刊名,出版年份,卷号(期号):起始页码-终止页码 (二)学位论文 [序号] 作者. 文章名[D].出版地,保存单位,出版年份:起始页码-终止页码 参考文献类型 J - 期刊 D - 学位论文 N - 报纸 M - 专著 R - 报告 C - 论文...
分类: 其他 发布时间: 09-10 23:02 阅读次数: 0

EEMD-GA-BPNN

data = csvread('D:\demo\dataset\train_passenger_volume.csv'); %EEMD(集成经验模态分解):eemd(ts,高斯白噪声标准差[0.01-0.4],噪声次数[50|100]) imfs = eemd(data,0.01,50);      %第一列(原时间序列) | 其余列(分解的IMF) %构造输入向量与输出向量 sample =...
分类: 其他 发布时间: 09-10 23:02 阅读次数: 0

EEMD-PSO-BPNN

data = csvread('D:\demo\dataset\train_passenger_volume.csv'); %EEMD(集成经验模态分解):eemd(ts,高斯白噪声标准差[0.01-0.4],噪声次数[50|100]) imfs = eemd(data,0.01,50);      %第一列(原时间序列) | 其余列(分解的IMF) %构造输入向量与输出向量 sample =...
分类: 其他 发布时间: 09-10 23:02 阅读次数: 0

数学编辑器-MathType

软件下载地址:http://wm.makeding.com/iclk/?zoneid=1728&uid=1428 (6.9b版) 注册码:MTWE691-Sel524-937la               MTWE691-011076-szwud               MTWE691-011352-2nmj7               MTWE691-011524-947...
分类: 其他 发布时间: 09-10 23:02 阅读次数: 0

经验模态分解EMD(Python)

EMD(Python)使用手册 (一)下载EMD模块 下载python模块pyhht,可实现经验模态分解功能 (二)序列分解 import numpy as np import pandas as pd from sklearn import datasets import matplotlib.pyplot as plt from pyhht.emd import EMD from py...
分类: 其他 发布时间: 09-10 23:01 阅读次数: 0

ARIMA时间序列分析(Python)

import pandas as pd import numpy as np import matplotlib.pyplot as plt #ADF单位根检验 from statsmodels.tsa.stattools import adfuller #序列分解(季节+趋势+残差) from statsmodels.tsa.seasonal import seasonal_decompose ...
分类: 其他 发布时间: 09-10 23:01 阅读次数: 0

knn_classification_model(Python)

import numpy as np import pandas as pd from sklearn import datasets #数据预处理 from sklearn import preprocessing #划分数据集/网格搜索参数 from sklearn.model_selection import train_test_split,GridSearchCV #特征选择 from ...
分类: 其他 发布时间: 09-10 23:01 阅读次数: 0

knn_regression_model(Python)

import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn import datasets from sklearn import preprocessing from sklearn.model_selection import train_test_split,GridSearchCV ...
分类: 其他 发布时间: 09-10 23:01 阅读次数: 0