代码天地

语音识别中HMM-GMM的训练过程

本篇将直接分享我在学习传统声学模型：HMM-GMM 的过程中，遇到一些的困惑，和自己的理解。也希望在学习这个模型过程中，遇到同样困惑的同学能够作为参考。开整。困惑：语音标注文件以词级为单位，没有标注到每一帧，是怎么训练的？问题描述：我们观察语音识别的标注文件，就会发现往往是词级别的标注或者句子级别的标注。而我们的HMM-GMM模型三个状态构成...

分类: 其他发布时间: 09-10 23:07 阅读次数: 0

kaldi基于GMM的单音素模型训练部分

1. gmm-init-mono 2. compile-train-graghs 3. align-equal-compiled 4. gmm-acc-stats-ali 5. gmm-sum-accs 6. gmm-est 7.train_mono.sh脚本详解资料来自kaldi官方文档。转载注明出处。 1. gmm-init-mono gmm-i...

分类: 其他发布时间: 09-10 23:06 阅读次数: 0

kaldi学习一脚本流学习工具使用

先给出整体脚本如下：分块详解 kaldi中脚本东西比较多，一层嵌一层，不易阅读。本文以yesno为例，直接使用kaldi编译的工具，书写简易进行训练，方便学习kaldi工具的使用。注意：转载请注明出处。先给出整体脚本如下： #!/bin/bash . ./path # feature extraction: # a series of l...

分类: 其他发布时间: 09-10 23:06 阅读次数: 0

DNN在线解码 aishell为例

在kaldi 的工具集里有好几个程序可以用于在线识别。这些程序都位在src/onlinebin文件夹里，他们是由src/online文件夹里的文件编译而成(你现在可以用make ext 命令进行编译)。这些程序大多还需要tools文件夹中的portaudio 库文件支持，portaudio 库文件可以使用tools文件夹中的相应脚本文件下载安装。注：online官方不再维护，新版本为on...

分类: 其他发布时间: 09-10 23:05 阅读次数: 0

kaldi - Online Audio Server（服务器客户端建立方法-旧版在线解码）

Example Usage Command line to start the server: online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000 --beam=72.0 --acoustic-scale=0.0769 final.mdl graph/HCLG.fs...

分类: 其他发布时间: 09-10 23:05 阅读次数: 0

kaldi 模型训练工具整理

acc-tree-stats cluster-phones compile-questions build-tree gmm-init-model gmm-init-mono gmm-mixup convert-ali compile-train-graphs acc-tree-stats Accumulate statistics for phonetic-conte...

分类: 其他发布时间: 09-10 23:05 阅读次数: 0

使用深度学习来破解 captcha 验证码

使用深度学习来破解 captcha 验证码 ...

分类: 其他发布时间: 09-10 23:04 阅读次数: 0

kaldi HMM-GMM全部训练脚本分解

train_mono.sh train_deltas.sh train_lda_mllt.sh train_mono.sh 单音素训练脚本： //初始化，[topo feats] -&amp;amp;amp;gt; [0.mdl tree] gmm-init-mono //生成训练图，[0.mdl text l.fst] -&amp;amp;amp;gt; [train.fst] compile-train-graph...

分类: 其他发布时间: 09-10 23:04 阅读次数: 0

深度学习知识树

深度学习知识树，别处传过来，用于自己知识整理。

分类: 其他发布时间: 09-10 23:04 阅读次数: 0

基于CTC的语音识别系统训练

最小语音识别模型模型训练后续最小语音识别模型输入音频特征向量，共计26维的mfcc特征向量为了使神经网络能够统一格式，将[batch_size, time_step, 26]中的time_step定为一个较大的值，如果实际时长不足，采用补零的方法补齐输出输出为一个[batch_size, words_length]的张量，方便训练将word_len...

分类: 其他发布时间: 09-10 23:04 阅读次数: 0

aishell数据处理为thchs30格式

aishell数据格式对于用神经网络处理数据的同学来说比较不友善，因为他只有文字转录和音素级别的转录，并没有拼音的转录。 aishell数据转换格式 aishell数据转化方法 aishell数据转换格式废话不多说，转化后数据格式和thchs相同，如下： thchs30 train.syllable.txt: A11_0 lv4 shi4 yang2 ch...

分类: 其他发布时间: 09-10 23:03 阅读次数: 0

训练CNN+CTC网络的时候报错：sequence_length(0)

我在使用keras 训练CNN+CTC网络的时候报错： sequence_length(0) &amp;lt;= X 出现该问题的原因是网络的宽度发生了变化，而ctc层的定义： def ctc_lambda(args): labels, y_pred, input_length, label_length = args y_pred = y_pred[:, :, :] ...

分类: 其他发布时间: 09-10 23:03 阅读次数: 0

论文参考文献格式说明

(一)期刊类 [序号] 作者. 文章名[J].期刊名,出版年份,卷号(期号):起始页码-终止页码 (二)学位论文 [序号] 作者. 文章名[D].出版地,保存单位,出版年份:起始页码-终止页码参考文献类型 J - 期刊 D - 学位论文 N - 报纸 M - 专著 R - 报告 C - 论文...

分类: 其他发布时间: 09-10 23:02 阅读次数: 0

EEMD-GA-BPNN

data = csvread('D:\demo\dataset\train_passenger_volume.csv'); %EEMD(集成经验模态分解):eemd(ts,高斯白噪声标准差[0.01-0.4],噪声次数[50|100]) imfs = eemd(data,0.01,50); %第一列(原时间序列) | 其余列(分解的IMF) %构造输入向量与输出向量 sample =...

分类: 其他发布时间: 09-10 23:02 阅读次数: 0

EEMD-PSO-BPNN

分类: 其他发布时间: 09-10 23:02 阅读次数: 0

数学编辑器-MathType

软件下载地址：http://wm.makeding.com/iclk/?zoneid=1728&amp;uid=1428 (6.9b版) 注册码：MTWE691-Sel524-937la MTWE691-011076-szwud MTWE691-011352-2nmj7 MTWE691-011524-947...

分类: 其他发布时间: 09-10 23:02 阅读次数: 0

经验模态分解EMD（Python）

EMD(Python)使用手册 (一)下载EMD模块下载python模块pyhht，可实现经验模态分解功能 (二)序列分解 import numpy as np import pandas as pd from sklearn import datasets import matplotlib.pyplot as plt from pyhht.emd import EMD from py...

分类: 其他发布时间: 09-10 23:01 阅读次数: 0

ARIMA时间序列分析(Python)

import pandas as pd import numpy as np import matplotlib.pyplot as plt #ADF单位根检验 from statsmodels.tsa.stattools import adfuller #序列分解(季节+趋势+残差) from statsmodels.tsa.seasonal import seasonal_decompose ...

分类: 其他发布时间: 09-10 23:01 阅读次数: 0

knn_classification_model(Python)

import numpy as np import pandas as pd from sklearn import datasets #数据预处理 from sklearn import preprocessing #划分数据集/网格搜索参数 from sklearn.model_selection import train_test_split,GridSearchCV #特征选择 from ...

分类: 其他发布时间: 09-10 23:01 阅读次数: 0

knn_regression_model(Python)

import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn import datasets from sklearn import preprocessing from sklearn.model_selection import train_test_split,GridSearchCV ...

分类: 其他发布时间: 09-10 23:01 阅读次数: 0

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

ORACLE 跟踪文件详细解释

20190924-LeetCode解数独题目分享

分治法实例-找下标，下标与对应值相等

安全测试学习笔记

JavaScript笔记：原型和原型链

在Linux中检查可用内存的5种方法

BUAA_OO_JML

mongodb创建用户、备份、恢复等

生活20190602

使用MoveIt!配置软件包在RViz中进行机器人运动规划

每日归档

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

语音识别中HMM-GMM的训练过程

kaldi基于GMM的单音素模型 训练部分

kaldi学习 一脚本流学习工具使用

DNN在线解码 aishell为例

kaldi - Online Audio Server（服务器客户端建立方法-旧版在线解码）

kaldi 模型训练工具整理

使用深度学习来破解 captcha 验证码

kaldi HMM-GMM全部训练脚本分解

深度学习知识树

基于CTC的语音识别系统训练

aishell数据处理为thchs30格式

训练CNN+CTC网络的时候报错：sequence_length(0)

论文参考文献格式说明

EEMD-GA-BPNN

EEMD-PSO-BPNN

数学编辑器-MathType

经验模态分解EMD（Python）

ARIMA时间序列分析(Python)

knn_classification_model(Python)

knn_regression_model(Python)

kaldi基于GMM的单音素模型训练部分

kaldi学习一脚本流学习工具使用