Linux 使用 pocketsphinx 做中文语音识别 - 代码天地

Linux 使用 pocketsphinx 做中文语音识别

编程语言 2019-01-02 09:00:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/kongxx/article/details/85595517

前一篇博客说了一下怎么在 Windows 平台使用 pocketsphinx 做中文语音识别，今天看看在 Linux 上怎办实现。

由于 pocketsphinx 没有提供 Linux 的二进制包，因此我们需要自己根据源码编译。

下载

从下面地址下载源代码

https://sourceforge.net/projects/cmusphinx/files/

这里，我使用的是 sphinxbase-5prealpha.tar.gz 和 pocketsphinx-5prealpha.tar.gz。

编译

编译 sphinxbase

tar zxvf sphinxbase-5prealpha.tar.gz
mv sphinxbase-5prealpha sphinxbase
cd sphinxbase
./configure
make
sudo make install

编译 pocketsphinx

tar zxvf pocketsphinx-5prealpha.tar.gz
cd pocketsphinx-5prealpha
./configure
make clean all
sudo make install

下载模型文件

模型文件下载地址

https://sourceforge.net/projects/cmusphinx/files/Acoustic and Language Models/
其中 Mandarin 为中文普通话，下载之后我们可以看到

声学模型：zh_broadcastnews_16k_ptm256_8000.tar.bz2 （需要解压）
语言模型：zh_broadcastnews_64000_utf8.DMP
拼音字典：zh_broadcastnews_utf8.dic

测试中文语音识别

首先准备一个中文音频文件（要求：.wav 格式，采样频率 16000HZ，单声道）
将下载的中文模型文件和解压后的 pocketsphinx 目录放到同一个目录下，这里假定就叫 “test”。
进入“test”目录，然后运行下面的命令

pocketsphinx\bin\Release\x64\pocketsphinx_continuous.exe -hmm zh_broadcastnews_ptm256_8000 -lm zh_broadcastnews_64000_utf8.DMP -dict zh_broadcastnews_utf8.dic -infile myfile-16000.wav > myfile.txt

运行完毕后，查看 myfile.txt 文件，内容即是程序识别出来的中文。

猜你喜欢

转载自blog.csdn.net/kongxx/article/details/85595517

Linux 使用 pocketsphinx 做中文语音识别

Windows 使用 pocketsphinx 做中文语音识别

使用 pocketsphinx 做中文语音识别时报错 ERROR: Input audio file has sample rate [44100], but decoder expects [160

PocketSphinx语音识别系统的编译、安装和使用

PocketSphinx For Android离线语音识别

Linux下安装PocketSphinx

Android应用离线中文语音识别PocketSphinx （免费哦~）

Android下PocketSphinx的离线语音识别

开源PocketSphinx语音识别系统

本地语音识别开源软件pocketsphinx调试总结

Android PocketSphinx离线语音识别集成总结

【转】Android本地语音识别引擎PocketSphinx-语言建模 Android本地语音识别引擎PocketSphinx-语言建模

树莓派3b+指南（十六）安装使用pocketsphinx

window下安装CMUSphinx实现语音识别(python+SpeechRecognition+PocketSphinx)

如何快速的将离线语音识别PocketSphinx集成到自己的项目中

莫愁前路无网络，离线语音正待君——Pocketsphinx篇

pocketsphinx android .so

mac安装pocketsphinx-python出现错误

windows下使用Microsoft Speech SDK开发包做语音识别

6款支持中文语音识别开源软件的简单使用

python使用VOSK实现离线语音识别（中文普通话）

linux使用iptable做网关

Unity语音识别[GVoiceSDK的使用]

语音识别-SRILM安装与使用

使用SpeechRecognition进行语音识别

使用python实现语音识别

OpenAI Whisper 语音识别 API 模型使用 | python 语音识别

zedboard adau1761—pocketsphinx库移植至zedboard（六）

Kaldi学习笔记（五）——使用CVTE训练好的SR模型做中文在线识别

中文语音识别

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)