这是Google的一个语音数据集
下载地址:
http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz
下载后得到文件 speech_commands_v0.01.tar.gz
解压并整理数据集:
mkdir train && mv speech_commands_v0.01.tar.gz train && cd train && tar -xzvf speech_commands_v0.01.tar.gz && mv speech_commands_v0.01.tar.gz ../ && rm -rf _background_noise_ && for d in `ls -l|grep ^d|awk '{print $9}'`; do mkdir -p ../val/$d; mkdir -p ../test/$d; done && for v in `cat validation_list.txt`; do mv $v ../val/$v; done && for t in `cat testing_list.txt`; do mv $t ../test/$t; done && rm -rf validation_list.txt testing_list.txt LICENSE README.md
训练集包含
51088 个 wav 音频文件
验证集包含
6798 个 wav 音频文件
测试集包含
6835 个 wav 音频文件