Google Commands数据集

这是Google的一个语音数据集

下载地址:

http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz

下载后得到文件 speech_commands_v0.01.tar.gz

解压并整理数据集:

mkdir train && mv speech_commands_v0.01.tar.gz train && cd train && tar -xzvf speech_commands_v0.01.tar.gz && mv speech_commands_v0.01.tar.gz ../ && rm -rf _background_noise_ && for d in `ls -l|grep ^d|awk '{print $9}'`; do mkdir -p ../val/$d; mkdir -p ../test/$d; done && for v in `cat validation_list.txt`; do mv $v ../val/$v; done && for t in `cat testing_list.txt`; do mv $t ../test/$t; done && rm -rf validation_list.txt testing_list.txt LICENSE README.md

训练集包含

51088 个 wav 音频文件

验证集包含

6798 个 wav 音频文件

测试集包含

6835 个 wav 音频文件

猜你喜欢

转载自www.cnblogs.com/luruiyuan/p/12421243.html