TF_Lite 音频分类入门

企业开发 2022-08-07 19:14:00 阅读次数: 0

1. 准备工作

请添加图片描述

实现效果：

请添加图片描述
整体流程：

请添加图片描述

1. 获取模型

获取训练好的模型：通过从Tensorflow Hub （https://tfhub.dev/）上获取训练好的模型，
自定义模型：适用于自己任务的分类模型。

1.2 yamnet 网络模型

其中 yamnet 网络模型，包含两种：
一种是 float32 , 另外一种是 int8；
请添加图片描述

量化部分请添加图片描述

1.3 YAMNet 音频识别的种类

请添加图片描述

1.4 yamNet 工作流程

声音信号，经过采样。对音频转化为频谱图；
请添加图片描述

2. 模型加载到Android- 工程中：

在这里插入图片描述

导入模型
模型使用指引

请添加图片描述

训练模型的参数规则

请添加图片描述

使用模型

请添加图片描述

3. 音频的录制与导入

3.1. 录制音频

请添加图片描述

3.2. 设置音频的采样率与通道数

请添加图片描述

3.3. metadata, 模型的规格设置

附加在Lite 模型上的一组与推演过程本身无关的的描述信息。
包括以下几种：

模型支持的输入类型
模型支持的输出类型
模型附加的文件
数据归一化参数
模型量化参数

3.4 音频的基础参数

请添加图片描述

3.5 录制音频的方法调用

请添加图片描述

3.6 模型推理

每间隔 500 个时间单位推理一次；

请添加图片描述

3.7 显示结果

请添加图片描述

3.8 小结

在TensorFlow Hub 中查找模型
在 Android 工程中加载模型
使用模型处理 Android 的输入与输出

4. 自定义的模型分类

本节主要介绍：
01 如何自定义音频分类模型
02 如何在 Android 工程中加载自定义模型

4.1 迁移学习

使用原始模型，更改最后网络的输出；

请添加图片描述

4.2 YamNet 模型的输入与输出

请添加图片描述

4.3 Model_maker 的调用

请添加图片描述

4.4 音频的分帧

请添加图片描述

4.5 数据集设置

请添加图片描述

请添加图片描述

4.6 Model Maker 的调用步骤

请添加图片描述

4.7 使用模型

请添加图片描述

4.8 结果分析

工作流程，

通过 YamNet 先判断输入的音频是何种大类类的音频；
在确定属于该大类的情况下，将特征再次输入到自定义的另一个模型该大类下，细分出多个小类；

请添加图片描述

代码分析
请添加图片描述

5. 性能的优化

5.1 获取更多的数据集

请添加图片描述

5.2 使用更优解的模型

请添加图片描述

5.3 自定义数据集的录制规格

以下规格，适配于yamNet 模型，从而使得该模型发挥的更好

请添加图片描述

6. 参考资料

6.1

请添加图片描述

音频的分类，分两步走:
先进行二分类的任务，
比如先通过二分类，先判断是否为该大类A，
然后，再通过在该大类下，对音频的进行细分各个小类；

请添加图片描述

猜你喜欢

转载自blog.csdn.net/chumingqian/article/details/125655612

TF_Lite 音频分类入门

tf_lite的配置

【TF Lite】First Example of Tensorflow Lite

【TF lite】从tensorflow模型训练到lite模型移植

TensorFlow Lite入门

TensorFlow 模型固化及生成TF Lite模型

Tensorflow Lite从入门到精通

原始音频的情感分类

tf.keras--入门示例:Lenet手写字符分类

简单粗暴的Tensoflow框架从入门到精通（六）：tf.estimator使用入门、案例：使用美国普查数据分类

【免费教学】Tensorflow Lite极简入门

使用TensorFlow Lite在Android手机上实现图像分类

基于Paddle Lite在Android手机上实现图像分类

Android TensorFlow Lite 初探数字分类器(JAVA DEMO)

基于Tensorflow Lite的CIFAR10图像分类模型部署

音频相关知识入门

空间音频技术入门

推出 TF Lite Task Library 接口，简化 ML移动端开发流程

在Cadence音频数字信号处理器上加速TensorFlow Lite Micro

从视频到音频：使用VIT进行音频分类

音频系统项目与音频算法研究方向分类

TensorFlow入门：tf基本函数

TF-IDF入门与实例

Python--音频文件分类代码

基于音频分类的视频内容推荐

Keras深度学习实战——音频分类

tf.kerasr入门示例:Lenet手写字符分类(2扩展) eager模式下Sequence生成器方式加载数据并训练

音频可视化入门

ALSA 音频 API 使用入门

TensorFlow入门：tf.InteractiveSession()与tf.Session()区别

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)