MMML-CMU 学习笔记_No.1.2 Multimodal applications and datasets - 代码天地

MMML-CMU 学习笔记_No.1.2 Multimodal applications and datasets

企业开发 2023-04-08 01:26:05 阅读次数: 0

从上世纪80年代开始，对多模态的认知与发展已经慢慢从心理学上的“behavioral”阶段进入到“computational”阶段，最先提出 Audio-visual speech recognition（音视频语音识别）。紧接着由于YouTube等网站视频量的井喷式增长，希望开发基于关键字或者视频内容的搜索（工业推动学术），Content-based video retrieval（基于视频内容检索），Video event recogntion（视频事件识别）等也迎来了蓬勃发展。后来开始关注通过视频或语音探索人类的情绪，导致涌现了一大批 Affect and emotion recognition 情绪情感识别，Multimodal sentiment analysis 多模态情绪分析等工作。再到最近5-10年，有关视觉-语音，视频字幕，多模态导航等新应用层出不穷，多模态领域的研究蒸蒸日上。

多模态相关工作及数据集可以看：ppt：multimodal research tasks and datasets

猜你喜欢

转载自blog.csdn.net/like_jmo/article/details/127646581

MMML-CMU 学习笔记_No.1.2 Multimodal applications and datasets

MMML-CMU 学习笔记_No.1 Multimodal Introduction

Datasets

HuggingFace学习笔记--datasets的使用

resilient distributed datasets 读后笔记

geopandas 笔记： datasets 数据集

Vector Commitments and their Applications学习笔记

Proofs for Inner Pairing Products and Applications 学习笔记

Multimodal Machine Learning:A Survey and Taxonomy 综述阅读笔记

SMA :Structured Multimodal Attentions for TextVQA --- 论文阅读笔记

【论文笔记】多模态融合（Multimodal Fusion）

MultiModal Machine Learning 笔记_No.0 课程介绍

Spark-SQL学习笔记(1) - Datasets and DataFrames

Multimodal Machine Learning: A Survey and Taxonomy/多模态机器学习综述

Incomplete Multimodal Learning（不完整多模态学习）

Multimodal Transport

Designing Data-Intensive Applications笔记

Design Data Intensive Applications 笔记 (数据分片)

Design Data Intensive Applications 笔记 (复制)

TensorFlow.org教程笔记(二) DataSets 快速入门

【论文笔记】Evaluation of Hierarchical Clustering Algorithms for Document Datasets

论文笔记：Collaborative Filtering for Implicit Feedback Datasets

Faster R-CNN代码学习（一）——datasets模块

深度学习-如何下载以及导入Datasets数据集

【深度学习】datasets.ImageFolder 使用方法

Simple Schnorr Multi-Signatures with Applications to Bitcoin 学习笔记

Updateable Inner Product Argument with Logarithmic Verifier and Applications 学习笔记

Vector Commitment Techniques and Applications to Verifiable Decentralized Storage学习笔记

Witness Encryption for Succinct Functional Commitments and Applications学习笔记

TensorFlow Datasets

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)