本周6看了CCF-AI走进高校系列报告，在看天津大学张长青副教授做多视图学习报告时。在提问环节，其中有一个有意思的问题。多视图与多模态有什么区别？传统的机器学习一般而言基于单视图建模分析，也有学者称多视图为多模态。下面说一下笔者自己的理解，仅当了解，无论对错。

先看一下大佬的回答：

这个问题是深圳大学王熙照教授提出的。王老师以一个深圳大学博士生毕业生答案进行侧面回答：多个传感器获取到的数据是多模态，而单个传感器在不同位置获取到的数据是多视图的。

张老师的回答：多视图包含多模态，多视图更接近机器学习，更抽象。多模态更接近于应用，与实际的某一个应用结合。

自己理解：

一般而言，它们之间是没有很大的区别，在很多地方都可以互换，如多视图多聚类，多视图多示例多标记学习或者多模态多示例多标记学习。如果要争一个高低，我更偏向于张老师这边答案，但和而不同。

最近在调研表示学习，我从这个角度解释二者区别，大家理解起来可能会更深入一点。在表示学习中，Graph embeding 和Network embeding （既图嵌入和网络嵌入）很多时候也被大家所混用，正如多视图与多模态。思考一个问题，为什么在学习计算机专业课程《数据结构》时，介绍了Graph结构而没有network结构？因为Graph是对实际的抽象，是一种抽象。而我们在谈网络时，一般都会说XX网络，如社交网络，引文网络等等。然后用图这种抽象结构或者说技术对实际的网络进行建模分析。

接着说Graph embeding 和Network embeding 的区别。Graph embeding目的在于降维，学习到的低维嵌入能够重构，既恢复到原来的’数据形式‘。而Network embeding要求不仅能重构，还能做一些推断任务，如节点分类，链接预测，社区发现等等。

那么如何运用Graph embeding 和Network embeding的思维分析多视图与多模态的区别呢？多视图更偏向于‘数据结构’，既更抽象，更方便建模分析，既面向数据结构，是一种机器学习范式。而多模态更偏向于解决方案，实际应用，既面向求解，是一种具体的求解方案。

上述仅为一家之言，如有理解不当地方，多多包含（图侵，联系删）。

多视图与多模态之争

先看一下大佬的回答：

自己理解：

猜你喜欢