概率图模型学习（一）概述

本文内容根据Stanford 教授 Daphne Koller 的公开课 Probabilistic Graphical Model内容整理。

1.什么是概率图模型

概率图模型即为解决某一类应用问题的一个框架。在理解这个概念之前，首先来看两个例子：

1）

上面这张图片是一位医生在给一位病人看病，她可以根据病人的症状、各种化验的结果、诱发生病的原因等多方面，判断出病人可能患有的疾病，并给出多种治疗效果不同的治疗方案。

2）

这张牛的图片被分成来的若干个像素块，我们想要做的，是利用概率图模型对该图片进行处理，得到这些像素块所对应的是什么东西，是对应草、天空、牛还是马。

那么，这两个例子有什么共同点呢？首先，他们都有非常多的变量需要考虑，对医生而言，是症状、诱因等等，对那张图片而言，则是一个个的像素点。第二个共同点则在于答案的不确定性，无论是多么聪明的算法，都无法给出确定的答案。

在有了一个对概率图模型的大概感觉后，再深入一点，模型是什么，概率是什么，图又是什么？

2.模型的定义

其实我们大概都对这个词有一个模糊的概念，按我最初的理解，模型其实就是一类事物所共有的特征的体现，就像某种玩具的模型，他们所共有的特征就是外表相同，所以这个相同的外表就可以被做成一个模具，用以生产出成千上万个相同的玩具来，那么，Daphne Koller教授是如何定义这个词的呢？

原话是这样的：“The model is a declarative representation of our understanding of the world. So it is a representation within the computer that captures our understanding of what these variables are and how they interact with each other. And the facr that it's declarative means that the representation stands on its own, which means that we can look into it and make sense of it aside from any algorithm that we might choose to apply on.” 大概意思是“模型就是我们对世界认知的一个说明性的表达。是计算机中我们对各个变量的理解以及他们之间互相作用的表述。而模型的说明性在表示模型是独立存在的，我们可以在任何应用的算法之外对其进行研究并弄清楚其原理。”

那么，这很重要吗？是的，因为这表示同一个模型可以被用在算法中并且解答不同种类的问题，或者以一种更加高效的方式解答一个相同的问题。总而言之，模型的独立性有助于我们将其从人类的经验以及历史的数据中抽取出来，并且允许我们单独的处理问题。

3.概率的定义

同样，先放原文：“The word probabilistic is in there because these models are designed to help us deal with large amounts of uncertaninty.” 大概意思是指概率在这门课中是因为我们所设计的模型被用来解决大量不确定性问题。

概率出现的原因：我们只具有有限的知识、噪声的干扰、模型的局限性。

用途：概率模型的使用可以为我们提供解决问题的工具，包括强大的推理模式在内；同时结合概率论与统计学，我们可以有效地从历史数据建模，避免了需要人为指定手工制作模型的每个方面。

4.图形

为什么要加入图形呢？事实上，这个图形指的是图形化，其优点在于：

1.直观而紧凑的数据结构。

2.利用图形结构，提供了一套使用通用算法进行高效推断的方式。

3.能够用很少的参数表示高维的概率分布。参数的选择可以用手工也可以从数据中学习。

（此处借鉴https://blog.csdn.net/ycheng_sjtu/article/details/25865057博文中的内容，比我写的要好很多，推荐大家可以去看一看）

而对于图形模型，其主要包括两大类，分别是贝叶斯网络和马尔科夫网络。其中贝叶斯网络以有向图为表现形式，马尔科夫网络以无向图为表现形式。

概率图模型学习（一）概述

猜你喜欢