数学之美读后感

复杂与简单，技与术

《数学之美》最初是连载于Google黑板报上的一系列半科普半技术性质的博客，有Google的吴军博士撰写。文章通俗易懂、深入浅出。不仅用清晰的语言描述了一系列他平时接触到的“高端”技术(很多内容主题猛地一看有种神秘的感觉，但读完以后却让人恍然大悟：原来这不就是我以前知道的XXX么)，而且对这些技术背后的数学规律、思想来源做了剖析，让人读起来欲罢不能。通过此书，我相信对于“技”“术”一定能有更加深刻的理解。

在开始我的读后感前，让我先概括一下书中内容的整体思考。虽然不涉及具体的一些什么技术内容，不过在我看来，确是看此书的重要精髓。

1. 从宏观上看，每个成功的技术背后固然是受到了当时时代背景的需求，而反过来一个成功的技术又促进了时代的变迁与发展。但是，当我们把目光局限于一个具体的时间点，我们又会发现，某个技术的出现往往依赖于某个具体人物。为什么是他提出来的？成为一个领域的大师有其偶然性，但更有其必然性。其必然性就是大师们的思维方法。
这不仅仅是IT技术领域的特例，无论是量子物理的兴起，还是本朝太祖的出现，其背后的思维方法都是一个重要的因素。正所谓英雄造历史，不是没有原因的。

2. 思维方法是重要的，那么IT领域的思维方法是什么样的呢？www的发明人说过“简单性和模块化是软件工程的基石；分布式和容错性是互联网的生命”，这个就可以说是一种核心思想。而本书重点阐述的内容之一，就是“简单的就是好的”。而不仅局限于互联网，爱因斯坦说过，整个科学史就是把复杂自然现象归结为几个简单的概念的过程。很多时候，我们面对一个复杂问题时，我们是不是应该想想，整个问题能不能简单些？

3. 将思想收获运用于具体的问题上，这才是真正的收获。数学之美一书很大程度上涉及到的就是抽象的、一般人认为无用的数学。可是，正是这些数学工具才解决了我们生活中的种种难题。无论是思想，还是数学，将这种抽象的东西结合到具体的问题上，再从具体的问题解决上总结出一般的实现，这才是真正的提高。

好了，下面就让我们开始具体的读书笔记吧。

1. 数学，数学
此书名为数学之美，一看就明白，讲的主要内容就是数学。具体点说，就是各种数学知识在解决实际计算机领域问题中的应用。很多人往往觉得数学一点用的没有，然而，数学可以说在人类文明兴起的时刻就已经存在了。从远古的结绳计数到今天的信息时代，数学从没有一刻远离我们。

数学模型最重要的作用之一就是对客观事物的抽象概况。当数学模型和计算机相结合时，人类便有了将抽象事物再具体化的能力。

自然语言的处理，搜索内容的查找，主题相似的判定，信息的加密与解密，事物发展的结果预测...这些都与数学模型密不可分。

是的，数学让我们看到了计算机的另一个使用方面，不是单纯的打开网页浏览信息，不是单纯的敲打键盘记录笔记，而是让我们能与之一个冷冰冰的机器产生互动，尽管这种互动还有种种瑕疵，但并不能掩饰它对我们生活的巨大帮助。

2. 统计，复杂问题简单化与简单问题复杂化

本书讲述的内容很大程度上都与自然语言处理相关(当然了，作者就是搞这个出身的)，而其表达的主旨就是：最好的模型往往源于简单的思想。

还是拿自然语言处理来说，最初，研究者认为，自然语言应该是由一种规则化的方法来进行处理，就像人类理解语言的过程一样。通过主语、谓语、宾语等部分，将一句话分析成一个语法树。但是，因为客观原因(现实中句子的复杂性或词语的多义性等原因)，基于规则的自然语言理解很快就走进了死胡同，直到20世纪70年代还是相当失败的。文本信息的一句话，机器应该怎么理解呢？这真是个复杂的问题。

然而，统计语言学的出现使得这个复杂的问题以一种简单的方式得到了戏剧性的解决。什么是统计语言模型，我的理解就是计算一句话中词与词之间的概率。比如说“我是一个学生”这句话，“学”后面跟“生”的概率远远大于“个”后面更“学”的概率，所以，“学生”是一个词，而“个学”不是一个词。通过计算概率，就可以将整句话分解为“我”“是”“一个”“学生”，然后就可以进行语言翻译或语义理解等方面的处理。

方法虽然简单，但是却实用。一个复杂的问题，就这么通过概率就简单的解决了。嗯，果然，能解决问题的办法才是好办法吗。

这种通过简单思想解决复杂问题的例子在整本书中比比皆是。PageRank的网页排名结果与民主投票表决，关键词权重的确定，余弦定理与新闻分类，最大熵模型与数据预测，MapReduce与分工何种...种种数学模型的背后，往往只是一个很简单的想法，甚至当我们看到时，不禁会说，这不就是XXX么？是的，简单是简单，但是，能解决问题的办法就是好办法。

3. 解决问题与背后真相

上文中所说的基于统计的自然语言处理取得的很大的成功，也有了许多成熟的产品，甚至对我们的生活都有了息息相关的影响(你没有用过谷歌翻译么？)。但是，在这些问题解决的背后，我不禁要问，这是事物背后真正的原因么？

比如说这句话：
研表究明，汉字的序顺并不定一能影阅响读，比如当你看完这句话后，才发这现里的字全是都乱的。

如果按照一般的统计模型来说，仅考虑前后词关系的话，这句话肯定是读不通的。然而，我相信每个读到这句话的人却不会对这句话的意思有疑惑。

虽然我们可以通过扩大前后词搜索的范围来实现对语义的理解，但是，这真的是我们思维理解语义的过程么？解决问题的办法固然是重要的，但是，当我们把问题解决了以后，我们还是应该要考虑一下问题背后的真相。

固然，有效的方法通常都是简单的，但是，简单的方法却并不一定都是有效的。我希望更大程度上看到的是对于事物本质的发现，而非是对于问题解决的发明。

4. 最后，再谈数学与模型

嗯，通读本书，其实我们会发现，模型这个概念往往比数学更重要。数学更大程度上是实现模型的手段。

所以，当我们遇到问题时，我们不妨先想想，这个问题应该是一个怎么样的模型，应该是一个怎么样的关系。比如，好的网站应该有更多的链接进入，而好的网站的链出的网站应该也是好的，这就是一个简单优雅的模型。而它应该怎么实现呢，通过矩阵就是一种恰当的方式。所以说，在这个信息时代，与其说是数学之美，而不如说是思维散发出的魅力，人因思考而进步，因思考而伟大。

猜你喜欢