お使いのモデルが常に有用であることを保証するための計画時にAI

私たちは、温度について話しているとき、我々は、彼らが多くの情報を捨てたとは思いません。私は、彼らが説明するために、空気中の粒子の様々な位置と速度を列挙するためにどのように始まったのか、ホット外の誰かに言わせれば、私は離れて行きますよ。

現実には、人間として、私たちは「十分な情報を提供する」との違いを理解する生得的能力持っている、ということである「便利なの。」私たちは、外の熱い人々に伝えるないだろうが、それは38.94度摂氏の温度で言わないだろう、そうどちらも厄介な問題を説明することができます。この要約情報および削除の動作予測可能な性質である、この記事では、私は、メジャーを定義する方法について説明(概算)と予測モデルと人工知能を向上させるために、このプロセスを使用します(ならびにそのような問題に天候を予測します正解)。

お使いのモデルが常に有用であることを保証するための計画時にAI

図1

ボルツマンエントロピーの1の理解


の良い理論よりも実用的なものは何もありません。


                                                                                                             - ルートヴィッヒ・ボルツマン

 あなたはエントロピーの概念に精通している場合、あなたはおそらくすでに(例えば熱力学的エントロピー、情報エントロピーなど)二つのシステムの一つの定義を知っています。そうでなければ、他の人がそれは対策の「ランダム」の一種であることを教えてくれます(定義されたランダム性は、別のトピックです)。(雷鋒ネットワーク  (パブリック数:雷鋒ネットワーク)

私は、異なるコンテキストで(私は通常、「ランダム」措置と呼ばれる反対するが)彼らは、多かれ少なかれ役立つ、すべてのこれらの定義が詳細に記載されている、エントロピーの多くの定義があると思います。私のお気に入りの定義の一つは、最初に現在一般ボルツマンエントロピーまたはエントロピーボルツマン方程式と呼ばれ、ルートヴィッヒ・ボルツマン(ルートヴィッヒ・ボルツマン)の天才で1875の周りで提案されました。

ボルツマンは、それが直接エントロピー及びミクロ及びマクロステート状態との間の関係に関連している、と思います。マクロ任意の所与のシステムの説明のために、より多くのマイクロステートの記載と組み合わせた場合、より高いエントロピーであろう。この理論が最初にガス容器の一例を説明するために提案された場合には、このような状況では、その意味を理解することが容易になるだろう。

お使いのモデルが常に有用であることを保証するための計画時にAI

 図2:増加したエントロピーの概要、および作成の方向性

在左侧,这个系统的微观状态被定义为:容器中所有气体粒子的速度、质量和位置(这是非常具体的描述)。相反,在右侧,将微观状态概括为温度,就产生了一种可能的宏观状态(这个描述就不那么具体了)。在宏观状态下有一些非常有趣的特性:它是不可逆的(你不能只根据温度这一个条件就对所有粒子进行完全描述);它不那么复杂(信息少所以得到的结论也少);但它仍然是准确的(容器真的是38.94摄氏度);最重要的是,它不太具体(不止一个微观状态适合它)。

 お使いのモデルが常に有用であることを保証するための計画時にAI

图3:给定的宏观状态将具有多个与其兼容的微观状态。

这就是玻尔兹曼熵的关键:每个宏观状态都有许多与之兼容的微观状态。定义温度的方式意味着显示在左侧(上图所示)的三个容器中的任何一个都会产生相同的温度。这种微观状态越多,熵就越大:“这个容器的温度为38.94°C”。

尽管温度这个条件很普遍,但它并不是玻尔兹曼熵唯一适用的方面。任何人与人之间的对话中都包含高熵语句,人们会仔细选择具有描述性的语句,同时也不会太过具体。例如,我可以将这篇文章的缩略图描述为“一副内容是蒙娜丽莎的剪贴画,可以重复使用”(它确实是这样的)。但是,假若你还没有看到这个特定的图像,那么这些微观状态中的任何一项都可能同样适合该宏观状态:

 お使いのモデルが常に有用であることを保証するための計画時にAI

图4:所有这些都可以对应“一副内容是蒙娜丽莎的剪贴画,可以重复使用”。

经过这个例子的说明,很明显可以看到,熵可以出现在意想不到的地方,但到目前为止,我们还没有采取任何措施将其与AI或预测联系起来。在此之前,我们先来聊聊地图。

2.地图中存在的问题

 

“以猫为例,猫最好的物质模型是另一只猫,或者说最好是一只完全相同的猫。”

 

- Norbert Wiener,科学哲学(1945 )

我们来做一个小小的思考实验。 想象一下,我问你去多伦多那个奇怪的新加菲猫主题披萨店的路线,但我们俩都没有手机,我只有纸和笔。如果你知道怎么走,那你可能不会犹豫,你画出来的地图看起来会像是这样:

お使いのモデルが常に有用であることを保証するための計画時にAI

 图5

对我们俩来说不好的一点的是,我很容易被搞糊涂。我必须继续询问:“北是哪边?”

你只能郁闷的叹口气并继续补充

お使いのモデルが常に有用であることを保証するための計画時にAI

 图6:我想这些已经画的已经够多得了

你可能已经能看出来这是什么意思了,但我还在要求更为详细的说明。直到最后,你的地图看起来很可能会像这样:  

お使いのモデルが常に有用であることを保証するための計画時にAI图7:这是真正的餐厅

你为了让我了解清楚儿增加了很多的细节,但其实其中的绝大部分都是毫无意义的,地图的意图是引导我去吃美味的千层面披萨。事实上,如果我们继续这样下去,我们最终会意识到,一份最准确、最具描述性、最完整的觅食地图其实就是整个地区的一比一复制品,餐厅里面也坐满了急急忙忙吃东西顾不上说话的人。如果你要靠地图来导航,那地图里的信息需要比真实地区的信息少一些。如果这张地图和这个地方本身的熵值是一样的,那么对我来说没有任何帮助。

模型的实用价值介于完整的描述和抽象的草图之间。如果你不相信我,只需看看多伦多市的地图和多伦多的地铁图上显示的内容有什么不同:

お使いのモデルが常に有用であることを保証するための計画時にAI

图8:来自MapTO分析的地图 http://www.mapto.ca/maps/2017/5/9/the-newest-ttc-map-is-distorted

如果把地图上显示的路线做一些扭曲,把一些路线多重叠交叉了那么几次(改变了拓扑结构),那么它就不再是一个有用的工具了。然而,以正确的方式扭曲它,忽视关于尺度和距离的信息,地图将会变得更加有用,可以快速了解在下车前剩下多少站点。在对系统进行建模时,它应该包含尽可能少的细节,以便能最大限度的达到预期目的。

[我强烈建议你在Twitter上使用@mapTOdotca,如果你想要了解地图的话]

3.天气的状况


预测是困难的。尤其是关于未来的预测

 

-Niels Bohr

你对明天的天气做出的最准确的预测是什么?当那个重要的日子(明天)来临的时候,什么样的预测最有可能实现。

  • 天气晴朗,最高温度27°C,最低温度18°C,伴随涨潮和海洋变暖

  • 下午2时至4时将有2mm的降水。

  • 气温会比昨天有所上升

  • 以上全部

当然,这个问题的答案取决于你对天气的了解,以及随着时间的推移天气它会如何发挥作用,但如果你没有任何预测天气的能力,你最好的选择是选项#3,即气温会比昨天有所上升。与其他预测相比,这一预测具有很高的熵。会有许多天气的微状态与“气温比昨天有所上升”这个预测相兼容。

如果你尝试预测天气,并不一定需要低熵预测。如果你在考虑是否应该带雨伞去上班,你只需要知道今天是否会下雨。如果你在耕作,你可能需要更少的熵:那里的总降雨量是多少?

在所有这些不同的天气预测例子中,有一点是不变的,预测总是需要比用于生成预测和/或模型的高度详细的数据具有更多的熵。

4.总结谬误


 混乱是一条阶梯


 - Littlefinger

每当我开始建模的时候,我首先花一些时间尝试把我的问题都按照详细程度在一个上从下到上列出来。我这么做的原因是为了避免陷入总结谬误:相信你做出的有用的预测的熵和你的数据的熵在同一水平上。要避免这个谬误只需要一条规则,它不困难,但是很有用:总是向的上方做预测。始终在比用于生成预测的数据更高的熵水平上进行预测。

お使いのモデルが常に有用であることを保証するための計画時にAI

图9

现在,在我自己的日常生活中,这通常与预测小分子药物和蛋白质之间的相互作用有关。如果我说来自高分辨率晶体结构的详细结构数据是我在1级的输入数据,那么我可以用它来构建能够预测更高层次的东西的模型。这些信息非常详细,它描述了蛋白质和药物相互作用时所有原子的位置。

 お使いのモデルが常に有用であることを保証するための計画時にAI

图10:如此美丽的低熵蛋白质和药物结构,药物结构用粉红色来表示。

我预测的内容比较少,例如:小分子药物X与蛋白X相互作用吗?这类似于使用关于粒子的详细信息来了解温度与容器处于“热”或“不热”之间的关系。这样,在未来,如果我给我的模型设定一个温度,它将预测“热”。在这种情况下,我的模型只是预测“是的,这种药物会以某种方式与这种蛋白质相互作用。”如果我想设计一种更好的药物,这个二元预测对我来说仍然是有用的,但它还不够详细,无法重建特定的原子用以预测交互的细节。如果我的模型那么做了,那我是不会相信的。一般来说,你只应该爬上,而不是再次退下来进行预测。这就是总结谬误。

5.最終的な考え

 

 「すべてのモデルが間違っているが、一部は便利です。」

 

- ジョージ・ボックス 

あなたが私に似ている場合は、あなたが自分自身のモデルを検討し、または試してみて、他の人のモデルを理解するために多くの時間を費やし、その後、私はあなたが有益な何かを見つける願っています。最も重要なことは、人工知能と機械の学習の現在の誇大広告は、人工知能はまだ制限があっても、それを覚えておくことです。理解し、これらの制限を尊重し、逆に、あなたを妨げない、それはあなたが本当に重要な事柄に焦点を当てます:あなたに役立つでしょうか?(雷鋒ネットワーク)

ところで、シンプルで小さな天気予報を行うことを忘れないでください。

鄭州不妊病院ます。http://www.xbzztj.com/


オリジナルリンクします。https://towardsdatascience.com/when-is-ai-trustworthy-when-is-ai-useful-215aaee24a6f

参考資料:「exformation」のと呼ばれるグループを定義(//www.penguinrandomhouse.com/books/330619/the-user-illusion-by-tor-norretranders/9780140230123:httpsの記事リンク)TorのNørretrandersによって、ユーザーイリュージョンコンセプト。

https://wenku.baidu.com/view/6bb581fdae45b307e87101f69e3143323868f5eb


おすすめ

転載: blog.51cto.com/14510351/2438354