原文链接 : Combining Probabilities
译者 : Elon Lin (ArrowLLL)
原文及其翻译下载 :联合概率原文及其翻译
现在有两个预言家 Mr.Smith 和 Mr.Jone。对于一个事件 X ,现在给出这两个预言家的预言 :
- Mr.Smith 预言它 不会发生,并且他预测正确的概率是 75%, 那么在他预言的基础上 X 事件 会发生的概率就是 0.25。
- 另一方面, Mr.Jone 预言的正确率是 60%, 而他却说 X 这个事件会发生。
在他们两个人预言的基础上,对于这个事件 X, 它会发生的概率是多少呢?
从数学角度上来说,上述情景有 3 个变量。
- S – 表示 Mr.Smith 的预测
- J – 表示 Mr.Jone 的预测
- R – 表示 最终的结果
然后我们用 ‘y’ 和 ‘n’ 来表示 X 这个事件分别代表发生和未发生。
这会有以下八种情况和它们相应的概率 :
S | J | R | probability |
---|---|---|---|
n | n | n |
|
n | n | y |
|
n | y | n |
|
n | y | y |
|
y | n | n |
|
y | n | y |
|
y | y | n |
|
y | y | y |
|
其中
另外, 由于
同时,由于
我们的目的是要在以上分析的基础上和
这是一个只包含三个等式的四元一次方程组(还有一个约束条件是所有的概率都在0到1的范围内)。显然它有无穷多个解。例如,我们取
虽然我们在现实生活中面对的问题一般(或者说总是?)都是不明确的, 但我们仍然要做出决策。那么我们是否可以在缺乏大量信息的情况下做出一些“合理的”假设,来得到一些“合理的”结果呢?是否存在一种方法可以估计出 J 和 S 正确率之间的相关性大小? 例如, 也许因为 S 比 J 更聪明, 我们可以假定当 J 预言正确时, S 的预言也是正确的; 即使在有些试验当中 J 是不正确的, 此时 S 也是正确的。这意味着
另一种方法是假设 S 和 J 的预言是相互独立的,这就意味着他们自己预言的正确性不会因为对方预言的正确与否而改变。而这个假设可以推导出:
和
令
但这些式子仍然不能唯一确定
由以上可知,如果假设 S 和 J 不相关并且假设 “y”和”n” 具有对称性,当 S[75%] 预言 X 不会发生且 J[60%] 预言 X 会发生时, 事件 X 发生的概率是 33.3%。S 和 J 的任何(正)相关性都会降低这个概率。
注意,当我们假设”y”和”n”具有对称性时我们计算出的 X 发生的概率并不等于它的先验概率
在这个基础上 X事件发生的概率是
一般情况下如果我们对于X事件的先验概率没有任何信息,那么我们可以假设
对于稍微复杂的情况。比如 Mr.Red 正确识别一个二类试验(True/False)的概率是 75%,Mr.Green是60% 而 Mr.Blue 是 55%。如果 Mr.Buue, Mr.Green 和 Mr.Red 一致觉得试验的结果是 True 。那么结果是 ‘True’ 的概率仍然是 75% 还是会落在 55% 到 75% 之间呢?
这个情况仍然是不确定的,但是如果我们仍然引入假设
- 两两之间相互独立
- “y” 和 “n” 具有对称性
不失一般性的,在有 N 个预言者的情况下,这两个假设条件已经足够确定出唯一的答案了。也就是说,如果这 N 个人在”True/False”二类试验中预言结果为”True”的概率分别是
由此可得, 上面描述的样例中,
令
并且令 F(Q) 代表
用一个更显然(但是等价)的方式也可以表达这些关系 :
在给定的假设条件下,这个结果是正确的。但就像之前讨论过的,了解这些问题更重要的是要意识到他们本身其实是不明确并且没有一个标准答案的。例如,如果对于输出为 “True” 的先验概率事 x,那上面的公式就变成了:
给出任意满足以上条件的假设情况,预言正确的概率可以取
而公式
再举一个例子,假设 Yankees 和 Red Sox 在玩一个游戏,Red Sox 获胜的概率是 70%,而 Yankees 获胜的概率是 50% 。那么 Yankees 最终获胜的概率有多少呢? 显然这个情景又是不明确的,因为这个问题的条件可以通过许多不同的情况来满足,从而得到不同的结果分布。因而,如果我们只基于这点儿信息分配概率,显然我们必须假定 Y 打败 R 的概率是一个关于 y 和 w 的函数(y 和 w 分别代表 Y 和 W 对战时 赢得游戏的比率)。也就是说我们需要一个函数
它遵循
并且对于任意的
其中,f 是任意一个从
f(x) “最好” 或最优的选择是什么呢? 我们可以假定每个参与游戏的队伍都有一个“技巧值”,并且这个值在群体中满足二项分布。接下来,假定每支队伍和其他每支队伍比赛的次数相同,并且假定
另外一种方法是使用式子
这个公式有一定的审美趣味,但是它也会有产生一些反直觉的结果。举个例子,假设现在两个最强的队伍开始对战,X 和 Y,从他们之前的比赛结果中得出他们获胜概率分别是
相比之下,另一个公式则得出:
显然一个胜利率是 99% 的队伍更有可能碾压一个 胜率是 97% 的队伍。如果这一个公式更加适用,那么在这些队伍当中,一个胜率是 99% 的队伍是不会允许一个胜率是 97% 的队伍存在的。而这取决于队伍的数量和他们比赛的次数。
而对于这个简单的加权函数
就可以保证一个拥有 0.800 胜率的队伍可以有充足的机会来维持他的胜利。在推导一个模型时,要求整个群体最终要趋于均衡也许是一个不错的选择。当然,第二个模型只是“简单加权”模型的一个特殊情况,也就是说,我们有:
分子分母同时除以
其中
一个更基本的方法是对底层的过程进行建模。例如,假设共有256支队伍,他们的技巧值
从1到9并且满足二项分布:
技巧值 | 玩家数量 |
---|---|
1 | 1 |
2 | 8 |
3 | 28 |
4 | 56 |
5 | 70 |
6 | 56 |
7 | 28 |
8 | 8 |
9 | 1 |
当然,“技巧” 也许是一个矩阵而不是一个标量,并且你知道了所有队伍技巧的交互信息(比如 剪刀剪布, 布包石头, 石头砸剪刀等),但我们还是假设“技巧”在这个游戏当中只是一个简单的标量吧。
现在,我们要做的是确定什么样的技巧决定了一场对战的结果。如果一场比赛的结果有很大一部分取决于运气,那么这世上最有技巧的选手也许只能有60%的场次可以打败最没有技巧的选手。一种建模的方式就是定义选手
其中
现在我们有一种简单但是完备的模型来计算对应每一个技巧值的胜败率。一般地,对于一个技巧值满足二项分布的、有
其中
技巧值 | 玩家数量 | 胜利率 |
---|---|---|
1 | 1 | 4.9393 |
2 | 8 | 16.4711 |
3 | 28 | 29.5133 |
4 | 56 | 41.5554 |
5 | 70 | 51.7592 |
6 | 56 | 60.0785 |
7 | 28 | 66.7554 |
8 | 8 | 72.0936 |
9 | 1 | 76.3722 |
当然,所有胜利率的加权平均数是 50%。另外,因为
以上です~