阿里巴巴笔试题集第23题及分析

题目: 一个骰子, 6 面, 1 个面是 1 , 2 个面是 2 , 3 个面是 3 , 问平均掷多少次能使 1 、 2 、 3 都至少出现一次。

 方法: 面对面试概率题几乎屡试不爽的分叉树递归列方程法。

 这是一个求数学期望的问题,最终是求 1 , 2 , 3 出现至少一次的最短长度的期望。

 这样分叉树的每个节点是一个期望状态,而每个分叉是一次投掷结果。将后续期望出现 1 、 2 、 3 各至少一次的情形记作 L 123 (即题目所求),将后续期望出现 1 、 2 各至少一次( 3 无关)情形记作 L 12 ,而 1 至少一次( 2 , 3 无关)情形 L 1 ,其余数值符号类推,则树结构如下(列出 4 级结构已经足够):

image

image.gif

接下来,就是要排出方程,因为一共 7 个未知数,如果排出 7 个线性方程就能解决问题。
在此我向大家推荐一个架构学习交流圈。交流学习企鹅群号:948368769(里面有大量的面试题及答案)里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化、分布式架构等这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多

 这方程组里的未知数对应上述的状态,而其数值则是一个对长度(投掷次数)的数学期望。

 根据这个树状结构和其中的递归关系,这个方程组就是:

L 123   = p 1   (L 23 + 1) +   p 2   (L 13 +1) + p 3   (L 12   + 1) = p 1   L 23   + p 2   L 13 +  p 3   L 12   + 1

(以这个 L 123 为例,解释,投掷 1 的概率是 p 1 而由此得到的结果是需要期待后续 2 和 3 各至少出现一次,于是长度期望是 L 23 + 1 ,加 1 是因为投掷了一次,亦即即增进一级)

L 23   =   p 1   L 23   + p 2   L 3 +  p 3   L 2   + 1

L 13   =   p 1   L 3   + p 2   L 13 +  p 3   L 1   + 1

L 12   =   p 1   L 2   + p 2   L 1 +  p 3   L 12   + 1

L 1   = p 1 + p 2   L 1 +  p 3   L 1   + 1

(这里实际上是   L 1   =p 1   ·1 + p 2   (L 1 + 1) + p 3   (L 1   + 1)   = p 2   L 1 +  p 3   L 1   + 1 ,因为对 L 1 情形,如果投了 1 就目的达到终止了)

L 2   = p 2 +   p 1   L 2   +    p 3   L 2   + 1

L 3   = p 3 +   p 1   L 3   + p 2   L 3 + 1

(以上一开始没注意,多加了悬空的概率项,故计算有误)

其中   p 1 , p 2   和   p 3 分别是掷出 1 , 2 和 3 的概率,即 1/6 , 1/3 , 1/2 。

 于是求解这个方程,得到:

L 1   = 6 ,   L 2   = 3 ,   L 3   = 2

L 12   = 7 ,   L 13   = 13/2 ,   L 23   = 19/5 6

L 123   =   219/30 = 7.3   259/36 ~= 7.14

 故以上如果没有计算错误,该题结果是,平均掷 7.3   7.14 次可出现这些面值各至少一次。

 【另一解法】感谢 4 楼 aaaxingruiaaa 同学提供的答案(指示器变量法),整理如下:

定义随机变量 X n ,其可能值为 0 或 1 ,其值为 1 表示 “ 前 n 次掷骰子, 1 , 2 , 3 没能都至少出现一次 ” 的事件,其值为 0 表示这个事件没有发生,即 “ 前 n 次掷骰子, 1 , 2 , 3 各至少出现一次 ” 。

 令 p n 为 “ 掷 n 次骰子, 1 , 2 , 3 没能都至少出现一次 ” 的概率,所以显然 p n   = Pr{ X n =1} ,于是 p n   = 1·Pr{ X n =1} + 0·Pr{ X n =1} = E[ X n ] ,即这个随机变量的数学期望。

 令随机变量 X 表示 1 , 2 , 3 刚好全部出现过需要的投掷次数。可见题目要求的就是 E[X] 。

关键等式: X =   Sigma (n=0 to   Inf;  X n )    (这里 Sigma 是求和号,求和范围是 n 从 0 到无穷大)

 说明一下,等式两边都是随机变量,假设对于某个随机实例(例如,这里指一次具体的投掷序列),其对应事件是: “ 投了 K 次恰好 1 , 2 , 3 都出现了 ” ,于是等式左边显然等于 K ;而等式右边,对于 n < K ,由于这些项的对应定义事件发生了(即 1 , 2 , 3 没能出现),所以他们的实例值是 1 ,而对于 n⩾K ,则由于对应定义事件都没发生,实例值为 0 ,可见这个和也是 K 。故两侧相等。(为了达到这个相等关系,可以看出需要把 X 0 包含在内的必要性)

值得注意的是(但对于解这道题也可以不去注意,但注意一下有利于比较深入地理解),对 n < 3 , X n 显然恒为 1 。而对于 n⩾3 ,这些随机变量不是独立的。他们的相关性是不容易求出的,唯一容易知道的是,当序列中一个项为 0 时,其后的项均为 0 。好在对于这题我们不需要担忧这个相关性。

 由于数学期望的加性与随机变量的相关性无关(这是数学期望一个很令人高兴的性质),所以即便这样, E[X] 也能容易求出:

 E[X] =   Sigma (n=0 to Inf; E[ X n ] ) =  Sigma (n=0 to   Inf;   p n )

 p n 的比较直观的求法也由 aaaxingruiaaa 同学 提供了,即所谓容斥原理。稍微解释一下,由于 p n 考虑的是 n 次投掷三者没有全部出现,于是就是其中两者出现或仅一者出现。假设单次投掷 1 , 2 和 3 出现的概率分别为: r 1 , r 2 和 r 3 。于是 ( r 1 + r 2 ) n 表征 n 次投掷只出现 1 或 2 的概率,这其中包括了出现全 1 和全 2 的情形,于是求 p n 可由这样的项求和并剔除重复计算的单面值情形,于是:

 p n   = ( r 1 + r 2 ) n + ( r 1 + r 3 ) n + ( r 2 + r 3 ) n - r 1 n - r 2 n - r 3 n ,当 n > 0 ;   而 p 0   = 1 (由定义;同时也可以检验看出,这个 p n 在 n 为 1 和 2 的时候都是 1 )

于是由等比级数(等比数列求和)公式:

E[X] =   1 + Sigma (n=1 to Inf; ( r 1 + r 2 ) n + ( r 1 + r 3 ) n + ( r 2 + r 3 ) n - r 1 n - r 2 n - r 3 n = 1 + (1 -   r 3 ) /  r 3   + (1 -   r 2 ) /   r 2   + (1 -   r 1 ) /   r 1   -   r 1   / (1 -   r 1 ) -   r 2   / (1 -   r 2 ) - r 3   / (1 -   r 3 ) = 7.3

 【程序仿真】

以下程序进行一千万轮投掷的仿真,结果基本在 7.3 周围。至此此题答案 7.3 毫无疑问了。

[csharp] view plaincopy

 static   void  Main( string [] args)   
{  
    Random rand = new  Random();   
    int [] diceSurfaces =  new   int [6] { 1, 2, 2, 3, 3, 3 };    // 6个面    
    int  nRounds = 10000000;  // 投掷轮数    
    long  totalTimes = 0;     // 所有轮中投掷数加起来的总投掷次数    
    for  ( int  iRounds = 0; iRounds < nRounds; iRounds++)   
    {  
        bool [] occurred =  new   bool [3] {  false ,  false ,  false  };   // 各面值出现标记    
        int  sumPicked = 0;   // 出现不同面值个数    
        int  times = 0;   
        for  (; ; )   
        {  
            int  iSurface = rand.Next(6);   
            int  value = diceSurfaces[iSurface] - 1;   
            times++;  
            if  (!occurred[value])   
            {   // 出现新面值    
                occurred[value] = true ;   
                sumPicked++;  
                if  (sumPicked == occurred.Length)   
                {   // 全部出现,结束此轮    
                    break ;   
                }  
            }  
        }  
        totalTimes += times;  
    }  
    Console.WriteLine("average number of times = {0}" , (( double )totalTimes) / nRounds);   
}  

image.gif

猜你喜欢

转载自blog.51cto.com/14422312/2416412