浅谈随机数发生器

      今天在微博上到一篇如何使用随机数的文章,让我回忆起刚上大一时学C语言时,书后有道调用rand()函数的练习题,当时觉得好神奇,想知道它是怎么实现的,大二时候学Java又遇到了random()函数,恰巧当时上机课我有机会问老师,遗憾的是老师只是告诉我那是伪随机数,课后查查资料才了解。如今来一篇关于随机数发生器博文来回忆一下神奇的随机数。

     众所周知,我们平时所使用的无论什么编程语言都会提供一个随机数函数,而且它是伪随机数(Pseudo Random Number),它是由算法计算得出的,是可以预测的,也就是说当随机种子相同时,对于同一个随机函数,得出的随机数列是固定不变的,亚裔唯一图灵奖得主姚期智就是研究的就是伪随机数生成论;与之对应的就是真随机数(True Random Number)它是真正的随机数,无法预测且无周期性;还有一种是产生随机数的发生器是密码学伪随机数发生器(Cryptographically Secure Pseudo-Random Number Generator)常用的算法有 MD5 ,SHA1 等标准, 这里不做过多讨论,说说最基本的前两种:


一、真随机数发生器

    像无法实现永动机一样,想要实现真随机数靠程序是永远无法实现的,很多情况下只能看老天的眼色,比如布朗运动,量子效应,放射性衰变等。第一个真随机数发生器是1955年由Rand公司创造的,而在1999年,intel发布Intel810芯片组时,就配备了硬件随机数发生器,基于IntelRNG的真随机数生成器可以生成满足独立性和分布均匀性的真随机数,目前大部分芯片厂商都集成了硬件随机数发生器,只要安装相应驱动,了解读取寄存器地址,可以直接调用发生器。Intel810RNG的原理大概是:利用热噪声(是由导体中电子的热震动引起的)放大后,影响一个由电压控制的振荡器,通过另一个高频振荡器来收集数据。TRNG的类型主要有:

1.基于电路的TRNG:

i.振荡器采样:就是上述Intel采用的方式。

ii.直接放大电路噪声:利用电路中各种噪声,如上述的热噪声作为随机源,由于强度小,所以先要对其放大,然后对一定时间内超过阈值的数据进行统计,这样就产生的随机数。.

iii.电路亚稳态:亚稳态表示触发器无法在规定时间内达到一个可确认状态,一定条件下,触发器达到两个稳态的几率为50%,所以先使电路进入亚稳态,之后根据状态转化为随机数。

iv.混沌电路:不可预测,对初始条件的敏感的依赖性。以及混沌电路在芯片中易于实现的特点,可以产生效果不错的随机数。

2.基于其他物理源的TRNG

如宇宙射线,粒子衰变,空气噪声等作为随机源,来产生随机数。

3.其他物理信息TRNG

人为可以产生随机数吗?当然能!听说一个HR拆选简历的方式是往天上一扔,掉在桌子上的简历就通过,这个HR确认懂随机啊,而且是真随机。这类随机生活中随处可见,掷骰子,抓麻将,或者统计一个月内帝都PM2.5的数值。

对于真随机发生器我个人认为未来是可以通过生物计算机来获取的。


二、伪随机数发生器

    通过程序得到的随机数无论什么算法都一定是通过递推公式得到的序列,这本身就违反了随机的定义,所以它们都不是真正的随机数。伪随机数中一个很重要的概念就是“种子”,种子决定了随机数的固定序列,例如在C语言rand函数得到的序列每次都是相同的,如果想得到不同序列需要调用srand设置种子;同理在Java中 new Random(1)的构造函数参数来设置种子。下面介绍生成PRNG的几种常见方法:

1.取中法:


i.平方取中法:

这个方法是由冯·诺伊曼在1946年提出的,思想很简单:

选择一个m位数Ni作为种子,做平方运算(记为Ni+ 1 = (Ni * Ni)...),结果若不足2m个位,在前补0。在这个数选中间m个位的数作为Ni+1。这个算法明显又很大弊端,不仅周期短而且分布不均匀,比如10000平方取中结果就一直为00000了。
示例代码:
public class CustomRandom {
	
	static final int FIGURES = 10000;
	static long mRandom;
	
	public static void main(String[] args) {
		long seed = System.currentTimeMillis();
		mRandom = seed % FIGURES;
		for (int i = 0; i < 10; i++)
			System.out.println(getRandom(seed));
	}

	private static long getRandom(long seed) {
		return mRandom = (mRandom * mRandom / (long) Math.pow(10, 5/2)) % FIGURES;
	}
}

ii:常数取中法

此方法与平方取中法稍有不同,只是把一个随机数的平方换成了随机数与常数的乘积(记为Ni+1 = (K * Ni)...),对于随机分布等没有什么提升。

iii:乘法取中法:

此方法是对平方取中法的一定优化,公式记为Ni +1 = (Ni * Ni-1 )...

2.同余法

同余是啥不知道的同学见我《素性测试》中的wilson检测中有解释
同余法是大部分变成语言的RNG所采用的算法,线性同余方程为:Ni+1  = a Ni + C (mod m),其中a为乘子,C为增量,m为膜。产生的随机序列Rn = Ni / m。
当 a = 1 并且 C != 0时,此同余法称为加法同余法
当a != 1 并且 C = 0时,此同余法称为乘法同余法
当a != 1 并且 C != 0时,此同余法称为混合同余法
同余法当m越大,Ni的范围也就越大,随机分布的也就越均匀,Rn也就分布的更均匀,所以m取值应尽可能的大,充分利用计算机字长。对于如何获得满周期随机数是存在判定定理的,当且仅当满足下列条件时,践行同余法是满周期的:
1.C与m互质
2.对于m的每一个质因子p,(a-1)为p的倍数
3.若m可被4整除, (a-1)也可被4整除。
示例代码:
public class CustomRandom {
	
	static final int A = 3;
	static final int M = (1 << 31) - 1 ;
	
	private static long mRandom;
	
	public static void main(String[] args) {
		mRandom = System.currentTimeMillis() / Integer.MAX_VALUE;
		for (int i = 0; i < 10; i++) {
			mRandom = (mRandom * A) % M;
			System.out.println(mRandom);
		}
	}
}
除此之外还有二次同余,三次同余等,原理差不多。

3.移位法:

由于计算机特有的逻辑移位运算,可以对种子N0左移n位得到M1,右移n位得到M2,将M1与M2做逻辑相加运算得到随机数N1,
公式为Ni+1 = Ni  >> n + Ni << n.移位法速度非常快,但对初始值要求较高,很难得到满意的随机序列。
示例代码:
public class CustomRandom {
	
	static final int N = 5;
	static long mRandom;
	
	public static void main(String[] args) {
		long mRandom = System.currentTimeMillis();
		for (int i = 0; i < 10; i++) {
			mRandom = Math.abs((mRandom >> N) + (mRandom << N));
			System.out.println(mRandom);
		}
	}
}

4.梅森旋转算法

梅森旋转算法是当今生成随机数质量最好的算法,如php,python,perl等流行编程语言内置的PRNG都是采用该算法实现。

下面是来至wiki的介绍:

梅森旋转算法(Mersenne twister)是一个伪随机数生成算法。由松本真和西村拓士在1997年开发,基于有限二进制字段上的矩阵线性地鬼F_{2}。可以快速产生高质量的伪随机数, 修正了古典随机数发生算法的很多缺陷。

下面的一段伪代码使用MT19937算法生成范围在[0, 232 − 1]的均匀分布的32位整数

 //创建一个长度为624的数组来存储发生器的状态
 int[0..623] MT
 int index = 0
 
 //用一个种子初始化发生器
 function initialize_generator(int seed) {
     i := 0
     MT[0] := seed
     for i from 1 to 623 { // 遍历剩下的每个元素
         MT[i] := last 32 bits of(1812433253 * (MT[i-1] xor (right shift by 30 bits(MT[i-1]))) + i) // 0x6c078965
     }
 }
 
 // Extract a tempered pseudorandom number based on the index-th value,
 // calling generate_numbers() every 624 numbers
 function extract_number() {
     if index == 0 {
         generate_numbers()
     }
 
     int y := MT[index]
     y := y xor (right shift by 11 bits(y))
     y := y xor (left shift by 7 bits(y) and (2636928640)) // 0x9d2c5680
     y := y xor (left shift by 15 bits(y) and (4022730752)) // 0xefc60000
     y := y xor (right shift by 18 bits(y))

     index := (index + 1) mod 624
     return y
 }
 
 // Generate an array of 624 untempered numbers
 function generate_numbers() {
     for i from 0 to 623 {
         int y := (MT[i] & 0x80000000)                       // bit 31 (32nd bit) of MT[i]
                        + (MT[(i+1) mod 624] & 0x7fffffff)   // bits 0-30 (first 31 bits) of MT[...]
         MT[i] := MT[(i + 397) mod 624] xor (right shift by 1 bit(y))
         if (y mod 2) != 0 { // y is odd
             MT[i] := MT[i] xor (2567483615) // 0x9908b0df
         }
     }
 }
这里有完整的源码实现:http://www.cs.gmu.edu/~sean/research/mersenne/MersenneTwister.java

当然对于随机质量的好坏我们要的是具有均匀性、独立性,周期性好的序列,对于随机数检测比较简单的方式可以输出在一张二维表上,直观的看出随机性的好坏,也可以采取《积分算法》中的蒙特卡洛方法来具体测试随机性;详细的检测可以采取x^2检测,k-s检测,poker检测等对随机性各个指标的具体检测这里就不细说了。
    至此我们只讨论了无规则分布和简单均匀分布,还有像拉普拉斯分布,正态分布,泊松分布,贝努里分布,高斯分布等高级分布本文就不再讨论了;现在我们再回到来头思考一个问题:世界上真存在真随机发生器吗?如果存在,假设时间倒流,再走一边,中彩票的会是另一个人,还是冥冥之中,自有天意,当然这只有上帝知道。


==================================================================================================

  作者:nash_  欢迎转载,与人分享是进步的源泉!

  转载请保留原文地址http://blog.csdn.net/zmazon/article/details/17383521

===================================================================================================

猜你喜欢

转载自blog.csdn.net/nash_/article/details/17383521