|
|
: 什么是概率?如何得到概率?
|
|
|
在上面的几个问题中多次谈到了随机性。经验告诉我们,在日常生活和生产实践中,一些事情可能发生、也可能不发生,可能这样发生、也可能那样发生,人们通常称这样的事情为随机事件。而统计学和概率论的研究对象就是随机事件。
|
|
|
概率是指随机事件发生可能性的大小,在一般意义上,这个可能性的大小是未知的。因为概率的英文单词是probability,于是人们通常用英语字母
|
|
|
p
|
|
|
表示概率。虽然概率是未知的,但生活经验告诉我们:可以认为概率是一个非负的、不大于1的数,即
|
|
|
0 ≦ p ≦ 1。当概率p = 0
|
|
|
时认为随机事件发生的可能性为0,即意味着这个事件几乎不能发生;当概率p = 1
|
|
|
时认为随机事件发生的可能性为1,即意味着这个事件几乎必然发生;而其他的随机事件都在几乎不能发生和几乎必然发生之间。
|
|
|
至少可以有两种方法得到未知的概率:一种方法就是前面谈到的估计的方法,比如问题28中所说的估计红球所占比例,如果把这个比例理解为摸出红球的可能性的大小的话,那么问题28的操作过程就是在估计概率;还有一种方法就是不借助数据而直接根据背景定义概率,定义的概率实质上就是对随机事件发生可能性大小的一种度量,这个度量是人们在理想状态制定出来的。
|
|
|
要度量就必须构建度量的背景,人们通常称这种背景为模型。在整个义务教育阶段,关于概率的内容只涉及到古典概率模型,简称为古典概型。古典概型描述的是这样的背景:事件发生的可能结果是有限的,发生每种结果可能性的大小是一样的;进一步用数学语言阐述就是:如果事件发生的可能结果有n个,那么发生每个结果的可能性的大小都是1/n。详细讨论参见附录的话题30。
|
|
|
我们通过问题28中所讨论的摸球的例子说明古典概率模型中的概率是如何定义的。显然,摸球的背景是典型的古典概型:因为有5个球,每次摸球必然要摸到这5个球中的1个,因此结果是有限的;因为是在袋子里随机摸球,因此摸到每个球的可能性的大小是一样的,都是1/5。下面考虑随机事件的概率是如何定义的。如果随机事件是:摸一次球,摸到的是红球;用A表示这个事件。因为有4个红球,而这4个红球都有可能被摸到,因此定义随机事件A的概率为:P(A)
|
|
|
=
|
|
|
4/5。如果随机事件是:摸一次球,摸到的是白球;用B表示这个事件。因为只有1个白球,因此定义随机事件B的概率是:P(B)
|
|
|
= 1/5。显然,如果摸一次球,那么摸到的不是红球就是白球,因此有P(A) + P(B)
|
|
|
= 1。
|
|
|
进一步考虑复杂一些的例子,通过复杂的例子可以更好地了解概率是如何定义的,可以更清晰地把握定义概率的理由和背景是什么。假如考虑的随机事件是:有放回地摸两次球,两次摸到的都是红球;用C表示这个事件。因为袋子里有5个球:4个红球1个白球,因此就球的颜色而言,有放回地摸两次球可能会出现四种情况:红红、红白、白红、白白。所谓红红是指摸两次都是红球,如果把四个红球编上号:1、2、3、4,那么,摸到的两个红球就可能有11、12、13、14、21、...、44
|
|
|
这样不同的搭配。不难计算,一共有16个不同的搭配,或者说有16个不同的结果。根据同样的想法,四种情况的可能结果数分别为
|
|
|
红红的可能结果数 = 4 × 4 = 16;红白的可能结果 = 4 × 1 = 4;
|
|
|
白红的可能结果数 = 1 × 4 = 4;白白的可能结果数 = 1 × 1 = 1。
|
|
|
因此,摸球两次一共有16 + 4 + 4 +1 = 25
|
|
|
个可能结果,摸两次都是红球有16个可能结果。根据前面定义概率同样的思路,可以定义这个随机事件的概率为P(C)
|
|
|
= 16/25。事实上,因为事件C是事件 A
|
|
|
连续发生两次,因此也可以通过计算直接得到
|
|
|
P(C) = P(A)·P(A) = 4/5 × 4/5 = 16/25。
|
|
|
可以看到,两种方法得到的概率是一样的,因此这样定义的概率是相容的、或者说是无矛盾的。通过类似的计算方法,有兴趣的读者可以得到其他的一些结果,比如,摸两次球都是白球的概率,摸两次球得到一个红球一个白球的概率,等等。
|
|
|
通过上面具体例子的说明,我们可以总结古典概型定义概率的方法了。如果用 N
|
|
|
表示所有可能结果的个数,用 M
|
|
|
表示事件A发生的可能结果的个数,那么定义事件A发生的概率为
|
|
|
P(A) = M/N。
|
|
|
因为事件A可能发生的结果必然是所有可能结果中的一部分结果,因此有0 ≦ M ≦
|
|
|
N,因此必然有0 ≦ M/N ≦ 1,即0 ≦ P(A) ≦
|
|
|
1,这个结果与前面关于概率的约定是一致的。也可以完全通过语言来表示这个定义:
|
|
|
P(A) = 事件A的可能结果数 / 所有的可能结果数。
|
|
|
可以看到,上面关于概率的定义是非常合理的,是符合人们通常思维的。但我们也必须认识到,这样的定义依然是人为的,是人们在理想模型下构建出来的。正因为如此,在构建定义的初期,还是有许多学者通过抛掷硬币等实验手段,对这样定义的合理性进行了验证,关于这个问题更详细的讨论可以参见附录的话题30。
|
|
|
附录:若干与小学数学有关的话题 |