You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
: 什么是概率?如何得到概率?
在上面的几个问题中多次谈到了随机性。经验告诉我们,在日常生活和生产实践中,一些事情可能发生、也可能不发生,可能这样发生、也可能那样发生,人们通常称这样的事情为随机事件。而统计学和概率论的研究对象就是随机事件。
概率是指随机事件发生可能性的大小, 在一般意义上, 这个可能性的大小是未知的。因为概率的英文单词是probability, 于是人们通常用英语字母 p 表示概率。虽然概率是未知的, 但生活经验告诉我们: 可以认为概率是一个非负的、不大于1的数, 即 0 ≦ p ≦ 1。当概率p = 0 时认为随机事件发生的可能性为0, 即意味着这个事件几乎不能发生; 当概率p = 1 时认为随机事件发生的可能性为1, 即意味着这个事件几乎必然发生; 而其他的随机事件都在几乎不能发生和几乎必然发生之间。
至少可以有两种方法得到未知的概率: 一种方法就是前面谈到的估计的方法, 比如问题28中所说的估计红球所占比例, 如果把这个比例理解为摸出红球的可能性的大小的话, 那么问题28的操作过程就是在估计概率; 还有一种方法就是不借助数据而直接根据背景定义概率, 定义的概率实质上就是对随机事件发生可能性大小的一种度量, 这个度量是人们在理想状态制定出来的。
要度量就必须构建度量的背景, 人们通常称这种背景为模型。在整个义务教育阶段, 关于概率的内容只涉及到古典概率模型, 简称为古典概型。古典概型描述的是这样的背景: 事件发生的可能结果是有限的, 发生每种结果可能性的大小是一样的; 进一步用数学语言阐述就是: 如果事件发生的可能结果有n个, 那么发生每个结果的可能性的大小都是1/n。详细讨论参见附录的话题30。
我们通过问题28中所讨论的摸球的例子说明古典概率模型中的概率是如何定义的。显然, 摸球的背景是典型的古典概型: 因为有5个球, 每次摸球必然要摸到这5个球中的1个, 因此结果是有限的; 因为是在袋子里随机摸球, 因此摸到每个球的可能性的大小是一样的, 都是1/5。下面考虑随机事件的概率是如何定义的。如果随机事件是: 摸一次球, 摸到的是红球; 用A表示这个事件。因为有4个红球, 而这4个红球都有可能被摸到, 因此定义随机事件A的概率为: P(A) = 4/5。如果随机事件是: 摸一次球, 摸到的是白球; 用B表示这个事件。因为只有1个白球, 因此定义随机事件B的概率是: P(B) = 1/5。显然, 如果摸一次球, 那么摸到的不是红球就是白球, 因此有P(A) + P(B) = 1。
进一步考虑复杂一些的例子, 通过复杂的例子可以更好地了解概率是如何定义的, 可以更清晰地把握定义概率的理由和背景是什么。假如考虑的随机事件是: 有放回地摸两次球, 两次摸到的都是红球; 用C表示这个事件。因为袋子里有5个球: 4个红球1个白球, 因此就球的颜色而言, 有放回地摸两次球可能会出现四种情况: 红红、红白、白红、白白。所谓红红是指摸两次都是红球, 如果把四个红球编上号: 1、2、3、4, 那么, 摸到的两个红球就可能有11、12、13、14、21、…、44 这样不同的搭配。不难计算, 一共有16个不同的搭配, 或者说有16个不同的结果。根据同样的想法, 四种情况的可能结果数分别为
红红的可能结果数 = 4 × 4 = 16; 红白的可能结果 = 4 × 1 = 4;
白红的可能结果数 = 1 × 4 = 4; 白白的可能结果数 = 1 × 1 = 1。
因此, 摸球两次一共有16 + 4 + 4 +1 = 25 个可能结果, 摸两次都是红球有16个可能结果。根据前面定义概率同样的思路, 可以定义这个随机事件的概率为P(C) = 16/25。事实上, 因为事件C是事件 A 连续发生两次,因此也可以通过计算直接得到
P(C) = P(A)·P(A) = 4/5 × 4/5 = 16/25。
可以看到,两种方法得到的概率是一样的,因此这样定义的概率是相容的、或者说是无矛盾的。通过类似的计算方法,有兴趣的读者可以得到其他的一些结果,比如,摸两次球都是白球的概率,摸两次球得到一个红球一个白球的概率,等等。
通过上面具体例子的说明,我们可以总结古典概型定义概率的方法了。如果用 N 表示所有可能结果的个数,用 M 表示事件A发生的可能结果的个数, 那么定义事件A发生的概率为
P(A) = M/N。
因为事件A可能发生的结果必然是所有可能结果中的一部分结果, 因此有0 ≦ M ≦ N, 因此必然有0 ≦ M/N ≦ 1, 即0 ≦ P(A) ≦ 1, 这个结果与前面关于概率的约定是一致的。也可以完全通过语言来表示这个定义:
P(A) = 事件A的可能结果数 / 所有的可能结果数。
可以看到, 上面关于概率的定义是非常合理的, 是符合人们通常思维的。但我们也必须认识到, 这样的定义依然是人为的, 是人们在理想模型下构建出来的。正因为如此, 在构建定义的初期, 还是有许多学者通过抛掷硬币等实验手段, 对这样定义的合理性进行了验证, 关于这个问题更详细的讨论可以参见附录的话题30。
附录:若干与小学数学有关的话题