You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
|
|
: 平均数的意义是什么?
|
|
|
|
|
如果仅就数学而言,平均数只是一个包含了加法和除法的算式,对数学运算来说实在是无足轻重,但平均数在统计学中却是一个非常重要的概念。我们通过下面的统计模型来解释这个重要性,从中体会模型的重要性(参见问题18中关于模型的讨论),并且体会如何用数学的方法表述问题26和问题28中所说的随机性。
|
|
|
|
|
因为对事物进行观测或者观察会有误差,因此在大多数情况下,通过抽样得到的数据也会有误差。我们通过下面的算式来描述这个问题,通常称这个算式为误差模型:
|
|
|
|
|
x = μ + ε (10)
|
|
|
|
|
其中x表示观测数据,希腊字母 μ 表示真实数据,希腊字母 ε
|
|
|
|
|
表示观测误差。显然,在上面的误差模型中只有观测数据是可能知道的,而真实数据和观测误差都是不知的,那么,通过什么样的方法才能估计真实数据
|
|
|
|
|
μ 呢?只有一个办法,就是反复观测。
|
|
|
|
|
假设观测了n次,就得到了一个大小为n的样本,具体数据为:x~1~,x~2~,......,x~n~。根据(10)式所给出的误差模型,可以得到下面n个式子:
|
|
|
|
|
x~1~ = μ + ε~1~
|
|
|
|
|
x~2~ = μ + ε~2~
|
|
|
|
|
......
|
|
|
|
|
x~n~ = μ + ε~n~
|
|
|
|
|
把上面n个式子的左边和右边分别相加,可以得到
|
|
|
|
|
x~1~ + x~2~ + ... + x~n~ = nμ + (ε~1~ + ε~2~ + ... + ε~n~) (11)
|
|
|
|
|
回忆在问题28中对数据随机性的讨论,随机性要求尽可能地排除数据获取过程中的系统误差和人为干扰。可以设想,如果数据的获取满足了随机性的这两条要求,那么,观测误差就必然有正有负;更一般地,当样本数量较大时,还可以要求观察误差正负抵消,因此可以得到
|
|
|
|
|
ε~1~ + ε~2~ + ... + ε~n~ ≈ 0。把这个设想的结果代入(11)式,就可以得到
|
|
|
|
|
μ ≈ (x~1~ + x~2~ + ... + x~n~) / n,
|
|
|
|
|
上式的右边正是样本数据的平均数,式中的约等号表示是用样本平均数估计真实数据。
|
|
|
|
|
通过上面的分析可以看到,在假定条件下,样本平均数是真实数据的一个好的估计。事实上,我们还可以证明,在误差模型的假定下,样本平均数的数学期望就等于真实数据,因此样本平均数是真值的无偏估计,在这里我们就不讨论这个问题了。
|
|
|
|
|
显然,在小学阶段的数学教学中不可能直接教授这些内容,但教师应当了解上面所描述的数据分析的思想、理解数据分析的方法,应当清楚人们是如何用数学的语言来表述随机性的要求。如果教师能够根据上面所说的基本原则,在教学过程中采取有效的形式渗透这些思想和方法,就能够让学生体验和感悟数据分析的要义。
|