dsProject/dsRag/Txt/MATH_1_109.txt

： 平均数的意义是什么？
如果仅就数学而言，平均数只是一个包含了加法和除法的算式，对数学运算来说实在是无足轻重，但平均数在统计学中却是一个非常重要的概念。我们通过下面的统计模型来解释这个重要性，从中体会模型的重要性（参见问题18中关于模型的讨论），并且体会如何用数学的方法表述问题26和问题28中所说的随机性。
因为对事物进行观测或者观察会有误差，因此在大多数情况下，通过抽样得到的数据也会有误差。我们通过下面的算式来描述这个问题，通常称这个算式为误差模型：
x = μ + ε （10）
其中x表示观测数据，希腊字母 μ 表示真实数据，希腊字母 ε
表示观测误差。显然，在上面的误差模型中只有观测数据是可能知道的，而真实数据和观测误差都是不知的，那么，通过什么样的方法才能估计真实数据
μ 呢？只有一个办法，就是反复观测。
假设观测了n次，就得到了一个大小为n的样本，具体数据为：x~1~，x~2~，......,x~n~。根据（10）式所给出的误差模型，可以得到下面n个式子：
x~1~ = μ + ε~1~
x~2~ = μ + ε~2~
......
x~n~ = μ + ε~n~
把上面n个式子的左边和右边分别相加，可以得到
x~1~ + x~2~ + ... + x~n~ = nμ + (ε~1~ + ε~2~ + ... + ε~n~) （11）
回忆在问题28中对数据随机性的讨论，随机性要求尽可能地排除数据获取过程中的系统误差和人为干扰。可以设想，如果数据的获取满足了随机性的这两条要求，那么，观测误差就必然有正有负；更一般地，当样本数量较大时，还可以要求观察误差正负抵消，因此可以得到
ε~1~ + ε~2~ + ... + ε~n~ ≈ 0。把这个设想的结果代入（11）式，就可以得到
μ ≈ (x~1~ + x~2~ + ... + x~n~) / n，
上式的右边正是样本数据的平均数，式中的约等号表示是用样本平均数估计真实数据。
通过上面的分析可以看到，在假定条件下，样本平均数是真实数据的一个好的估计。事实上，我们还可以证明，在误差模型的假定下，样本平均数的数学期望就等于真实数据，因此样本平均数是真值的无偏估计，在这里我们就不讨论这个问题了。
显然，在小学阶段的数学教学中不可能直接教授这些内容，但教师应当了解上面所描述的数据分析的思想、理解数据分析的方法，应当清楚人们是如何用数学的语言来表述随机性的要求。如果教师能够根据上面所说的基本原则，在教学过程中采取有效的形式渗透这些思想和方法，就能够让学生体验和感悟数据分析的要义。