You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
: 平均数的意义是什么?
如果仅就数学而言, 平均数只是一个包含了加法和除法的算式, 对数学运算来说实在是无足轻重, 但平均数在统计学中却是一个非常重要的概念。我们通过下面的统计模型来解释这个重要性, 从中体会模型的重要性( 参见问题18中关于模型的讨论) , 并且体会如何用数学的方法表述问题26和问题28中所说的随机性。
因为对事物进行观测或者观察会有误差,因此在大多数情况下,通过抽样得到的数据也会有误差。我们通过下面的算式来描述这个问题,通常称这个算式为误差模型:
x = μ + ε ( 10)
其中x表示观测数据, 希腊字母 μ 表示真实数据,希腊字母 ε
表示观测误差。显然,在上面的误差模型中只有观测数据是可能知道的,而真实数据和观测误差都是不知的,那么,通过什么样的方法才能估计真实数据
μ 呢?只有一个办法,就是反复观测。
假设观测了n次, 就得到了一个大小为n的样本, 具体数据为: x~1~, x~2~, ......,x~n~。根据( 10) 式所给出的误差模型, 可以得到下面n个式子:
x~1~ = μ + ε~1~
x~2~ = μ + ε~2~
......
x~n~ = μ + ε~n~
把上面n个式子的左边和右边分别相加, 可以得到
x~1~ + x~2~ + ... + x~n~ = nμ + (ε~1~ + ε~2~ + ... + ε~n~) ( 11)
回忆在问题28中对数据随机性的讨论, 随机性要求尽可能地排除数据获取过程中的系统误差和人为干扰。可以设想, 如果数据的获取满足了随机性的这两条要求, 那么, 观测误差就必然有正有负; 更一般地, 当样本数量较大时, 还可以要求观察误差正负抵消, 因此可以得到
ε~1~ + ε~2~ + ... + ε~n~ ≈ 0。把这个设想的结果代入( 11) 式, 就可以得到
μ ≈ (x~1~ + x~2~ + ... + x~n~) / n,
上式的右边正是样本数据的平均数,式中的约等号表示是用样本平均数估计真实数据。
通过上面的分析可以看到,在假定条件下,样本平均数是真实数据的一个好的估计。事实上,我们还可以证明,在误差模型的假定下,样本平均数的数学期望就等于真实数据,因此样本平均数是真值的无偏估计,在这里我们就不讨论这个问题了。
显然,在小学阶段的数学教学中不可能直接教授这些内容,但教师应当了解上面所描述的数据分析的思想、理解数据分析的方法,应当清楚人们是如何用数学的语言来表述随机性的要求。如果教师能够根据上面所说的基本原则,在教学过程中采取有效的形式渗透这些思想和方法,就能够让学生体验和感悟数据分析的要义。