|
|
"content": "函数关系与几何证明\n------ 初中数学教学中的核心问题\n史宁中\n\n前言\n正如我在《基本概念与运算法则:小学数学教学中的核心问题》那本书的前言中所说的那样,自从《义务教育数学课程标准(2011年版)》颁布之后,国家组织了大规模的中小学教师培训,面对许多数学教研员和一线数学教师提出的问题,我就萌发了写一本书来回答的想法。最初,我只是想写一本关于小数数学的案头书,讨论小学数学教学中最重要的一些问题、以及拓展这些内容的有关话题,便于小学数学教师在教学过程中遇到问题时、或者、需要拓展时查阅。但是,在2013年交付印刷时,高等教育出版社的责任编辑王文颖打电话给我,希望也给初中数学教师和高中数学教师分别写一本类似的书,并且希望我把书名一并提出。记得当时我略加思考,就在电话中说出了三本书的书名,与此同时,我就无形中为自己添加了写书的任务。虽然当时的回答比较随意,但表达了我对基础教育阶段数学内容的结构性的思考,这样的思考也逐渐落实到高中的和义教的数学课程标准的修订之中。这三本书的书名表述在每一本书的封底上,这就是,基本概念与运算法则:小学数学教学中的核心问题;函数关系与几何证明:初中数学教学中的核心问题;数形结合与数学模型:高中数学教学中的核心问题。\n时间如川之流逝,一晃10多年过去了。继2013年出版了写给小学数学教师的书之后,在修订完《高中数学课程标准(2017年版)》以后,于2018年出版了写给高中数学教师的书。按照计划,在修订完《义务教育数学课程标准(2022年版)》以后,应当很快就出版写给初中数学教师的书,但因为我要集中精力完成《数学思想概论》第二版的修订,因此耽搁到现在才得以完稿。\n按照《义务教育数学课程标准(2022年版)》的设想,小学第一、二阶段的数学学习是每一个人接受数学教育的发端,因此涉及到数学最为基本的概念和方法,并且,遵从儿童的认知规律,概念从现实背景出发、方法从实际意义出发,因此在本质上,这个阶段的数学学习是基于儿童经验的认知。直到第三学段、即五、六年级,小学数学教育才提出初步数学化的要求,希望学生能够逐渐脱离现实背景和实际意义,一般性地感悟数学的概念和方法,学会用字母表达数量之间关系,这就是《义务教育数学课程标准(2022年版)》提出的数概念一致性和数运算一致性的要求。\n基于上面的表述,我们可以认为,真正的数学教育应当始于初中阶段,这是因为,从初中阶段的数学教育开始,才有了揭示概念内涵的数学定义,才有了表述条件与结果之间关系的数学命题,才有了遵循论证规则的数学证明。于是,才就有了这本书的书名所表述的、义务教育阶段数学最重要的两个方面:函数关系和几何证明。这样,相应的数学能力、或者说、相应的数学核心素养,也从基于经验的感悟上升到基于概念的思想。希望初中数学教师,能够在这样的变化中领会初中数学内容的本质,以及相应的数学基本思想,在教学的过程中引导学生学会数学的思考。正像我们反复强调的那样,学生会思考问题是经验的积累,是在自己思考问题的过程中逐渐形成和发展的。我们把这样的教学目标浓缩为\"四基\"和\"四能\",这是\"三会\"所表述的数学核心素养的底蕴与精髓,因此至少在这个意义上,《义务教育数学课程标准(2022年版)》是传统数学课程标准的延续和拓展,没有任何标新立异。\n如前所述,真正意义的数学定义、数学命题和数学证明都始于初中数学,因此这本书的第一部分专门讨论数学的定义、命题与推理,为了便于初中数学教师把握这些内容的本质特征,这一部分的讨论从最原始的概念开始。这本书其他三个部分的内容,是按照\"数与代数\"\"图形与几何\"\"统计与概率\"这三个领域组织的,虽然这三个领域与小学数学是一致的,但初中阶段的内容发生了本质的变化,择其要点表述如下。\n在\"数与代数\"领域,数的认识从非负有理数拓展到一般有理数,于是在数的运算中出现了有负数参与的四则运算;运算的对象由数拓展到字母,这便有了代数式运算、有了字母表达的等式与不等式;与此同时,数量关系的求解发生了根本性的变化,这就是由四则运算的求解拓展到方程是求解;数量关系的表达也发生了根本性的变化,这就是,引入变量形成了数学最重要的函数的概念。相对于传统的数与代数的教育,《义务教育数学课程标准(2022年版)》最大变化是,提出了代数证明的要求,要求证明\"加一个正数比原来的数大\"\"加一个负数比原来的数小\"\"个位、十位、百位的数相加能被3整除,这个数就能被3整除\"等代数命题;为此,课程标准提供了两个代数证明的基本事实[^1],一个基本事实与传递性有关:等量的等量相等,另一个基本事实与等式的性质有关:等式的两边加减同一个数等式不变。希望学生在数与代数内容的学习中,不仅能够培养运算能力,也能培养逻辑思维能力,感知代数命题的逻辑推理比几何命题更加贴近生活。\n在\"图形与几何\"领域,在小学阶段直观感知的基础上,学生需要理解定义了的几何研究对象、以及研究对象之间的关系,理解几何学基本事实的现实意义和理论意义;理解平行线公理,感知平行线判定定理和性质定理之间的关系,在探索并证明的过程中开始熟悉几何学的演绎证明,尝试一种强有力的数学证明方法、即反证法;进而,在小学阶段直观述说的基础上,可以用演绎的方法证明三角形内角和为180度;感悟并且表达图形运动三个最重要的概念、即平移、旋转、轴对称,在图形变化的过程中感悟几何不变量、即两点间距离保持不变;基于对几何不变量的理解,开始了欧几里得几何最为生动的论证,这就是关于图形全等和图形相似的证明。《义务教育数学课程标准(2022年版)》把尺规作图中的部分内容、比如\"作给定线段\"\"作给定三角形周长\"等内容下放到小学,与此同时,对初中数学尺规作图的学习提出更高的目标,要求在教学过程中启发学生进行如何作图的发想,把传统的技能性学习提升为想象力的实践,培养学生的几何直观和空间想象力。\n对于数学教育,数形结合始于初中数学,是通过数轴和绝对值表述的。小学阶段的数学,已经构建了自然数的数轴和自然数数对的平面直角坐标系,借此述说了数与点之间的对应;因此,初中数学的要旨,是把数与点之间的对应拓展到数量与距离之间的对应,但在本质上,这样的对应是形式上的[^2]。无论如何,这样的拓展是极为重要的,因为度量是数学的本质。\n在\"统计与概率\"领域,为了适应大数据时代的需要,增加了平均数和百分数分布式计算的要求,这与高中数学方差分布式计算的要求一脉相承,希望学生能够在这样的系列性的学习中,感悟利用多台计算机进行并行计算的必要性,理解瞬时计算的基本原理;增加了数据分类的要求,聚焦于把给定数据分为两类这样的最简单的形式,感知如何制定判断分类方法好坏的准则、如何用数学的语言表达所制定的准则,理解现实生活中随机决策的基本特征。在经历用数学的语言表达现实世界的过程中,提升数据分析能力,形成初步的模型思想。\n2022年版课标对\"综合与实践\"领域赋予了具体的内容,这是一个重大的变化,这个变化源于课程方案中关于跨学科学习的要求。大体上把这个领域的学习内容分为两类,一类是主题式学习,基本形式是学习跨学科的内容,比如小学数学把传统的\"常见的量\"的内容移到\"综合与实践\"领域;一类是项目式学习,基本形式是在解决实际问题的过程中进行完成项目式学习,这里所说的项目类似科学研究或者工程实施,希望引导学生经历\"制定具体目标、设计解决方案、提交验收报告\"这样的规范性的过程,有意识培养学生的应用意识和创新意识。为此,这本书\"话题篇\"中讨论的许多问题,可以作为主题式学习、特别是项目式学习的素材,这些内容大多数是初中数学内容的历史回顾和现实意义的拓展,以及与相关内容有关的数学思想和数学文化。\n与写给小学数学教师和高中数学教师的那两本书类似,这本书也回答了初中数学教学中最为本质的30个问题,以及作为知识拓展的30个话题。可是统览三本书的问题和话题,发现结构编排不尽合理,前后逻辑不尽顺畅,这是三本书分别撰写使然。或许,我还需要花费一些时间,重新规划三本书的写作体例,重新设计问题和话题,因此,可能还要出版这套书的第二版,就像刚修订好的《数学思想概论》第二版那样,三卷本同时付印。\n我希望这本写给初中数学教师的书也能够受到欢迎,对《义务教育数学课程标准(2022年版)》的理解和实施有所帮助。也欢迎读者提出意见,作为修订第二版的参考。\n史宁中\n2024年7月于长春\n问题篇\n第一部分 数学的定义、命题与推理\n问题1 什么是数学的定义?\n定义是为了表达数学的研究对象 / 最初的定义是名义的:以公理体系作为保障 /\n揭示内涵的\n实质定义:以充分必要条件作为保障 / 系词结构的表达形式:属加种差 /\n表示关系的术语\n问题2 什么是数学的命题?\n供判断的陈述句 / 提供判断:与语境无关 / 只供判断:与推理无关 /\n为了判断:性质命题的\n所指项必须定义清晰 / 关系命题是数学结论的表达形式 /\n关系命题不能成为论证形式\n问题3 为什么基础教育阶段的数学不说公理、只说基本事实?\n公理不是不证自明的真理,而是构建体系的假设 /\n现代公理体系:刻画不加定义概念的全部\n特征和概念之间的关系 / 全等需要五个公理:边角边是为其一 /\n只能表述为基本事实\n问题4 什么是数学的推理?\n推理是命题判断到命题判断的思维过程 /\n简单推理的形式:前提命题、论证命题、结论命题 /\n逻辑推理是具有传递性的推理 /\n归纳推理与演绎推理:命题适用范围单向传递的变换\n问题5 什么是代数的推理?\n几何推理是图形的推理 / 代数推理是符号的推理 /\n源于几何公理的两个代数基本事实 /\n曹冲称象的代数推理 / 学会计算与证明:照葫芦画瓢的逻辑 /\n更贴近日常生活的推理\n第二部分 数与代数\n问题6 如何理解分数和小数的现实意义?\n小于整数单位的量的表达 / 分数是整数单位的等分 / 古埃及重视单分数的表达 /\n中国古代\n分数单位的表达 / 用分数表示周天立度 / 小数是十进制的细化 /\n从有名小数到无名小数\n问题7 如何理解分数和小数的数学意义?\n分数表达整数间的比例关系 / 音频周期的重合与音乐和弦 /\n分数乘法与除法运算的道理 /\n有理数称谓的由来 / 小数表达有理数的必要与可能 /\n初中数学强化用小数表达实数\n问题8 如何理解负数?\n负数的现实意义:对数量的抽象;数量相等、意义相反 /\n负数的数学意义:正数的相反数;\n自然数为什么要从0开始 / 绝对值表示相等数量 /\n绝对值越大的正数越大、负数越小\n问题9 如何理解初中数学中的有理数运算?\n> 初中数学数域的扩充:从非负有理数到包含负数的有理数 /\n> 初中数学运算的核心是有负数参\n>\n> 与的四则运算 / 代数推理的发端:加一个正数比原来的数大 /\n> 形式化证明负负为正\n问题10 什么是代数式的表达与运算?\n符号表达的关键不是表达未知数 / 数的表达与代数式的表达 /\n数的运算与代数式的运算 /\n符号表达的公式和算律具有一般性 /\n代数式表达的数量关系是构建方程和函数的基础\n问题11 如何理解方程?\n方程中的等号表示等量关系 / 方程是数量关系的细化:一般的与特指的 /\n列方程需要讲两个\n或两个以上的故事 / 不适于列方程解决的四则运算问题 /\n中国古代方程的表达与运算\n问题12 为什么说韦达定理是代数学的发端?\n字母的功能:从数字运算到类型运算 / 方程的代数表达:用字母表示方程的系数\n/ 一元二次\n方程根的显示表达 / 韦达定理:一元二次方程根与系数的关系 /\n韦达定理的推广与群论\n问题13 如何理解函数?\n函数是数学分析的研究对象 / 函数定义的历史演变 /\n抽象的层次:从形式述说到变量述说、\n从对应述说到关系述说 / 初中函数定义的两个问题 /\n为什么必须是实数到实数的对应\n第三部分 图形与几何\n问题14 为什么说数轴和绝对值是数形结合的发端?\n初中数学对绝对值的误解 / 绝对值是数量多少的表达 /\n数形结合是一种理念:类比数轴上点\n的连续想象实数的连续 / 数学研究对象是抽象的存在 /\n数与点的对应到数量与距离的对应\n问题15 如何理解反证法的推理逻辑?\n不可或缺的数学证明方法 / 反证法正确性的验证 /\n反证法的论理基础是矛盾律和排中律 /\n证明素数有无穷多个 / 证明根号2是无理数 / 反证法的效能 /\n只能用反证法证明的例子\n问题16 如何理解尺规作图的教育价值?\n尺规作图的限制源于欧几里得几何公设 / 理解直尺和圆规的作图功能 /\n尺规作图不是技能\n的学习、而是想象的实践 / 感悟抽象图形的存在 / 培养几何直观和空间想象能力\n问题17 如何理解和表达图形的运动?\n欧几里得几何没有涉及图形运动 / 运动需要参照物 / 平面图形的参照物是二维的\n/ 三种运\n动都是刚体运动 / 刚体运动的几何不变量:任意两点间距离 /\n通过刚体运动理解全等\n问题18 相似图形的本质是什么?\n从线段的比例到图形的相似 / 多边形相似的定义:对应角相等、对应边成比例 /\n三角形相似\n只需要对应角相等 / 平行线切割定理是定理 /\n图形相似的基本事实应当是相似图形存在\n问题19 如何理解初中数学中的三角函数?\n初中数学的函数也应当是实数到实数的对应 / 角度不是实数、长度才是实数 /\n初中数学的三\n角函数不是函数、而是直角三角形边角关系的表达 / 中国古代的数学的眼光\n问题20 为什么只有五种正多面体?\n毕达哥拉斯学派的重要贡献 / 构成多面体基本要素:顶点、棱、面 /\n欧拉公式:表达要素之\n间的数量关系 / 用面的个数计算棱的个数 / 用顶点的个数计算棱的个数 /\n整数解的个数\n问题21 什么是空间与空间观念?\n空间与时间是认识现实世界的概念 / 宇宙是空间和时间 /\n度量时间的秒和度量空间的米 /\n从三维物体形状到二维空间表达 / 点、线、面是抽象的概念 /\n多维和无穷维空间的想象\n问题22 如何理解一笔画?\n哥尼斯堡七座桥问题 / 点与线的关系:拓扑学的发端 /\n最一般的变换:不改变空间的维数 /\n用网络表达变量之间最一般的关系 /\n用有向无回路的贝叶斯网表达变量之间的因果关系\n第四部分 统计与概率\n问题23 如何理解随机事件和概率?\n用数学语言表达随机现象 / 随机事件是可重复发生的随机现象 /\n概率是随机事件发生可能\n性大小的度量 / 概率是随机事件的固有属性 /\n数学表达:集合的子集与大小的度量\n问题24 统计学的思想方法是什么?\n概率论是基于思辨的:定义概率 / 统计学是基于事实的:估计概率 /\n数据蕴含背景的信息 /\n研究对象是数据、结论获得是归纳、结果判断是好坏 /\n随机决策:大数据分析与机器学习\n问题25 如何理解样本和总体?\n随机变量刻画随机现象 / 随机变量取值概率是确定的 /\n总体是随机变量取值的概率分布 /\n样本是来自总体的随机变量 / 随机变量的两重性:通过样本认识总体 /\n样本特征与总体特征\n问题26 为什么要把百分数纳入统计的内容?\n代数意义的比:稳定的百分数 / 统计意义的比:随机的百分数 /\n采用不同的教学方法:果汁\n的含量与投篮的命中率 / 随机决策的判断准则和有效工具 /\n用百分比估计和表达概率\n问题27 如何理解数据分组的原则?\n不同数据提供不同信息:数据压缩的有效手段 / 大数据的特征提取 /\n确立判断好坏的原则 /\n合理的分组原则:组内差异尽可能小、组间差异尽可能大 /\n有效的数学表达:离差平方和\n问题28 如何理解分步式算法?\n传统计算机优势:可以迭代的智能计算 / 构建具有传递性的算法逻辑 /\n大数据分析的挑战 /\n实现多台计算机的并行计算 / 实现网络数据的瞬时计算 /\n回归加法就是回归计算的本源\n问题29 如何理解数据的平均状态?\n集中趋势与问题背景 / 加权平均:基于并联的加法运算 /\n几何平均:基于串联的乘法运算 /\n调和平均:基于平行的倒数运算 / 适用于场合的不同 /\n三种平均状态数值间的大小关系\n问题30 如何理解定性数据定量化?\n数字化是将信息转变计算机处理的格式 / 定性数据包括名义数据和顺序数据 /\n名义数据包括\n命名数据和标记数据:事物的表达和属性的标记 /\n顺序数据提供的有效信息可用于随机决策\n话题篇\n话题1 数学概念定义的基本原则\n话题2 数学命题判断的基本原则\n话题3 三段论与数学的证明\n话题4 基于公理体系和运算法则的四则运算\n话题5 有理数与音乐的故事\n话题6 算术基本定理与素数的分布\n话题7 杨辉三角形与圆周率的有理数表达\n话题8 如何理解无理数\n话题9 实数与自然数的共性和差异\n话题10 复数与代数基本定理\n话题11 时间的表达与数学模型\n话题12 六十进制与中国古代纪日纪年\n话题13 勾股数与太阳的高度\n话题14 中国称谓的由来\n话题15 地球球形的认知与经纬线\n话题16 平行线公理与三种类型的几何\n话题17直角坐标系的提出\n话题18 极坐标与球坐标\n话题19 欧几里得全等公理的局限性\n话题20 公理体系的合理性\n话题21 距离和基于距离定义的几何\n话题22 尺规作图的最大范围\n话题23 数学表达:与时间无关的比例模型\n话题24 数学表达:与时间有关的比例模型\n话题25 数学表达:人的关于对称美的感觉\n话题26 海量数据、高维数据、大数据\n话题27 信息的数学度量\n话题28 随机指标的数学表达\n话题29 数学的抽象结构与模式\n话题30 数学模型是用数学的语言讲述现实世界的故事\n\n问题篇\n第一部分 数学的定义、命题与推理\n小学数学到初中数学最重要的变化,就是开始建立数学概念、尝试进行数学推理,其中的数学概念是通过数学定义和数学命题表述的,于是就有了这一部分的题目。\n数学的推理是有逻辑的,数学教育能够培养人的逻辑思维能力,这似乎是一个不争的事实,可是,数学推理的逻辑是如何体现的呢?什么样的推理才是有逻辑的推理呢?或者更简洁地说,是通过推理结论是否正确进行判断吗?还是通过推理过程是否环环相扣、步步有据进行判断呢?对于数学教育、甚至对于逻辑学和认识论,都应当明确回答这些问题。我们将在这一部分回答问题。\n推理是命题判断到命题判断的思维过程,数学推理是数学命题判断到数学命题判断的思维过程。这样,数学推理就涉及数学命题,因此,这一部分还必须讨论数学命题。现行初中数学教材普遍认为,命题是一个判断语句,这是不确切的,命题是一个供判断的语句。这就意味着,数学命题可能正确、也可能不正确,但是,数学命题本身不承担判断的任务,判断是数学的任务,更确切地说,是数学活动的参与者的任务,这里所说的参与者包括教育者和学习者、更包括数学命题的创造者。\n为了能够进行数学的判断,数学命题的表述必须清晰,因此,数学命题中的所指项必须定义清楚,这样,数学推理还涉及数学定义。数学定义是对数学研究对象的述说,人们普遍以为,一个好的数学定义必须能够揭示数学研究对象的内涵,但事实并不如此。数学的研究是抽象的,因此,数学的研究对象不可能是现实的存在、而只能是抽象的存在,数学最基本的研究对象的述说只能是名义的,这是因为,研究对象的任何具有物理属性的述说都会引发悖论。\n欧几里得几何影响如此之大,以至于人们把几何证明等同于演绎推理、甚至等同于公理化推理。但是,现代数学的发展表明,公理并不是不证自明的真理,只是一种假设,因此课程标准用基本事实替代公理,强调的是逻辑推理、而不是公理化推理。并且,课程标准增加了代数推理的内容,并且给出了适用于代数推理的两个基本事实。这些,也都是这一部分要讨论的内容。\n那么,应当如何理解\"数学定义\"\"数学命题\"\"数学推理\"这三者之间的关系呢?我想,最合适的表述大概就是《墨经·小取》所说的\"以名举实,以辞抒意,以说出故。\"我们将在这一部分的最后一个段落,给出解释。\n问题1 什么是数学的定义?\n在形式逻辑的教科书中,对定义的描述大体是,定义是揭示研究对象内涵的逻辑方法[^3]。这个描述似乎非常深刻,这个描述对定义的功能寄托了很大的期望。但是,数学定义的演变过程说明,这种深刻的要求对于数学最本源、最基本概念是不可行的。我们分析如下。\n欧几里得《原本》是用揭示内涵的方法定义数学概念的最早的实践者,这部著作是从点、线、面的定义开始的[^4]:\n1.点是没有部分的。 2.线只有长度而没有宽度。 5.面只有长度和宽度。\n基于这样的定义、以及规定了的五个公理和五个公设,欧几里得就用演绎推理的方法,论证了一系列数学命题、特别是一系列几何命题。至少是从欧几里得开始,这种形式逻辑的论证方法成为数学研究的典范,引领了数学二千多年的发展;事实上,这样的论证方法也成为科学研究的典范,以至于科学家牛顿的伟大著作《[自然哲学之数学原理](http://baike.baidu.com/view/44630.htm)》也模仿了欧几里得的写作风格。\n可以看到,欧几里得的定义试图揭示几何学最基本概念的内涵,抽象地表达了人们对于基本图形的感觉。但是,这样的定义至少存在两个本质上的弊病。\n第一个弊病是关于内涵的。欧几里得的定义令人费解,所说的没有部分是什么东西呢?特别是,欧几里得论证的第一个命题1是\"对给定线段作等边三角形\",在论证过程中,欧几里得不加任何解释就利用了\"两条线相交必然交于一点\"这样的结论。现在就引发了问题:两条线相交,怎么能交于没有部分的地方呢?如此仔细追究下去,貌似严谨的欧几里得几何就必然会漏洞百出,而造成漏洞的原因就在于那些企图揭示内涵的定义。\n第二个弊病是关于外延的。根据欧几里得的定义,我们能够举例说明什么是\"点\"吗?比如,感官告知我们\"空气\"是没有部分的,那么是不是可以说\"空气\"是\"点\"呢?\"颜色\"也是没有部分的,那么\"颜色\"是不是点呢?显然,利用欧几里得的定义很难进行判断。\n如果一个定义,既解释不清内涵、又确定不了外延,那么这个定义还有什么意义呢?无论如何,人们还是非常宽容的,不到万不得已是不会轻易进行改变的,至多是千方百计地进行解释。可是,万不得已的时候还是到来了,原因并不是因为几何学,而是因为一个强大的数学工具微积分的出现。虽然微积分威力无比,可是数学家解释不清楚其中的道理是什么,后来人们逐渐认识到,为了合理地解释数学体系,必须重新认识数学最基本的研究对象,必须把人们对\"形\"的几何直观与对\"数\"的符号表达有机地结合起来,因此需要有效地表达几何学最基本的研究对象。\n需要不加定义的基本概念。射影几何学创始人、德国数学家帕施明确意识到,在一个几何公理体系中,必须要有不加定义的基本概念,因为只有这样,才能使得这些基本概念完全摆脱图形的直观和物理属性的约束;此外,帕施还意识到,在一个几何公理体系中,所给出的公理必须能够刻画那些不加定义概念的全部特征、以及这些概念之间的关系,在这个意义上,公理并不是过去人们所认为的不证自明的真理,而仅仅是人们用以构建不同几何体系的假设。他在1882年出版的《新几何讲义》中谈出了自己的想法[^5]:\n如果几何学要成为一门真正演绎的科学,那么必不可少的是:做出推论的方式既要与几何概念的意义无关,又要与图形无关;需要考虑的全部东西只是命题和定义所断言的几何概念之间的联系。\n上个世界最伟大的数学家之一希尔伯特,在1899年出版的著作《几何基础》实现了这样的想法,模仿欧几里得的《原理》,希尔伯特也把定义写在著作的开篇[^6]:\n设想有三组不同的对象:第一组的对象叫做点,用A,B,C,...\n表示;第二组的对象叫做直线,用a,b,c,...\n表示;第三组的对象叫做平面,用α,β,γ,...\n表示。点也叫做直线几何的元素;点和直线叫做平面几何的元素;点、直线和平面叫做空间几何的元素或空间元素。\n乍一看上面的定义,人们会以为希尔伯特是在开玩笑,因为这样的定义只是用符号表示了所要研究的对象而已,这样的定义等于什么也没有说。事实也确实如此,希尔伯特所给出的定义是对欧几里得定义的终极否定:不仅没有揭示对象的内涵,甚至没有描述所要定义的对象是什么。但是,这样的理解是深刻的,正如他所论述的那样[^7]:\n欧几里得关于点、线、面的定义在数学上是不重要的,它们之所以成为讨论的中心,仅仅是因为公理述说了它们之间的关系。换句话说,无论把它们称为点、线、面,还是把它们称为桌子、椅子、啤酒瓶,最终推理得到的结论都是一样的。\n如果定义只是一种形式化的符号表示,那么定义本身就不重要了,重要的是研究对象的性质、以及研究对象之间的关系。于是,在给出研究对象的符号表达的定义之后,《几何基础》提出了五组公理来确定研究对象的性质和研究对象之间的关系,诸如前面谈到的\"两条直线相交必然交于一点\"这样的问题也就迎刃而解了。有了公理体系作为保障,确实不需要那些\"揭示研究对象内涵\"的定义了,我们称这样的定义为名义定义。\n名义定义。是指对某一类数学研究对象标明符号或指明称谓。比如,前面所说的希尔伯特对于几何学基本研究对象的表述,就是标明符号;再比如自然数的定义,用汉语\"二\"、英语用\"two\"称谓两个小方块的数量,但共同用符号2表示这个数量,就是指明称谓。事实上,只有这样的无任何物理属性的定义,才可能真正避免悖论的出现,凡是具体的述说必然会引发反例[^8]。\n下面,我们通过一些名义定义的实例,探讨名义定义的表达模式,分析其中的逻辑内涵[^9],比如,考虑这样两个名义定义:\n称这样的数量为3。\n称这样的图形为线段。\n第一个定义是对研究对象标明符号,第二个定义是对研究对象指明称谓,其中\"这样的数量\"\"这样的图形\"是所要定义的东西,称为被定义项,\"3\"\"线段\"是定义出来的东西,称为定义项。在这样的定义中,被定义项往往是具体的东西:\"这样的数量\"可以是三个小方块、也可以是三个小圆圈,是对数量的抽象;\"这样的图形\"可以是一条直线段、也可以是几条直线段,这是对图形的抽象。这样的定义看似简单,但逻辑内涵却很复杂。\n如果用x表示被定义项,用\nA表示定义项,那么可以把上面的述说表示为\"x→A\"的形式。表达式中的符号x\n容易理解:是一个或者几个具体的东西;但符号A需要这样理解:表面看是A是一个名词,蕴含的是一个东西,但在实际上A却是一个集合或者一个类,表示的是一种数学共性。比如,在第一个定义中,A表示所有数量是3的那些东西的数学共性;在第二个定义中,A表示的是所有图形是线段的那些东西的数学共性。这样,表达式述说的是一个数学抽象过程:x\n表示具体的对象,→ 表示抽象的过程,A表示抽象的结果。\n有了这样的关于\"点\"的符号化的定义,就可以用\"点\"的符号与表示\"数\"的符号对应。因为在数轴上,所说的点是在说点到原点这个线段的长度,这就实现了线段长短与数量多少的对应,实现了几何与算术的结合(参见问题14的讨论)。在此,我想强调的是,人对于数量多少的感知和对距离远近的感知是本能,这两种本能是人对数学认知的出发点,因此,应当作为数学学习的起点[^10];同时,这两种本能的数学特征是一致的,这就是传递性。如同问题4将要讨论的那样,传递性是推理逻辑性的思维基础,这样,合理的思维基础也是源于人的数学认知的本能。\n实质定义。是指用揭示内涵的方法对数学的研究对象赋予称谓。虽然数学实质定义是数学教材普遍采用的定义方法,但必须注意的是,数学实质定义话语的准确性往往依赖名义定义,特别是基本概念的实质定义。考虑下面两个实质定义:\n偶数是能被2整除的自然数。\n三角形是由三条线段端点首尾相接组成的平面图形。\n在第一个定义中,首先需要明晰\"自然数\"和\"整除\"这两个最为基本的概念,其中自然数的概念源于名义定义;整除针对的是除法、除法是乘法的逆运算、乘法由加法的扩张得到、加法源于名义定义;因此,这两个最基本的概念都源于名义定义。在第二个定义中,需要明晰\"线段\"和\"线段端点\"这两个最为基本的概念,如前所述,也都源于名义定义。\n实质定义揭示的是\"被定义项\"的实质,这里所说的实质往往是性质,比如:偶数的性质是能被2整除;三角形的性质是三条线段端点首尾相接。如果\"定义项\"能够形成一个集合,那么\"被定义项\"恰好是这个集合的一个子集,比如,偶数是\"自然数\"这个集合的一个子集,三角形是\"平面图形\"这个集合的一个子集。如果用P表示性质,分别用A和B表示被定义项集合和定义项集合,那么实质定义是一个具有系词结构的陈述句,可以用符号表述为:\nA 是B中具有性质 P 的子集 ⇔ x∈A,则 x∈B并且x→P成立\n因为在生物学的分类中,种是隶属于属的,比如,人这个种隶属于动物这个属。这样,借用生物学的语言,在上述陈述中,称被定义项、集合A为种,定义项、集合B为属;集合A中的元素是集合B中的元素、并且具有性质P,称这样的性质P为种差。如果集合B中存在不具有性质P的元素,那么这样的定义就确定了集合B中的一个真子集A,可以赋予特殊的称谓。借助生物学的概念,人们称这样的具有隶属关系的定义为属加种差[^11]。\n为了数学的严谨性,数学定义只有属加种差的限制还是不够的。比如,以往小学数学教材中关于方程的定义是这样的[^12]:\n称含有未知数的等式为方程。\n在形式上,这是一个属加种差的定义,其中\"方程\"是种,\"等式\"是属,\"含有未知数\"是种差,符合属加种差定义的要求。可是,含有未知数的等式未必就是方程,比如,等式\n2x -- x =\nx是含有未知数的等式,但这样的等式表示的是符号运算而不是方程,因此,对数学定义只限制属加种差还不能满足数学严格性的要求。\n可以看到,问题出在\"种差\"与\"含有未知数\"这个性质之间的关系,\"含有未知数\"这个性质所述说的\"种差\"不足以约束构成方程的等式。虽然关系式:x∈A,则\nx∈B且x→P成立,但相反的关系式:x∈B且x→ P,则\nx∈A不成立。这样,具有系词结构的陈述句要成为数学的实质定义,那么被定义项的表达与定义项的内涵述说必须是充分必要的。也就是要求\nx ∈ A ⇒ x ∈ B,x → P\nx ∈ B,x → P ⇒ x ∈ A\n这两个关系式同时成立。通常把第一个关系称为充分条件,第二个关系称为必要条件,两个关系合在一起称为充分必要条件。对于数学实质定义,被定义项的称谓与定义项的内涵述说必须充分必要,或者更确切地说,被定义项确定的集合与定义项确定的集合必须等价。\n下面,我们从数学角度再次分析方程的定义,问题的关键在于如何理解等式。等式是含有等号的式子,一般来说,等号具有两个功能:第一个功能是表示数值或抽象符号的传递关系,如问题4将要述说的那样;第二个功能是表示等号两边的数量相等。显然,方程利用的是等号的第二个功能,讲述的是两个故事,这两个故事中的某一个节点数量相等。因此,要构建方程的实质定义,除未知数这个要素外,还要突出等号的第二个功能,可以采用下述两种方法之一:或者解释清楚什么是等式,说明等式是表达等量关系的式子;或者直接给出表述等量关系定义:\n称含有未知数的表示等量关系的等式为方程。\n可以看到,这样的具有了充分必要条件的方程定义不仅体现了数学的严谨性,而且有利于学生理解和把握方程的本质。需要再次强调的是,数学实质定义是以数学名义定义为基础的,正因为数学定义经历了由名义到实质的过渡,才使得数学定义在表述上清晰准确、在逻辑上无懈可击,为数学的严谨性奠定了坚实的基础。\n问题2 什么是数学的命题?\n如果说数学的研究对象是通过数学定义表述的,那么数学的研究结果就是通过数学命题表述的。我们先讨论一般形式的命题,然后再专门讨论数学命题。\n就语言表达形式而言,与实质定义一样,大多数的命题也是一个陈述语句,但是,命题的功能与定义的功能有着本质的区别,命题不是为了给一个事物命名,而是为了述说已经命名了的事物的性质、关系、或者规律,这样,命题就具有特殊的逻辑结构,这样的逻辑结构体现于特殊的语言结构。并不是所有的陈述语句都能成为命题,正如亚里士多德所说的那样[^13]:\n并非任何句子都是命题,只有那些自身或者是真实的或者是虚假的句子才是命题。真实或者虚假并不为任何句子所有,例如祈祷就是既无真实也无虚假的句子。\n但是,我国的几乎所有形式逻辑的教科书,都过分强调了命题与判断的关联,关于命题的论述都隐含着\"命题就是判断\"的指向[^14]。这样的认识,深刻地影响了我国的数学教育,比如,我国现行初中数学教材普遍认为:判断某一件事情的句子叫作命题。这是不确切的。\n命题只是一个陈述句,述说的事情可能是正确的、也可能是错误的。如奥地利籍英国哲学家维特根斯坦从形而上的角度所表述的那样[^15]:\"命题的意义是事态而不是事实,这样才能保证命题为真或者为假,才能保证错误命题的意义。\"这样,命题就为人们提供了判断[^16]:或者通过经验的事实进行实证判断,或者通过逻辑的方法进行分析判断。人们通常称前一种判断为综合的,后一种判断为分析的。\n于是,我们可以认为:命题是一个可供判断正确或错误的陈述句。为了更好地理解数学命题,我们还必须强调数学命题与通常所说命题的不同之处。\n数学命题必须提供判断、与语境无关。数学命题述说的是数学研究对象的事情,数学命题的述说必须能从数学角度进行判断,或者判断是正确的、或者判断是错误的,也就是说,数学命题必须提供数学判断的可能。比如,下面关于三角形的陈述句\n这个三角形是白的。\n就不能从数学的角度进行判断,因此,这个陈述句可以是一个命题,但不能成为数学命题。\n事实上,所有谓词是形容词的陈述句都不能成为数学命题,这是因为,数学的研究对象是通过抽象得到的,抽象的核心就是舍去与研究对象关联的事物的物理属性,而形容词恰恰是对事物物理属性的描述,是对那些已经舍去了的东西的描述。王力甚至认为[^17],在所有含\"是\"的语句中,只有当谓词是名词时才能作为系词,这样的语句才能构成系词结构。虽然王力的认识过于极端,但这样的认识对于数学命题的界定却是合适的。\n这样,我们可以认为,数学命题与命题表达的语境无关。现代哲学有一个流派,非常重视语义学、重视话语的语境对事物的表达以及对思想者思维的影响[^18]。但是,正如我们多次强调的那样,数学的研究对象是高度抽象了的、并不是真实的存在,这就意味着,数学命题的意义与判断者所处的时间、地点、环境无关,甚至与他们的心境无关。也只有这样,才能保证数学的结论具有一般性,才能保证数学的结论具有某种类似真理的属性。\n数学命题只能提供判断、与推理无关。如前所述,许多数学教科书认为\"数学命题是判断真伪的陈述句\"是不正确的。虽然数学命题陈述句必须提供判断,但数学命题本身却不承担判断真伪的任务,判断一个数学命题正确与否是数学推理的任务。比如,对于数学命题而言,陈述句\"三角形内角和是180度\"与\"三角形内角和是120度\"是等价的,因为都提供了数学判断的可能性。事实上,只有站在欧几里得几何的立场,才可以判断:第一个命题是正确的、为真,第二个命题是错误的、为伪。但是,如果站在罗巴切夫斯基几何的立场,在适当的假设下,可以判断:第一个命题是错误的、为伪,第二个命题是正确的、为真,有兴趣的读者可以参见话题16的讨论。\n数学命题的两种形式。一般来说,就命题表述的内容而言,数学的命题只有两种表达形式,一种是性质命题,一种是关系命题。\n数学的性质命题。数学性质命题述说数学研究对象所具有的性质,通常由系词\"是\"或者\"不是\"构成的陈述句,前者是肯定形式、称为正命题,后者是否定形式、称为否命题。比如,\n实数是可以比较大小的。\n这个三角形不是直角三角形。\n第一个是正命题,述说了\"实数\"具有的性质;第二个是否命题,述说了\"这个三角形\"不具有的性质。每一个性质命题都被系词\"是\"或者\"不是\"划分为两个部分,称前半部分为所指项、述说的是数学研究对象,后半部分为命题项、述说的是研究对象所具有的性质。与汉语语法结构对应,所指项相当于系词结构中的主词、命题项相当于系词结构中的谓词。\n为了数学判断的可能性,数学性质命题中的所指项必须定义明确:或者用名义定义的形式,以公理体系作为定义的支撑;或者用实质定义的形式,以充分必要条件作为定义的支撑。比如,如果把上面的第一个命题表述为\n数是可以比较大小的,\n那么,我们将无法对这个命题进行数学判断。因为,在判断之前,需要明晰这里所说的\"数\"的概念,比如,是否包含复数、四元数等等。\n为此,我们作出这样的规定,如果用A表示数学性质命题中的所指项,那么A必须能够表示成为一个集合或者一个元素,比如,第一个性质命题中的A表示\"实数\"的集合、第二个性质命题中的A表示\"这个三角形\"的元素。如果用P表示命题项所述说的性质,用符号\"→\"表示系词\"是\"、用符号\"~\"表示系词\"不是\",那么上述两个性质命题语言结构可以用符号表达为:\n正命题:a∈A,a → P;即A中的元素具有性质P;\n否命题:a∈A,a ~ P;即A中的元素不具有性质P。\n与所指项不同,命题项性质P的述说可以相对模糊,甚至很难用一个确切的集合表示满足性质P的所有元素。比如,命题项\"可以比较大小\"这个述说就相当模糊,即便如此,这个命题本身是可以进行数学判断的,因为只需要知道命题中\"所指项\"与\"命题项\"之间的关系。但有一类性质命题是特殊的,这就是主谓对称的性质命题。\n主谓对称的性质命题。是指性质命题中,所指项包含的元素和命题项包含的元素均能表示为集合,并且这两个集合等价。比如,把勾股定理写成具有系词结构的性质命题:\n直角三角形是一条边长的平方等于其他两条边长平方之和的三角形。\n那么,这个性质命题就是主谓对称的。\n如果用A表示所有的\"直角三角形\"所组成的集合,用P表示性质\"一个边长的平方等于其他两条边长平方之和\",用B表示满足性质P的所有元素组成的集合,那么,可以用符号表达上述性质命题的主谓对称的关系:\na ∈A → a∈B;a ∈B → a∈A。\n这就意味着,两个集合之间存在等价关系:A≡B。\n因此,主谓对称的性质命题等价于:性质命题的\"所指项\"与\"命题项\"之间充分必要。我们曾经说过,满足充分必要条件的陈述句可以构成实质定义,因此也可以如下定义直角三角形:\n称一条边长的平方等于其他两条边长平方之和的三角形为直角三角形。\n虽然这样的定义在逻辑上没有问题,但人们还是习惯用最直接的语言表述数学定义,比如,称有一个角是直角的三角形为直角三角形。\n主谓不对称的性质命题。是指命题的\"所指项\"与\"命题项\"充分但不必要,即研究对象定义的内涵与命题性质的内容不等价,更具体地说:研究对象具有命题中所述说的性质,但具有性质的那些东西并不只限于研究对象。比如,分析下面的性质命题\n加法是满足交换律的运算。\n其中\"加法\"是研究对象A、\"交换律\"是命题性质P。虽然加法运算满足交换律,但满足交换律的运算并不只限于加法,比如还有乘法。\n我们曾经讨论过\"称含有未知数的等式\"作为方程的定义是不合适的,原因就是因为这样的陈述句不是充分必要的,但是,可以把这个陈述句写成主谓不对称的性质命题\"方程是含有未知数的等式\",这个命题无疑是正确的。\n由此可见,如果不是为了数学的定义、仅仅作为数学的命题,那么,就不需要认真探讨陈述句中的命题项所述说的确切含义。\n数学的关系命题。数学的关系命题陈述研究对象之间的关系,比如,希尔伯特在用符号表达了研究对象之后,就以公理的形式表述了研究对象之间的关系:\n对于两点A和B,恒有一直线a,它同A和B这两点的每一点相关联。\n对于两点A和B,至多有一直线,它同A和B这两点的每一点相关联。\n通常把上述两个公理归结为一个基本事实:两点确定一条直线。因为两个公理都表述了点与直线这两个研究对象之间的关系,因此都是关系命题。\n在一般情况下,关系命题可以写成\"如果 ...,那么\n...\"的形式,称\"如果\"引导的话语是命题的\"条件\",\"那么\"引导的话语是命题的\"结论\"。因为引导的话语通常是性质命题,因此关系命题通常由两个性质命题组成。比如,可以把上面希尔伯特所构建的基本事实改写成标准的关系命题:\n如果存在两个不同的点A和B,那么存在且唯一存在一条直线a同A和B这两点关联。\n因为所有的数学定理都需要条件,因此关系命题适用于数学定理的表达,但必须注意到:关系命题是数学结论的表达、而不是数学结论的论证,所以关系命题只是数学推理过程中的一个判断对象。这就意味着,数学推理过程的载体至少需要三个性质命题,如同问题4将要讨论的简单推理,这三个性质命题依次称为:条件命题、论证命题、结论命题。\n问题3 什么基础教育阶段的数学不说公理、只说基本事实?\n对于基础教育阶段的数学教师、特别是对于中学的数学教师,这是一个很难回答、但又必须回答的问题。现在,我们认真分析这个问题。\n基本事实是数学证明的依据。比如,小学数学中\"三角形两边之和大于第三边\"这个命题,教师在教学活动中通过各种操作说明这个命题是正确的,但是,所有的说明都是个案的、不能成为证明;这个命题的证明需要依据\"两点间直线段最短\"这个基本事实,是说,两点间可以有各种各样的连线,其中最短的那条连线是直线段。因此,所谓的证明,就是述说所要证明的那个命题是这个基本事实的特例,比如可以表述,设这个三角形的三个端点分别为A、B、C,那么两边之和\nAB +\nBC是连接A和B两点的一条折线,是两点间各种各样连线中的一种,根据基本事实,折线一定大于直线段AB,因此命题是正确的。\n因为传统的中学数学教材,称现在所说的某些基本事实为公理,于是就认为,过去教材的几何证明是基于公理体系的,而现在称为基本事实便是忽视了基于公理体系的教学,这个说法是不确切的。\n公理体系的演变。我们所说的公理体系是从欧几里得几何开始的,但是,为了追求公理体系的相容性和完备性,现代数学的公理体系发生了很大的变化。欧几里得几何主要是指《原本》这部著作,希腊文书名\nΣτοιχεία 是希腊文定理 ∑τоιχεiоν\n这个词的复数形式,因此是《诸定理》的意思[^19];拉丁文译本为Elementa,现代西方沿用拉丁文译名,英文翻译为\nElements,是\"原理\"的意思;中文译名为《几何原本》,中文\"几何\"这个数学名词也由此产生。\n关于欧几里得的生平所知甚少,现在普遍认为[^20]:欧几里得大约生于公元前325年,死于公元前265年。欧几里得早年在雅典学习,后受托勒密一世的邀请来到亚历山大图书馆。因为欧几里得活跃的时期比亚里士多德大约晚50年左右,因此,他的思想应当受到亚里士多德学说的影响。\n欧几里得几何的显著特征表现在几何定义、公理公设、定理证明三个方面,简要分析如下。关于几何学研究对象的定义,我们在问题1中已经进行了详细的分析,说明对于几何学最基本的研究对象,欧几里得的基于内涵的定义是不可以的,后来希尔伯特使用了名义定义,用符号表示研究对象。\n欧几里得重要的工作是给出了公理和公设,开创了公理体系的先河,这对数学、乃至整个科学的贡献怎么评价都不过分。欧几里得给出了五个公理和五个公设。五个公理是[^21]:\n1.等于同量的量彼此相等。\n2.等量加等量,其和相等。\n3.等量减等量,其差相等。\n4.彼此能重合的物体是全等的。\n5.整体大于部分。\n可以看到,这五个公理是超出数学的,符合人们生活的经验和思维的常理,在本书的话题1我们还将看到,这样的述说也符合亚里士多德对公理的要求。同时,这五个公理的表述简洁高雅,充分展现了数学的美。五个公设是:\n1.由任意一点到任意一点可以作直线。\n2.一条有限直线可以继续延长。\n3.以任意点为心及任意的距离可以画圆。\n4.凡直角都相等。\n5.同平面内一条直线和另外两条直线相交,若在某一侧的两个内角的和小于两个直角,则这两条直线经无限延长后在这一侧相交。\n这五个公设都是关于图形的假设,也符合亚里士多德对于公设的要求,即公设比公理更侧重学科。前三个公设是关于作图的假设,最终成为后世数学家确认\"尺规作图\"的依据,一直影响到今天的初中数学教学。第四个公设是必要的,假设所有的直角相等,也就确定了线段垂直的一致性。\n第五个公设的叙述繁杂,可以体会到欧几里得的犹豫不决。到了十六世纪,人们开始思考替代表述模糊的平行线公设,英国地质学家、数学家普莱费尔给出了最经典的平行线公理,影响至今:\n过已知直线外一点,存在且仅存在作一条直线与已知直线平行。\n再后来数学家发现,不改变欧几里得几何的其他公理和公设,只改变第五公设,构建的几何学也是合理的,并且也有着明确的现实背景,这就是后来人们认定的[^22]:存在无数条平行线的罗巴切夫斯基几何和不存在平行线的黎曼几何。\n这样,人们开始意识到,公理并不是过去人们所以为的那些不证自明的真理,而仅仅是人们用以构建不同几何体系的假设。于是有问题1中数学家帕施所说,在一个几何公理体系中,所给出的公理必须能够刻画那些不加定义概念的全部特征、以及这些概念之间的关系,这才有希尔伯特重新构建几何公理体系的著作《几何基础》。因此对于现代数学的研究、包括现代数学的教育,凭借几个公理就认为建立了公理体系是不符合实际的。\n事实上,对于基础教育阶段的数学,很难确定哪些命题可以作为公理、哪些命题不可以作为公理,比如\"两点间直线段最短\"这个命题[^23],于是《义务教育数学课程标准(2022年版)》把这个命题作为一个基本事实;同样,也把平行线公理作为一个基本事实;进一步,为了减少证明的难度,把传统的平行线判定定理\"两条直线被第三条直线所截,如果同位角相等,那么这两条直线平行\"也作为一个基本事实。可以看到,这样的变化符合数学公理体系的演变。\n欧几里得公理体系中的两个问题。我们讨论了欧几里得的具有物理属性的定义、以及第五公设所引发的问题,下面,分析欧几里得公理本身存在的两个问题,以及人们后来是如何弥补的,希望在这样的过程中再次体会:为什么不能凭借几个公理就认为建立了公理体系。\n第一个问题是关于全等。公理第4条使用\"重合\"这样的意义不明确的术语述说图形的全等,后来希尔伯特在他所创建的几何公理体系中,用一组五个公理述说了图形全等所需要假设,并且为这组公理起名为合同公理,《义务教育数学课程标准(2022年版)》把希尔伯特几何体系中合同公理的第五个公理、即\"边角边\"作为基本事实[^24]。\n第二个问题是关于部分和整体。公理第5条说\"整体大于部分\",这个结论在有限多的情况是正确的,比如,小学生都知道,五个苹果比四个苹果多、因此5大于4;并且知道,如果两个盘子中糖块能够一一对应,那么这两个盘子中糖块的个数一样多。我们知道,这样的说法,在整个基础教育阶段的数学都不会引起歧义。\n但是,对于无限多的情况这个命题就不成立了。是说,一个集合中元素的个数不一定就大于这个集合的真子集中元素的个数,这是因为,集合中的元素可以会与真子集中的元素一一对应。比如,如下所示,正整数可以与正偶数一一对应:\n1 2 3 4 5 6 ......\n↓ ↓ ↓ ↓ ↓ ↓\n2 4 6 8 10 12 ......\n这样,如果我们认定\"一一对应等价于一样多\",那么整体大于部分这个命题就不成立了,更不可以作为公理了。事实上,如话题8所说,德国数学家康托就是用这样的思想定义了无穷:如果一个集合的元素与它的一个子集的元素一一对应,那么称这个集合元素的个数为无穷。\n上面的论述充分说明,公理体系中的那些公理,在本质上述说的是假设,如果承认这样的假设,那么就可以通过数学的推理得到相应的结论,构建一个知识体系。比如,基于三种不的平行线假设,可以分别得到欧几里得几何、罗巴切夫斯基几何和黎曼几何。\n问题4 什么是数学的推理?\n我们知道,《义务教育数学课程标准(2011年版)》确立了若干核心词,后来这些核心词拓展为数学核心素养。在述说\"推理能力\"这个核心词时,我曾经想使用\"逻辑推理\"这个词,统领演绎、归纳和类比等推理形式,但我的一位学生告诉我,这样的统领是不可以的,因为当时的数学教育界普遍认为,逻辑推理就是演绎推理,而把归纳、类比等称为合情推理。于是,为了不引起歧义,我就放弃了表述逻辑推理的想法。但也促使我思考,什么样的推理是有逻辑的推理。\n人们普遍认为,数学的推理是有逻辑的,通过数学的教育能够培养人的逻辑推理能力。但是,我们遇到了一个非常尴尬的局面:几乎所有的著作都没有明确定义,什么样的推理是有逻辑的,更没有明确说明,为什么说数学的推理是有逻辑的。或许,在回答这些问题之前还需要建立一个基本原则,用以判断推理的逻辑性,比如,是通过推理结论的对错判断推理的逻辑性吗?还是,通过推理过程是否步步有据进行判断吗?现在,我们尝试系统回答这些问题。\n在问题1和问题2我们确认,数学的研究对象是通过定义表述的,数学的研究结果是通过命题表述的。那么,数学的推理就是从数学命题判断到数学命题判断的思维过程,数学推理的功能就是得到或者验证数学命题。于是,《普通高中数学课程标准(2017年版)》把逻辑推理表述为:从一些事实和命题出发,依据规则推出其他命题的思维过程[^25]。这里所说的推出,包括得到、也包括验证。这样,解决问题的关键就转化为,如何定义逻辑推理所依据的规则。\n直观判断与分析。我们先通过一些例子,直观判断什么样的推理是有逻辑的;然后,分析推理过程的思维特征,给出逻辑推理的定义、或者说、给出逻辑推理的规则;最后,用数学符号表明规则,感悟如何用数学的语言进行表达。考虑下面的推理\n有逻辑的推理。实数可以比较大小。3和5是实数。所以3和5可以比较大小。\n无逻辑的推理。实数可以比较大小。大小是一种关系。所以实数是一种关系。\n这两个推理过程都是一环扣一环,并且步步有据,但通过直观判断可以认为:第一个推理的结论是正确的,推理过程是有逻辑的;第二个推理的结论是不正确的,推理过程也是没有逻辑的。这就说明,通过推理过程环环相扣、步步有据判断推理过程的逻辑性是不可以的。那么,是否可以通过结果的正确与否判断推理的逻辑性呢?我们再分析下面的推理\n有逻辑的推理。4=2+2,6=3+3,8=3+5。4、6、8是偶数,2、3、5是素数。所以偶数可以表示为两个素数之和。\n无逻辑的推理。4=2+2,6=3+3,8=3+5。4、6、8是偶数,2、3、5是素数。所以偶数可以表示为两个素数之差。\n第一个推理述说了得到哥德巴赫猜想的思维过程,虽然至今为止还无法断定猜想的结论是否正确,但是凭借直观,总会感觉这个推理过程是有逻辑的。第二个推理不仅结论错误,推理过程似乎也是没有逻辑的。因此,单纯凭借结果的对错判断推理过程的逻辑性是不可以的。那么,应当如何判断推理的逻辑性呢?为此,需要认真分析上述思维过程的特征。\n逻辑推理的定义。我们在问题2中说明,关系命题都是由两个性质命题组成的,适用于数学定理的表达,因此,关系命题是数学推理过程中的一个判断对象。这就意味着,数学推理过程的载体至少需要三个性质命题,我们称载体是三个性质命题的推理为简单推理,依次称三个命题为\"条件命题\"\"论证命题\"\"结论命题\"。显然,只要论证清楚简单推理的逻辑性,就可以把这样的推理过程的逻辑性拓展到一般情况。可以看到,上面的举例都是简单推理,我们分析推理过程的思维特征,总结逻辑推理的思维共性。有逻辑的推理有两个明显特征。\n第一个特征是整体性。是说,论证对象或者论证对象的替代物始终出现在三个命题中,比如在第一个例子中,实数是论证对象,3和5是实数的替代物;在第三个例子中,4、6、8是论证对象,偶数是4、6、8的替代物。而无逻辑的推理,三个命题就不一定具有整体性,比如在第二个例子中,前提命题的论证对象是实数,论证命题的论证对象却变成了大小。\n第二个特征是一致性。是说,结论命题述说的性质与前提命题述说的性质要保持一致,比如在第一个例子中,两个命题述说的都是\"可以比较大小\"这个性质;在第三个例子中,两个命题述说的都是\"表示为两个素数之和\"这个性质。而无逻辑推理,结论命题述说的性质与前提命题述说的性质就不一定是一致的,比如在第四个例子中,前提命题述说的性质是\"两个素数的之和\",而结论命题述说的性质却是\"两个素数之差\"。\n这样,如果把所说的\"整体性\"和\"一致性\"这两个推理过程中的特征统称为\"传递性\",那么,我们可以给出下面的定义\n一个简单推理是有逻辑的,当且仅当这个推理具有传递性。\n具有性质传递性的逻辑推理。用A和B表示集合,用P表示性质,用Q表示形式,那么,无论是演绎、还是归纳或者类比关于性质都具有传递,可以用数学符号表示为\n演绎推理:A→P,如果x∈A,那么x→P。\n归纳推理,归纳:x→P,如果x∈A,那么A→P。\n类比:A→P,如果A→Q且B→Q,那么B→P。\n因为都是关于性质的推理,因此称上面表述的两种形式的推理为:具有性质传递性的逻辑推理。可以看到,演绎推理是从大范围满足、论证小范围满足,因此论证的结果必然成立。之所以把归纳与和类比都视为归纳推理,这是因为这两类论证都是从特殊的结论出发,推断适用于更一般情况,论证的结果都是或然成立的。\n传统初中数学的演绎推理主要表现于几何证明,以至于人们产生了很大误解:把逻辑推理等同于几何证明,认为只有通过几何证明才能培养逻辑推理能力。为了改变这样的情况,《义务教育数学课程标准(2022年版)》做了两个方面的调整,一个方面的调整,是在小学数学增加了说理、包括几何的说理,比如,基于\"两点间直线段最短\"这个基本事实说明\"三角形两边之和大于第三边\"的道理。另一个方面的调整,是在义务教育数学内容中增加了代数推理的内容。\n问题5 什么是代数的推理?\n代数推理是数学推理的一个重要方面,是现代数学的主要论证形式,但是,在中国传统的中小学数学教育中,过分强调了几何推理,对于代数推理没有给予充分的重视。以至于在《义务教育数学课程标准(2011年版)》颁布以后,有位初中数学教研员问我,数学是不是只有几何证明、没有代数证明。我当时就意识到,中国传统的数学教育忽视了一个重要的事情,就是没有关于代数推理的述说,甚至没有提出关于代数推理的基本事实。\n于是《普通高中数学课程标准(2017年版)》增加了代数推理的内容,提出\"通过几何建立直观、通过代数予以表达\"的现代数学的论证思路;《义务教育数学课程标准(2022年版)》更是从根基上强调代数推理,这就是增加了两个适用于义务教育阶段代数推理的基本事实:一个基本事实与关系传递性有关、一个基本事实与运算传递有关。如上一个话题所说,逻辑推理规则的核心是推理过程具有传递性,因此,这两个基本事实述说的是逻辑推理的基础。\n具有关系传递性的逻辑推理。令A是一个集合,a,b和c是集合中的元素。在给定的集合A上定义\"关系\"和\"运算\",把关于关系传递性和运算传递性的基本事实分别表述为:\n关系传递。令≈是定义在集合A上的一个二元关系,称这个关系对于集合A具有传递性,如果a≈b,b≈c,则a≈c。\n运算传递。令⊕是定义在集合A上的一个运算,称这个运算对于集合A具有传递性,如果a≈b,则a⊕c≈b⊕c。\n容易验证,相等关系、不等关系、隶属关系都是定义在实数集合上的二元关系,这样的关系对于集合都具有关系传递性;如果注意到乘除运算中的正负符号,那么相等关系、不等关系对于四则运算都具有传递性,对于极限运算也具有传递性。这就是说明,通常的数学运算属于逻辑推理的范畴;并且,因为在推理过程中,运算对象的集合始终保持不变,因此通过数学运算得到的结论必然正确,这是一类特殊的演绎推理。我们称这种形式的推理为:具有关系传递性的逻辑推理。\n这样,结合上一个话题的论述,数学只包含两种类型的逻辑推理,一种是具有性质传递性的逻辑推理,一种是具有关系传递性的逻辑推理。在《义务教育数学课程标准(2022年版)》中,把上述两个具有传递性的逻辑推理表述为两个基本事实[^26]:把\"关系传递\"称为\"等量的等量相等\",把\"运算传递\"称为\"等式的基本性质\"。\n事实上,表述上述两种关系传递性的思想古已有之。比如,欧几里得五个公理中的第一个公理述说\"等量的等量相等\",这就是基于等号的关系传递性,第二个公理述说\"等量加等量和相等\"、第三个公理述说\"等量减等量差相等\",这就是基于加法和减法的运算传递性。\n下面,我们针对小学数学和初中数学\"数与代数\"内容,分别讨论两种类型的逻辑推理,因此在本质上,是讨论义务教育阶段数学教育的代数推理。\n小学数学的代数说理。再次说明,小学数学强调的是数学说理而不是数学推理。《义务教育数学课程标准(2022年版)》把小学阶段\"数与代数\"领域传统的六个主题归结为\"数与运算\"\"数量关系\"两个主题,一方面强调了抽象结构,一方面突出了代数说理。下面,我们通过两个例子,分别针对概念的教学和方法的教学,说明在小学数学中如何突出代数推理。\n概念的教学:商不变的道理。在小学数学中,\"商不变\"这个概念对小数除法等运算至关重要,是教学的重点、也是教学的难点。过去的教学,是通过整数除法举例说明商不变这个原理是正确的,于是就不加任何说明地把这个原理用于小数除法。但是,任何个案的举例都不能成为一般结论,因此,迁移运算对象的可行性是需要论证的。事实上,就数学的本质而言,除法运算是乘法运算的逆运算,任何关于除法运算的性质都需要通过乘法运算予以论证。因此,《义务教育数学课程标准(2022年版)》希望小学数学教师能够理解商不变的说理,并且如下所述,可以把这样的内容作为代数说理的典范实施于小学数学教学;甚至在现阶段,也可以实施于初中数学代数推理教学。\n提出问题 说明商不变的道理。\n数学表达 a,b,c ∈R,b ≠ 0 → a/b = (a×c)/(b×c)\n数学说理 利用演绎推理的推理规则\n前提命题(A→P)\n等式传递,a = b,b = c → a = c\n乘法传递,a = c×b → a×10 = c×b×10\n论证命题(x∈A)\n设a除以b的商为d,即a/b = d\n因为除法是乘法逆运算,a/b = d → a = d×b\n根据乘法运算的传递性,a×c = d×b×c → (a×c)/(b×c) = d\n根据等量的关系传递性,a/b = (a×c)/(b×c)\n结论命题(x→P)\n根据演绎推理的推理规则,得到的结论正确。\n这是小数数学代数说理的一个范例。可以看到,这个说理过程充分展现了演绎推理的推理规则。我们把说理的要点归纳如下。\n首先,用数学的语言表达所要验证的问题,这一步通常是被忽略的,但又是极为重要的,未来代数推理的教学,需要强调用数学的语言表达所要研究的、或者、验证的问题;其次,找到合适的论证基础,论证基础可以是基本事实、也可以是已经验证了的数学命题;然后,论证所要验证的问题是论证基础的特例、也就是说、论证命题满足论证基础的条件;最后,验证结论是否回答了所要验证的问题,整体反思论证过程是否遵循了演绎推理的推理规则。\n可以看到,论证过程充分表述了商不变原理的合理性,那么就可以理直气壮地用这个原理解释小数除法运算的算法,甚至可以用于分数约分和通分合理性的述说。\n方法的教学:多位数乘法的算法。过去我一直以为,对于小学数学教学,学生得到代数结论的思维方法也主要是归纳的方法,于是《义务教育数学课程标准(2022年版)》提出通过归纳得到算法的要求。但后来我才发现,对于小学生而言,类比的方法比归纳的方法更容易接受、也更容易掌握,可能是因为\"照葫芦画瓢\"更适于小学生的天性。新版小学数学教材普遍增加了让学生自己得到\"三位数乘以二位数\"算法的要求,下面分析,我们分析在教学过程如何使用类比的方法。\n提出问题 得到\"三位数乘以二位数\"的算法。\n数学表达 得到123×12 = 123×2 + 123×10 的算式。\n数学说理\n利用类比的方法得到计算方法。用A表示\"二位数乘以二位数\"的集合,B表示\"三位数乘以三位数\"的集合,用P表示乘法运算规则,用Q表示乘法运算形式。\n前提命题(A→P)\n\"二位数乘以二位数\"的算法运用了分配律,即\n23×12 = 23×(2+10) = 23×2 + 23×10 = 46 + 230 = 276\n论证命题(A→Q且B→Q)\n\"三位数乘以二位数\"与\"二位数乘以两位数\"形式类似,\n结论命题(B→P)\n\"三位数乘以二位数\"也可以使用分配律,即\n123×12 = 123×(2+10) = 123×2 + 123×10 = 246 + 1230 = 1476\n可以看到,为了让学生能够照葫芦画瓢得到\"三位数乘以二位数\"的算法,必须让学生掌握\"二位数乘以二位数\"的算理,知道如何通过算理得到算法;也就是说,需要改变传统小学数学只教竖式不教横式的现象,因为横式表述的是算理,竖式表述的是算法。在横式运算过程中可以看到,计算的本质是使用了分配律,因此,可以尝试在这样的教学过程中,引导学生感知运算的基本流程:算律决定算理、算理决定算法。\n除了概念教学和方法教学之外,还可以用逻辑推理的方法,述说中国传统文化中的一些故事的道理,可以称之为生活中的推理,这样的推理更侧重于代数说理。比如,《义务教育数学课程标准(2022年版)》给出的\"曹冲称象的故事\"\"圆周率的故事\"\"土圭之法的故事\"\"度量衡的故事\"等等。\n初中数学的代数推理。对于初中数学,《义务教育数学课程标准(2022年版)》从数学说理提升到数学推理,因此从代数说理提升到代数推理,并且给出了若干例子,比如\"例66代数推理\"\"例67一元二次方程的根与系数的关系\"\"例77感悟证明的必要\"等等。下面,讨论如何进行例66的教学设计,说明对于初中学生,依然可以用照葫芦画瓢的方法感知演绎推理的证明模式。\n提出问题 解释三位数能被3整除的条件。\n预备路径 先讲述两位数能被3整除的故事。\n数学问题 设 ab是一个两位数,如果 a+b 可以被 3 整除,那么这个数可以被 3\n整除。\n论证思路\n利用类比的方法得到证明模式。用A表示\"二位数能被3整除\"的集合,B表示\"三位数能被3整除\"的集合,用P表示证明模式,用Q表示数的基于计数单位的表示形式。\n前提命题(A→P)\n因为 ab = a×10+b = a×9+(a+b),其中9能够被3整除。\n因此,如果 a+b 可以被 3 整除,那么这个数就可以被 3 整除。\n论证命题(A→Q且B→Q)\n因为abc = a×100+b×10+c = a×99+b×9+(a+b+c)。\n结论命题 B→P\n因为9和99能够被3整除。\n因此,如果a+b+c可以被3整除,那么这个数就可以被3整除。\n通过上面的论证过程可以知道,对于初步接触数学证明的学生,可以通过模仿学习如何得到数学的结论,也可以通过模仿学习如何进行数学证明。这样,就经历了代数推理的全过程,通过归纳推理(包括归纳、也包括类比)得到代数结论,通过演绎推理验证代数结论。在这样的过程中,似乎可以感悟,代数推理比几何推理更贴近日常生活的推理。有兴趣的读者,可以进一步归纳总结上面的论证过程,并且通过自己的教学实践进行调整,最终形成自己的培养学生数学思维的教学方法。\n第一部分小结。第一部分,我们通过五个问题论述了什么是定义、什么命题、什么是基本事实、什么是推理、什么是代数推理。那么,应当如何理解这些概念功能、把握这些概念之间的关系呢?我想用《墨经·小取》中的一段言简意赅、寓意深刻的论述作为概述,这就是:以名举实,以辞抒意,以说出故。我们用现代语言表述为[^27]:\n通过定义(名)明确所讨论问题的对象(实),通过命题(辞)表述所讨论问题的实质(意),通过论证(说)得到所讨论问题的缘由(故)。\n这样,就述说了研究问题的基本路径[^28]:研究对象的命名通过举例说明,研究问题的意义通过命题陈述,获得结论的理由通过论证阐明。\n正如我们在问题1中所讨论的那样,人对于数量多少的感知和对距离远近的感知是本能,这两种本能是人对数学认知的出发点;这两种本能的数学特征是一致的,这就是传递性、也就是说、数量多少和距离远近都具有传递性,这也就是人的逻辑推理的思维基础,体现于人的本能。\n人的本能蕴含在人的基因、大脑和神经系统,是地球生物几十亿年进化的结晶;虽然对于现今的每一个人,本能是先验的,但表观遗传学的研究成果告诫我们,不经过后天适时的、恰当的经验刺激,本能将不会得到充分的表达,这就是数学教育、以至于整个教育需要研究的问题。人之所以会进化出这样的本能,正如恩格斯在《自然辩证法》中所说的那样[^29]:\n我们的主观的思维和客观的世界服从于同样的规律,因而两者在自己的结果中不能相互矛盾,而必须彼此一致,这个事实绝对地统治着我们的整个理论思维,它是我们的理论思维的不自觉的和无条件的前提。\n自然界事物的发生是具有先后关系的,这就是思维传递性的模版。我们生活在地球上,我们是\"这个\"世界的产物,因此,正确的思维就是指那些能够合同于\"这个\"世界的思维,能够合同于\"这个\"世界已经存在了的规律的思维。或者反过来说,自然界只能依照自然界的规律进行自然选择,这就是英国生物学家达尔文所创立的进化论的真谛。\n\n第二部分 数与代数\n小学数学是数学学习的发端,因此,学生基本概念的形成必须基于现实背景,运算法则的认知必须基于实际意义。但是,数学的概念不是关于具体问题的述说,数学的方法也不是为了个别案例的解决,数学是具有一般性的,因此,基本概念的理解最终要脱离现实背景,运算法则的掌握最终也要脱离实际意义。在本质上,这个脱离是从初中数学开始的,这就意味着,真正意义的数学概念的定义、运算法则的确立是从初中数学开始的。对于\"数与代数\"的内容,需要表现于四个方面的变化。\n关于数的认识,初中数学将要学习数域的扩充,感悟数域扩充的缘由和意义。主要包括两个方面的扩充,一是在有理数的基础上增加无理数,二是在非负数的基础上增加负数。为了更好地理解无理数,需要更深刻地理解有理数,因此这一部分的开始,更加深入地讨论了分数、小数的现实意义和数学意义,感悟用小数的形式表达有理数的数学本质,进而拓展到无理数的表达。对于负数的学习,将通过现实背景中的表达功能,感知负数与正数的对应:数量相等、意义相反。\n关于数的运算,与数学自身的逻辑发展有所不同,初中数学不是通过除法把数域由整数扩张到有理数,而是通过学习负数把非负有理数扩张到一般形式的有理数,因此有理数四则运算的学习,应当强调的是:加减正数与负数的区别,以及乘除运算中出现正负号带来的变化。\n初中代数的学习,起始于代数式意义的理解和代数式运算的掌握,然后是包括方程在内的代数式相等关系的理解,还包括不等式在内的代数式不等关系的理解,知道一元二次方程根与系数的关系,实现算术的认知到代数的认知。更重要的是,初中代数的学习将经历从常量到变量、从常量关系到变量关系的过程,理解函数的意义、知道函数关系的表达。\n与代数知识的学习相对应,学生的思维将经历从理性具体到理性一般的过程[^30],相应的数学核心素养将实现从抽象意识到抽象观念的转变[^31];运算能力将经历从具体数的运算到一般符号运算的提升,更好地理解运算律的重要性;同时,在运用代数方法在解决现实问题的过程中,逐步形成模型思想,形成和发展应用意识和创新意识。\n问题6 如何理解分数和小数的现实意义?\n一般来说,就数的性质而言,大体上可以分为两类,一类表示数量和顺序,称为数的现实意义,另一类表示关系和运算,称为数的数学意义。所有的数都源于自然数,自然数是对数量的抽象,因此,数量是形成数的现实意义的基础;自然数的大小关系是对数量多少关系的抽象,因此,数量的多少是形成数的数学意义的基础。下面,我们讨论分数和小数的现实意义。\n更精细的表达形式。对于数量,人们创造了两种比自然数更精细的表达形式,一种是分数,一种是小数。可能是因为小数的表现形式更接近自然数,数学教育界、包括教材编写者普遍认为,小数比分数更接近自然数,于是现行小学数学教材的编写,都是先安排小数的内容、后安排分数的内容[^32]。但是,几乎所有的古老民族,都是先产生自然数和分数,后产生小数,这或许可以说明,分数比小数更接近自然数。我们来分析这个问题,从而更好地理解分数和小数的现实意义。\n所谓更精细的表达,在本质上,是指表达那些小于单位1的数量,因为可以通过平移的方法,把小于1的表达拓展到大于1的两个自然数之间的表达。\n分数的现实意义。对于一个单位,最自然的精细划分就是把单位分成若干相等的份数,其中几份的表达就是分数,这就是我们通常所说的真分数。在这样的表达中,重要的是分成多少份,其中的1份就是分数的单位,可以表示为1/n的形式,其中的n是份数。\n最初,人们希望用分数单位表达所有的分数,古埃及称这样的表达为单分数表达[^33],也就是把分数写成若干个分数单位和的形式,比如,把7/29写成\n\n的形式。在古印度的著作《法规》中,甚至用分数单位的形式表达无理数[^34]\n,\n这个数相当于小数表示的1.41421356237 ...。\n在中国古代,最初的分数也是以分数单位的形式出现,比如《左传》记载[^35]:\"先王之制,大都不过参国之一,中五之一,小九之一。\"是说,都城大小的规定,王城方九里,大都为王城三分之一,中都为五分之一,小都为九分之一。\n分数的表达也适用于角度的度量,古希腊学者托勒密用60进制表示圆周内的角,但对于整数部分并不使用[^36],因此60进制是对单位1的更精细的划分。后来,人们又把这样的表达方法拓展到用圆周表示的时间,比如,钟表上通常有分针和时针,这两个针同时运动、但速度不同。钟表上通常有60个刻度,每5个刻度标有数字,从1到12表示12个小时;分针走1个刻度表示时间过了1分钟,分针圆周运动一周、即走60个刻度,时针走1个数字间隔,说明60分钟等于1个小时。更精细的还有秒表,是为60秒等于1分钟。\n与用分数表达角度有关,中国古代还用分数表示阳历回归年的天数。在古汉语中,\"岁\"与\"年\"的含义不同,岁是指某一气节到下一个周期这个气节的时间间隔,比如从夏至到夏至这段时间,因此是阳历的一年;年是指正月初一到下一个正月初一这段时间,因此是阴历的一年。大概是因为木星的运行轨迹与黄道比较接近,中国古代偏重研究木星的运行轨迹[^37],称木星为岁星。《淮南子·天文训》用很大篇幅讨论岁星的运转周期,得到的结论是:\"日行十二分度之一,岁行三十度十六分度之七,十二岁而周。\"是说土星一日运行周天的1/12,一年运行周天的30度又7/16。可以根据这个述说计算阳历一年的周期,假设一年有a日,可以得到算式:a/12\n= 30+7/16 = (30×16+7)/16,计算得到\na = 12 × 487/16 = 3 × 487/4 = 1461/4,\n所以一岁为365日又1/4,即365.25日,在那个时代,这个结论相当精确,这对指导农业生产是至关重要的。后来,郭守敬1281年制定《授时历》,规定阳历一年为365.2425日[^38],这与1582年制定的罗马格里历法完全一样,但要早300年。\n需要注意的是,在上面的表达中,分数是没有后缀单位的、或者说、分数是一个无量纲的数,比如对木星轨迹的表达,不是说十二分之一度、而是说十二分度之一。统观全世界现行小学数学教材,除了日本强调分数的计量单位表达(比如1/4公斤)以外,其他国家均不强调[^39]。\n小数的现实意义。虽然小数的出现要比分数晚许多时间,但在应用的过程中人们逐渐发现,小数比分数更适用于小于单位1的数量表达,主要是两方面的原因,一是小数的数位与整数的数位一致,都是十进制,因此小数是一类特殊的分数,即分母为10的分数,是把单位1平均分割为十份;二是小数可以不断地形成新的单位1,因此可以无限制地分割下去。\n如果需要对精细分割新形成的数位逐一命名,那么这样的小数还不是现代意义的小数,因为在原则上仍然需要建立很多称谓,比如,中国古代就是这样。\n因为现实应用的需要,与负数的产生一样,小数形式的表达最早也是出现在中国,是以命名数位的形式出现的。在大约成书于公元三世纪的著作《九章算术》中[^40],命名了小于个位的十进制小数数位,比如,在\"方田\"章有对75平方寸的开平方的计算:\n七十五寸,开方除之,下至秒、忽,又一退法,求其微数、微数无名,知以为分子,以十为分母,约作五分忽之二,故得股八寸六分六厘二秒五忽五分忽之二。\n意思是说,把七十五(平方)寸表示为(平方)忽,然后开方,有余数称为微数,把微数表示成以十为分母的分数,可以得到开方后的微数为五分忽之二,这样,最后开方的结果为八寸六分六厘二秒五忽五分忽之二。那个时代,规定的从寸开始的小数单位依次为[^41]:寸、分、厘、毫、秒、忽。因为上面开方的表达中没有毫,因此在寸的下面应当有五个单位、各自平方后应当有十个单位,也就是说,在75的后面应当有10个零,上述运算结果是\n,\n其中微数是4/10=2/5。可以看到,对于分数的表达,这里也不说\"五分之二忽\"、而是说\"五分忽之二\",表示的是:把单位\"忽\"分为五份中的两份。\n在比《九章算术》成书稍晚的《孙子算经》中[^42],对长度单位表达的更加明确,但是,长度单位起始于忽而不是尺或丈,表述为\n度之所起,起于忽。欲知其忽,蚕吐丝为忽,十忽为一丝,十丝为一毫,十毫为一牦,十牦为一分,十分为一寸,十寸为一尺,十尺为一丈,十丈為一引,五十引為一端,四十尺為一匹,六尺為一步,二百四十步為一畝,三百步為一里。\n可以看到,如果以忽为基础单位,那么《孙子算经》中的表达已经失去了小数的现实意义,因为我们在前面说过,小数的现实意义是对单位1的精细划分,而在上面的表述中,已经\"起于忽\"也就是以忽作为单位1了,这样,小数的表达已经不存在了。事实上,在那个年代,上面所说的\"丈\"应当对应于整数数位的\"个\",也就是对应于单位1,因为《隋书》卷十六《志》第十一《律历》记载,祖冲之得到圆周率的结果是[^43]:\n以圆径一亿为一丈,圆周盈数三丈一尺四寸一分五厘九毫二秒七忽,朒数三丈一尺四寸一分五厘九毫二秒六忽,正数在盈朒二限之间。密率,圆径一百一十三,圆周三百五十五。约率,圆径七,周二十二。...\n所著之书,名为《缀术》,学官莫能究其深奥,是故废而不理。\n是说,如果圆的直径为1,那么圆周在朒数3.1415926和盈数3.1415927之间,因此这里说的丈对应的就是单位1。这样,祖冲之使用小数单位与《九章算术》是一致的,这样的单位表达延续至今。如此推断,《孙子算经》中的\"牦\"应当对应于\"厘\",\"丝\"应当对应于\"秒\"。由此可见,与分数的表达完全不同,小数最初的表达非常强调量纲。\n后来,在中国的历法中,也开始了无名小数计数方法的表达、即不标明计数单位称谓的表达,比如在明《大统历》中,有\"一十四日七六五二九六五\"的表达,是说\"14.7652965日\",我想,可以认为这样的表达是现代小数表达的雏形。事实上,小数脱离计数单位称谓的表达形式林林总总,延续了很长的时间,直到1585年,荷兰数学家斯蒂文的那部只有36页的著作《论十进》出版,才建立了现代意义的十进制数系[^44],才形成现在的小数表达形式。\n统筹整数和小数的十进制表达,如果用10的次方作为基底,那么就可以得到实数的用基底线性组合表达的一般形式,比如形如\n\n这样的表达。其中,用10的若干次方表达的基底是十进制的显著标志,也就是通常所说的数位,包括整数的、也包括小数的;1、2、3等为线性组合的系数,表示有多少个数位。\n只需要变换基底,那么,上述表达形式可以拓展到n维线性空间、无穷维线性空间,甚至可以拓展到包括希尔伯特空间在内的泛函空间。\n问题7 如何理解分数和小数的数学意义?\n分数和小数的数学意义表现于自然数关系的表达和自然数运算的结果,其中,分数的所有意义都与单位1有关,前一个话题讨论了分数的现实意义是对单位1的更精细的划分,而分数的数学意义则述说了量之间的比例关系。所说的量包括数量、也包括长度,数量必须基于同样的计数单位1表达,长度也必须基于同样的单位1度量,后者就是通常所说的可公度,是说只有两个可公度的长度才能写成分数的形式。进一步,通过量之间的比例关系,就可以用分数表示两个自然数相除,不仅可以表示运算的形式、并且可以表示运算后的商。\n用分数表达数量关系。古希腊毕达哥拉斯学派非常崇拜自然数,认为可以用自然数表达宇宙的和谐,确信现实世界中事物的所有关系都能用自然数予以表达。后来,毕达哥拉斯发现音乐的和谐取决于弦长之间的比例关系,于是更加坚信\"万物皆数\"。\n在中国古代,也有类似的确定音阶的方法,称为\"三分损益法\"又称\"五度相生律\",记载在《管子》这本书中[^45],这要比毕达哥拉斯还要早一些。三分损益包括\"三分损一\"和\"三分益一\",三分损一是将固定长度a进行3等分然后减去1份,得到a的2/3;三分益一是将a进行3等分然后增添1份,得到a的4/3。这样,得到长度比例为2:3:4,可以得到和谐的声音;两种方法交替、连续运用,各音律得以辗转相生。古代中国通常使用五声音阶,分别命名为:宫、商、角、徵、羽,相当于现在音阶的1、2、3、5、6,这样的方法也称为五度相生律。\n事实上,更为合理的音阶划分需要包含一些半音,现代音乐使用最为广泛的是十二平均律,就是把do音频率与高音do频率之间以等比级数的形式分为十二个音阶。大约在公元1600年左右,明朱元璋的九世孙朱载堉对十二平均律进行了精确计算,写在他的著作《乐律全书》和《律吕精义》之中。朱载堉得到的公比为\n1.059 463 094 359 295 264 561 825,\n这是2开12次方的精确到小数点后25位的近似。能够进行如此精确的计算,得益于朱载堉创造的用横跨81档的特大算盘进行开平方的计算方法(参见话题5)。在现代音乐中,十二平均律广泛应用于键盘乐器的制作、特别是钢琴的制作,德国作曲家巴赫于1722年出版的《谐和音律曲集》,是第一本专门述说十二平均律键盘乐器的著作。\n用分数表示长度的比。欧几里得几何把线段长度的比作为《原本》重要内容,特别关注线段的可共度性,这是因为在那个时代,人们对代数学的研究远不如对几何学研究的深入,因此当解释无理数遇到困难后就求助于几何学,详细的讨论参见话题8。欧几里得《几何原本》第五卷的开篇给出了十八个关于量之间关系的定义,其中前两个定义是[^46]\n:\n1.当一个较小量能尽一个较大量时,把较小量叫做较大量的部分。\n2.当一个较大量能被较小量尽时,把较大量叫做较小量的倍量。\n我想,这两个定义对未来义务教育阶段的数学教育是有所启发的,现行小学数学教材,把\"倍\"的内容安排在除法那里学习,是不合理的,因为人们通常理解的\"倍\"是乘法,比如成语\"加倍努力\"这样的表达。基于欧几里得上述表述,可以考虑把\"倍\"与\"几分之几\"对应表述如下:\n两个数相乘,如果乘数是一个无量纲的数,那么称积与被乘数满足倍数关系。习惯上,如果乘数大于1,那么称积是被乘数的多少倍;如果乘数是一个真分数,那么称积是被乘数的几分之几。\n虽然在上面的定义中,欧几里得说的是\"量\",但从后面的内容看,这里所说的\"量\"\n指的是线段长度,因此希尔伯特在《几何基础》中,进行了一些线段性质的证明之后说[^47]:\"直接推得线段的量的比较即线段的长短的比较\",并且,特别在\"线段的量的比较即线段的长短的比较\"这几个字的下面赋予加重符号。所以我们说,可以用分数表述长度的比。\n用分数表示自然数的除法。分数除了可以用来表示自然数的比,还可以表示自然数的除法,既可以表示除法的运算、也可以表示除法的商。这样的表示最早见于《九章算术》,是说:\"实如法而一。不满法者,以法命之。\"其中,实是指被除数、法是指除数。这句话的意思是,用实除以法,除不尽则表示成分数。李约瑟对这段话理解的非常清楚,他明确地说[^48]:\"在《九章算术》中,分子和分母在运算前称作'子'和'母',而此后则称作'实'和'法'。\"李约瑟特别欣赏\"分子\"\"分母\"的称谓,他在这段话的注释中说:\"选择用'儿子'表示分子和用'母亲'表示分母是很有启发意义的。它表明古人所想到的是真分数,即下面的数字要更大。\"但是,如果追究真正的数学意义,或许,应当把李约瑟的这段话反过来述说,这就是:分数可以表示运算的过程,是用\"实\"除以\"法\";分数还可以表示除不尽时的运算结果,是为\"母\"分之\"子\"。\n无论如何,对于小学数学,\"除法可以表示成分数形式\"这个结论最好能够进行适当的说理,说理过程仍然需要利用\"除法是乘法的逆运算\"这个基本准则,以及如问题5所述说的\"等量的等量相等\"和\"等式的基本性质\"这两个基本事实,比如下面的具体计算,\n4 ÷ 3 = a ⇔ 4 = 3 × a\n⇔ 4 × 1/3 = 3 × a × 1/3 = a\n⇔ 4 × 1/3 = a\n⇔ 4/3 = a\n⇔ 4 ÷ 3 = 4/3\n第一个恒等表示除法是乘法的逆运算,第二个恒等是根据\"等式的基本性质\",最后一个恒等是根据\"等量的等量相等\",上述恒等变换表明,除法可以写成分数的形式。\n用小数表达有理数。如上所述,在形式上小学数学充分讨论了分数,在本质上小学数学充分讨论了有理数、也就是、表达了自然数之间的比例关系。为了把数域从自然数扩充到实数,初中数学的一个重要内容,就是认识和理解用小数表达的有理数。\n为什么必须用小数表达有理数呢?主要是因为,现代数学所说的实数是十进制的数,如上一个问题最后部分所讨论的那样。这样,小数是十进制的数、是实数;分数不是十进制的数、不是实数。在问题18,我们将会讨论角度也不是实数,因为角度是60进制的,如上一个问题所讨论的那样。\n小学数学是用分数表达有理数,因此初中数学需要论证,用小数表达有理数等价于用分数表达的有理数,这里所说的小数是指有限小数、或者、无限循环小数。比如,分数可以写成\n7/9 = 0.777 ...\n76/99 = 0.767676 ...\n764/999 = 0.764764764 ...\n的形式;这里所说的等价,是指这样的表达是充分必要的,也就是说,还需要论证,有限小数和无限循环小数都能写成分数的形式,这样的论证需要用到极限运算[^49]。\n基于上述结论可以得到推论:不能写成分数形式的小数等价于无限不循环小数。这样,用小数划分有理数和无理数也是泾渭分明,也可以作为实数的定义。但是,无论如何,这样的定义只是形式上的,因为有两个重要的问题没有解决,一是关于实数的运算,二是关于实数的连续,我们将在话题9进一步讨论实数的问题。\n问题8 如何理解负数?\n对于负数的认识,传统的数学教学是通过减法运算得到负数、或者、借助0定义相反数。这样产生负数无可非议,但这样产生的负数仅仅是一种符号表达而已,并没表述人们创造负数的初心。一个不争的事实是,负数的产生也是对日常生活中数量的抽象。现有资料表明,中国汉代数学著作《九章算术》最早提出负数,给出了负数的加减运算方法,是公元三世纪以前的事情,后来大约在公元七世纪左右,印度给出了负数的乘除运算方法[^50]。\n现实意义的负数。下面,我们对《九章算术》第八章\"方程\"篇的第八题进行分析,讨论中国古代的先哲为什么要引进负数的概念。第八题是这样表述的[^51]:\n今有卖牛二、羊五,以买十三豕,有余钱一千。卖牛三、豕三,以买九羊,钱适足。卖羊六、豕八,以买五牛,钱不足六百。问牛、羊、豕价各几何?\n答曰:牛价一千二百,羊价五百,豕价三百。\n术曰:如方程。置牛二、羊五正,豕一十三负,余钱数正;次置牛三正,羊九负,豕三正;次置牛五负,羊六正,豕八正,不足钱负。以正负术入之。\n上面的\"术曰\"是讨论解题的方法,提到解决这个问题需要列方程,其中\"置\"\"次置\"\"次置\"说明需要列的一个三元一次方程组;在关于\"负\"的论述中可以看到,如果\"卖\"得到的钱为\"正\",那么\"买\"付出的钱就为\"负\",如果\"余钱\"为正,那么\"不足钱\"就为\"负\";最后,通过正负数的加减运算可以求得方程组的解。\n定义相反数。虽然负数的出现,是对具有现实背景的数量的抽象,但为了概念的一般性,与其他的数一样,最终要脱离现实背景,得到形式化的数学表达。这就是基于算术公理体系定义的负整数,是通过相反数的形式定义的:\n对于a∈N且不为0,如果a+b=0,则称b为a的相反数。\n通常用 -a表示a的相反数,并且称a为正整数、-a为负整数[^52],人们也称a和\n-a互为相反数。从上面的定义可以看到,0对加法运算是重要的,类似1对于乘法运算的重要,这是因为,有了0就可以通过加法产生负数,有了1就可以通过乘法得到倒数,因此0和1是数域得以扩充的基础。在高等数学中,基于集合与集合上定义的运算形成群,分别称0和1为加群和乘法群的单位元,是产生逆元的基础。因此,如果通过运算实现数的扩充,那么是通过相反数使自然数域扩充到整数域,通过倒数使整数域扩充到有理数域。\n事实上,1889年意大利数学家皮亚诺出版著作《用一种新方法陈述的算术原理》,用德国数学家戴德金提出的后继数的概念构建了算术公理体系,定义了自然数。皮亚诺定义的自然数原本是从1开始的,但后来发现这样的定义产生不了0和相反数,于是又改为从0开始。\n强调计算方法的数学发展。通过上面的讨论可以看到,至少到了汉代,中国古代就已经在日常生活和生产实践中使用了负整数,并且与自然数的产生一样,负整数也是用对应的方法确立的,与对应正整数之间的关系是:数量相等、意义相反。比如,如果盈余5元为正,那么亏损5元就为负;如果向西8里为正,那么向东8里就为负。因此,人们在整数的前面加上\"+\"号或\"-\"号,是为了表示这个整数的属性。这样的数学发展对数学教育的启示是,现代数学教材中许多看似合理的述说,只是为了实现数学逻辑的自洽,反而会失去数学概念最初的意义。不能不特别说明的是,基于思辨的西方数学一直很难接受负数,甚至到了十七世纪的笛卡尔时代依然如此。在1637年出版的《几何》这本影响深远的著作中,笛卡尔把方程的正根称为真根、把方程的负根称为假根,之所以称为假根,是因为,方程存在比0所表示的\"无\"更小的根是不可思议的[^53]。\n无论如何,负数的发明和负数运算的确立对于数学的发展是重大的事情,这样的重大事情之所以产生在古代中国和古印度,而不是产生在重视逻辑推理的古希腊,与古代中国和古印度这两个国度对数学的理解有密切的关系。\n古代中国称数学为\"算经\"或者\"算术\",意思是关于计算的技术;古印度称数学为\nganata,意思是关于计算的学问。因此,无论是在古代中国、还是在古印度,重视的是数学的计算方法、而不是数学的推理逻辑,在这两个神奇的国度,都形成了乘法计算口诀,影响至今;直到今日,基础教育阶段的数学教育,这两个国度的数学计算能力依然具有很大的优势。\n但是,也不能不看到的是,这样的数学发展缺少必要的数学抽象,难以形成系统理论,因此不利于广泛传播、也不利于深入研究。我们将会在问题11,再次深入讨论这个问题。\n问题9 如何理解初中数学中的有理数运算?\n上个问题提到,初中数学数域的扩充与通常的基于运算的数域扩充有所不同。通常的基于运算的数域扩充,是在自然数域上定义加法,通过相反数由自然数域扩充到整数域、再通过倒数由整数域扩充到有理数域;而初中数学数域的扩充,是在小学数学学习了非负有理数的基础上,通过负数的认识扩充到包括负数在内的一般有理数,然后再通过无理数的认识扩充到实数。因此,依照这样的数域扩充过程,初中数学有理数运算教学的重点,应当是加强有负数参与的四则运算。\n我们已经确立了负数与对应正数的关系:数量相等,意义相反。这样,如果定义\"正数大于负数\",那么:对于正数,数量越多数值越大;对于负数,数量越多数值越小[^54]。这样的对于数、特别是对数大小的理解,就形成了初中有理数加减运算的直观基础,形成了有理数运算的基本性质。众所周知,《义务教育数学课程标准(2022年版)》开始强调代数证明,于是如下所述,按照课程标准要求:证明有理数运算的基本性质。\n运算性质的代数证明。在有理数运算的直观基础上,可以得到有理数四则运算的性质,人们习惯于用生活语言把这些性质表述为:\n加上一个正数比原来的数大;减去一个正数比原来的数小。\n加上一个数等于减去这个数的相反数;减去一个数等于加上这个数的相反数。\n乘除一个正数不改变正负符号;乘除一个负数改变正负号。\n现在,尝试给出这些性质的证明,这样的证明就是代数证明,这样的证明形式是我国传统基础教育阶段的数学教育所没有出现过的,因此应当成为未来初中数学教育内容的重点。为了代数证明的需要,《义务教育数学课程标准(2022年版)》增加了两个基于代数表述的基本事实,如问题5所述,这两个基本事实源于欧几里得《几何原本》五个公理中的前三个公理,如果把等号拓展为不等号,那么可以把这两个基本事实更一般地表述为:\n关系传递性:a ≧ b,b ≧ c → a ≧ c\n等式的性质:a ≧ b → a ± c ≧ b ± c\n这两个基本事实,可以作为整个基础教育阶段阶段代数证明的出发点。\n对于一线的初中数学教师,可以把有理数四则运算性质的证明作为代数证明的起始。首先,是要习惯用数学符号表达所要讨论的问题、也就是、用数学的语言表达日常生活语言的表述。\n比如,用数学符号表达\"加一个正数比原来的数大\"这个命题。如果用a表示原来的数,用b表示加上的正数,那么用数学符号表达这个命题是为:a+b>a。可以看到,如果用数学符号达了命题,那么命题的证明就呼之欲出了。因为根据等式的和加法交换律,可以得到:\nb > 0 → b + a > 0 + a\n←→ a + b > a\n这就是所要证明的。\n对\"减去一个数等于加上这个数的相反数\"这个命题的证明,需要利用相反数的和为0这个定义,可以把证明过程表述如下:\na - b = a - b + 0 = a - b + [b + (-b)]\n= a - b + b +(-b) = a + (-b)\n这样,对于有理数加减法的教学,可以先引导学生经历有理数运算的直观判断和代数证明,然后再进行归纳总结。在这样的过程中,引导学生建立数学的直观、而不是单纯地接受数学的训练,理解数学的本质、而不是单纯地记忆数学的法则。我想,这就是基于\"四基\"\"四能\"教学的根本、也是基于\"数学核心素养\"教学的根本。\n有理数的四则运算还涉及有负数参与的乘除法。事实上,只需要把握相反数,就可以清晰表述负数参与乘除运算之后积或商的变化:在乘除运算中,如果其中一个因子用相反数替代,那么得到的积或商也会相应地变为相应的相反数[^55]。\n问题10 什么是代数式的表达与运算?\n代数式的运算是数运算的抽象,因此教学的起点应当把数的运算拓展到字母的运算。字母运算的教学应当强调两个方面的内容,一个方面应当让学生知道,字母可以像数一样进行运算;另一个方面还应当让学生理解,通过字母运算得到的结论具有一般性。对于后者,学生在小学数学有一定的感官认知,比如,用字母表达的加法交换律、或者、用字母表达的长方形面积公式。对于前者,小学数学几乎没有涉及,因此这样的教学完全是从初中数学开始的。下面,我们讨论\"字母可以像数一样进行运算\"所涉及的若干内容。\n字母表达的一般与特指。小学阶段的数学教育,学生已经学习了如何用字母表达数量关系,到了初中阶段的数学教育,应当进一步让学生知道,字母的表达涉及到一般的和特指的两种情况。比如,用a表示小明的岁数,用b表示小明爸爸的岁数。如果小明爸爸比小明大30岁,那么二者之间的关系就可以表示为:a+30=b,这是一般性的表达,可以看到,仅凭这些信息还无法知道小明的具体岁数;如果还知道其它信息,比如,小明爸爸今年的岁数正好是小明岁数的3倍,那么就可以表示为3a=b,因为这样的表示不是一般的,因此可以称为特指,这里所说的特指是说今年。\n事实上,所有方程的建立,都是利用字母表达的一般关系和特指关系,比如,把小明爸爸今年岁数的特指带入一般性表达,可以建立方程:a+30=3a,解得a=15,于是可以知道小明今年15岁。不仅如此,我们还可以建立二元一次方程,得到\n\n的形式,可以得到a=15,这是小明今年岁数的特指。这样,在初中代数的学习中,应当引导学生理解用字母表达的数量关系,感悟数量关系是构建方程的基础,也是未来学习函数的基础。\n通过上面的讨论还可以知道,在代数式的运算中,只有相同的字母才能进行同类项合并,这是因为相同字母所表示的意义相同。\n代数式的三岐性定理。不仅可以把数的运算拓展到代数式的运算,还可以把数的大小关系拓展到代数式的大小关系,这就是三岐性定理。三岐性定义是建立方程和不等式的基础,比如,对于上面提到的两个代数式a+30\n和3a,存在\n\n所表述的三种关系;并且在确定的时刻,当且仅当其中一种关系成立。可以看到,第一、三种关系就是通常所说的不等式,第二种关系就是通常所说的方程。\n如果在上面的式子中,字母a仍然表示小明的岁数,那么通过提供的信息可以知道,上面第二个式子、即方程表示的是小明今年的岁数,解得a=15;第一个不等式表示的是小明今年以前的岁数,解得a<15;第三个等式表示的是小明今年以后的岁数,解得a>15。可以看到,等式、不等式的解与代数式所讲述的小明岁数的故事是一致的,这就是用数学的语言讲述现实世界的故事。\n用代数式表示计算规律。我们知道,可以用字母的运算一般性地表达运算律和公式,如前面提到的加法交换律和长方形面积公式。作为这一功能的拓展,还可以利用代数式表达运算规律。虽然在日常的数学教学过程中,主要是验证代数式表达的正确性,是通过演绎推理的验证,但更重要的,是引导学生尝试自己得到代数式的表达形式,这是通过归纳、或者、类比的方法得到的。我们分析两个例子,前者简单一些,后者复杂一些。\n平方差公式。如果从结果出发容易得到平方差公式,只需要计算\n\n就可以得到平方差等于两个一次项乘积的公式。\n但是,如果事先不知道结论,那么得到公式就不那么简单了。在许多情况下,代数公式的得到是通过归纳的方法,比如所说的平方差公式。方法如下,先假定b=1,依次变化a,得到\na = 2, a^2^ - 1 = 4 - 1 = 3;\na = 3, a^2^ - 1 = 9 - 1 = 8;\na = 4, a^2^ - 1 = 16 - 1 = 15;\na = 5, a^2^ - 1 = 25 - 1 = 24;\na = 6, a^2^ - 1 = 36 - 1 = 35;\n这时,可能就会看出规律,35=5×7,24=4×6,15=3×5,8=2×4,3=3×1,于是可以猜想\n。\n然后通过演绎推理验证这个结果,如果正确,再用b替代1,可以得到更为一般的结论。\n前n项和公式。关于自然数前n项和的公式,有许多美好的传说,西方大体说的是高斯的故事,中国大体说的是华罗庚的故事,无论是那个传说,都是通过计算技巧得到公式。\n我曾经设想,如果已经知道自然数前n项和公式,是不是可以用归纳的方法,进一步得到:自然数平方的前n项和公式、自然数立方的前n项和公式,于是进行了尝试,没想到很快就得到了结果。现在把计算过程再次记录如下,供初中数学教师在教学中参考。分别用A(n),B(n),C(n)\n表示这三类前n项和公式,然后依次进行数字计算,计算结果如下:\nn 1 2 3 4 5 6\nA(n) 1 3 6 10 15 21\nB(n) 1 5 14 30 55 91\nC(n) 1 9 36 100 225 441\n通过计算结果容易看到,对于每一个n,C(N) 恰好为 A(N) 的平方,于是可以推断\n。\n这个表达式也说明了C(N) 与 A(N) 之间成比例关系,比值为\nA(N)。受比例关系的启发,于是可以通过类比猜想,B(N)与 A(N)\n之间也存在比例关系,尝试依次计算比值:\nn 1 2 3 4 5 6\nB(n)/A(n) 1 5/3 7/3 9/3 11/3 13/3\n根据这个结果可以猜想,B(N)与 A(N) 的比值为 (2n+1)/3,于是可以得到\n\n这样的表达形式。\n虽然这样的表达式还只是猜想,但提供了论证的方向,因为是依次计算得到的结果,所以适于用数学归纳法进行验证。通过上面的过程可以看到,如果要引导学生尝试用归纳或者类比的方法的到数学的结论,计算的过程最好是循序渐进的,因为在这样的过程中容易发现数值规律。\n问题11 如何理解方程的内涵?\n上一个问题中谈到,代数式与数一样也具有三岐性,方程表述的是两个代数式之间的等量关系,不等式表述的是两个代数式之间的不等关系。因为构建方程的基础是等量关系,因此,构建方程至少需要两个由代数式表达的量,也就是我们通常所说的,列方程需要讲两个故事。\n一般来说,两个量可以表达一般的数量关系,但在列方程时往往还需要表达特指关系。比如,小明的爸爸比小明大30岁的问题,可以得到一般的数量关系a+30=b,但要求得小明某一年的岁数,则还需要特指:如果小明爸爸今年42岁,那么小明今年12岁;或者反过来,如果小明今年12岁,那么小明爸爸今年42岁。这就是数量关系与方程之间的关系,是一般与特指之间的关系。借助代数式表达等量关系是列方程的过程;通过代数式运算得到结果是解方程的过程。\n建立一般形式的方程。有兴趣的读者,可以尝试把上面的研究路径拓展到行程问题或者鸡兔同笼问题等。下面,我们研究方程最为一般的形式:所有的量都用字母表达。我们分析鸡兔同笼的模式,有兴趣的读者可以采用类似的方法,把研究的问题拓展到其它模式。思考这样的问题:\n有a条腿的物品A和b条腿的物品B共N个,如果这些物品有M条腿,问A和B各有多少个?\n不失一般性,我们可以假设a-b>0,即物品A的腿数多于物品B的腿数。因为在问题中,腿的个数a和b是可以变化的,于是人们称这样的数为待定系数或未知参数。这样,我们就一般性地思考了问题,只要确定了其中的参数,就可以得到一个具体的问题。\n显然,几乎对于所有现实的问题,参数的设定是有所约束的,约束是由问题的背景决定的。对于上述鸡兔同笼的问题,就必须注意到:未知参数必须是正整数,并且,问题的解、即物品A和物品B的个数也必须为正整数。人们通常称参数的约束为边界条件。对于一名初中数学教师,能够把一个具体问题最终抽象为用符号表达的一类问题是有意义的,我们称抽象后的一类问题为模式。只有经历这样的抽象,才能真正把握一类问题的本质,才可能在教学活动中举一反三。虽然问题是一般性的,但解决问题的思路是一致的,这便是模式称谓的由来(更详细的讨论参见话题29)。\n设物体A有x个,那么物体B有N-x个。于是根据题意,可以得到一个方程\n,\n因为只有一个未知数,并且未知数的次数为1,因此称为一元一次方程。还可以设两个未知参数:物体A有x个、物体B有y个,这样可以得到一个二元一次方程组,写成\n\n的形式,称为二元一次方程。\n对于这样的问题,可以通过四则运算求解,也可以通过一元一次方程或二元一次方程组求解,在求解的过程中可以知道,解二元一次方程组要化为解一元一次方程,解一元一次方程要化为解四则运算,人们通常称这种还原求解的方法为化归。化归是一种基本的数学方法,可以把未知的状况转化为已知的状况,因此,在数学教学的过程中,要引导学生理解并掌握化归的方法化,这也就是为什么数学的教学必须按部就班进行的缘由。\n可以看到,如果学会了列方程,那么对于许多问题,列方程可以减少思维的过程、使得问题变得更加简单,但与此同时,解方程则必然会增加计算的繁琐,因此,便利之事二者不可得兼。\n适用于四则运算的问题。虽然列方程能够比较简单地解决四则运算的问题,但有一类问题,更适于用四则运算的方法解决,比如,考虑下面的问题\n甲、乙两辆汽车分别由A、B两地同时相对开出,在离A地40公里处相遇,然后继续行走分别到达B、A两地。第二天两车同时返回,在离B地30公里处相遇。问A、B两地相距多少公里?\n如果列方程解决这个问题,那么可以利用两辆汽车所用时间相等、或者、各自速度始终保持不变这样的等量关系。设两地之间距离为a,同时设甲、乙两车的速度分别为v~1~和v~2~,那么根据时间相等,通过两次相遇分别得到两个关系式\n\n和\n,\n计算得到速度比的两个等式,分别为\n\n和\n,\n这样,利用速度比的等量关系,可以得到\n,\n这是一个一元二次方程,通过化简计算可以得到a=90(公里)。\n如果用四则运算的方法解这个问题,会简单许多,但需要一定的逻辑推理。通过对问题分析可以知道,甲、乙两辆汽车一共行驶了A与B之间距离a的3次,因为速度始终保持不变,因此甲每一次都行驶行驶40公里,一共行驶了3个40公里;另一方面,对于A与B之间距离a,甲行驶了a+30千米,因此有\n40 × 3 = a + 30,\n或者直接计算\n40 × 3 - 30,\n得到a=90(公里),这样计算比列方程更加简洁。\n中国古代的方程。下面,我们分析《九章算术》中的一个关于方程的例子,希望说明两个问题:一是说明,中国古代数学在很早的时候,就已经发展到相当高的水平;二是说明,数学抽象、以及相应的符号表达的对于数学发展的重要性。\n汉代刘徽注释《九章算术》,专门设置了\"方程\"篇,那是公元263年左右的事情,比韦达的工作早出1000多年。其中\"勾股\"章的第11题为:\n今有户高多于广六尺八寸,两隅相去适一丈。问户高、广各几何?\n答曰:广二尺八寸;高九尺六寸。\n术曰:令一丈自乘为实,半相多,令自乘,倍之,减实,半其余。以开方除之,所得,减相多之半,即户广。加相多之半,即户高。\n如果用现在的语言,所说的问题是:有一个门高比宽多6.8(尺),对角线长10(尺),问高和宽各是多少?答案是:宽2.8(尺),高9.6(尺)。\n可是,上文中的\"术曰\"就比较费解了,尝试用现代数学语言表述\"术曰\"所述说的内容。是说,如果用\nx和y分别表示宽和高,即\"术曰\"所说的\"户广\"和\"户高\";用a表示对角线长;用b表示高与宽之差,即\"术曰\"所说的\"相多\",那么\"户广\"和\"户高\"分别为:\n\n和\n。\n把这两个式子进行适当整理,可以得到\n\n和\n。\n把a = 10和b = 6.8代入上面的两个式子,确实可以得到x = 2.8和y = 9.6。\n在上面的两个式子中,我们可以看到韦达求根公式的影子,可是《九章算术》并没有说明\"术曰\"所说的计算方法的道理。我们可以推测,大概是从二元方程组\n\n出发,或者,直接把y=x+b代入勾股定理的公式,得到一元二次方程\n,\n然后再用配方的方法,得到\n,\n这样就可以得到\"户广\"和\"户高\"的计算式,\"术曰\"中所说的是前一个计算式。\n因此可以得到结论,《九章算术》已经很成熟地掌握了一元二次方程的求解方法,并且比韦达的工作要早一千多年。但是,我们也应当看到,因为没有抽象出合适的符号表达,因此无法得到一般性的解方程的方法,使得个人的研究成果很难成为人们的共识,以至于,很难进行具有学习功能的数学传播,很难进行接续不断的深入研究。\n这样,也如同问题8所说的那样,数学抽象的缺乏是阻碍中国古代数学发展的一个重要原因,这样的缺憾几乎一直影响到上个世纪末的中国数学教育,也正因为如此,在《义务教育数学课程标准(2011年版)》的课程目标中,把传统\"双基\"拓展为\"四基\",是说,在传统的基础知识和基本技能的基础上,强调了数学的基本思想和基本活动经验,就具体的能力而言,是在传统的\"计算能力\"\"推理能力\"\"空间想象能力\"这三大能力的基础上,加上了\"数学抽象\"\"数学建模\"这样的数学素养。秉承这样的教育理念,《普通高中数学课程标准(2017年版)》《义务教育数学课程标准(2022年版)》进一步通过课程目标,把\"四基\"拓展为\"三会\",这就是,进一步拓展为:会用数学的眼光观察现实世界、会用数学的思维思考现实世界、会用数学的语言表达现实世界。使得数学的课程目标:不仅具有数学的特征,同时具有数学教育的特征;不仅具有数学能力的特质,同时具有数学思维品质的特质。正是这样的更加全面了的特征和特质,才体现了数学教育的真谛。\n问题12 为什么说韦达定理是代数学的发端?\n古希腊学者丢番图在他的著作《算术》中已经使用字母表示未知数[^56],但在他的著作中,并没有使用字母进行一般性的抽象运算、因此也没有得到一般性的结论。\n第一个有意识使用字母进行抽象表达、进而进行抽象运算的是法国数学家韦达。在韦达之前,人们只解决带有数字系数的方程,方程等号的两边都是具体的量,包括用字母表示的未知数的量[^57]。比如,对于一元二次方程的研究,通常把方程写成\n\n或者\n\n的形式,并且认为这样的两个方程是不一样的,虽然他们知道,这两个方程的求解方法是类似的。这与我们在上一个问题强调方程是讲两个故事是一致的,这样的表达是本质的、也是直观的。\n韦达重要的工作,是用字母表示方程中的系数,于是方程中所有的量都实现了字母表达。这样,方程就脱离了现实故事的背景,韦达把一元二次方程统一写成\n\n这样的形式,其中x仍然表示未知的量,a、b、c表示方程的系数,可以是任何的数。这样的表达,使得方程与求函数的零解一致,因为方程可以作为函数的特例,表示成\n,\n的形式。但对于初中阶段的、刚刚接触到方程的学生,最好能够意识到,这样的表达只是形式上的,而不是方程本身。方程依然是讲述现实世界中的两个故事,对于任何一个现实问题,人们都很难用函数零解的形式建立方程,这样的表达只是适于对方程性质的研究。\n方程的根与系数的关系。如果用字母表达了方程的系数,那么通过计算得到的方程的根也具有了一般性,韦达给出了一般的求根公式,比如,二元一次方程两个根可以用字母表示为\n,\n的形式。于是,无论是什么样的数字系数,只要代入上面的公式就可以得到方程的两个根,非常简洁便利。这就再一次说明,从具体的数字表达上升到一般的符号表达,得到的结论就具有了一般性,进而数学的应用具有了广泛性,这就是数学抽象的功能。\n不仅如此,从具体的数字表达上升到一般的符号表达,还使得方程性质的研究成为可能,比如,通过根的表达式容易得到\n,\n这两个结论。这说明方程的系数与根是一一对应的:可以通过方程的系数得到方程的根;反之,还可以通过方程的根推算方程的系数。为了纪念韦达的贡献,人们把根与系数关系的公式称为韦达定理,是初中数学的重要内容。\n基于上面的工作,韦达在1591年出版的著作《分析艺术引论》中划分了算术与代数:算术以及数字系数的方程是与数打交道,是关于数字的计算[^58];代数是作用于事物的类别或形式上的方法,是关于类型的计算。就是这样,韦达就开创了现代数字的一个重要分支:代数学[^59]。最初,韦达用拉丁文的辅音字母表示已知量,用元音字母表示未知量。后来,解析几何的创始人法国哲学家、数学家笛卡尔完成了代数符号的改进工作,用拉丁字母的前几个字母a、b、c表示已知量,用后几个字母x、y、z表示未知量,这种表示方法沿用至今。\n韦达定理的拓展。考虑韦达定理更一般形式,比如,考虑一元三次方程,可以写成\n\n的形式。有3个根,分别设为,那么可以得到\n\n这样的关系式,因为两个方程相等的充分必要条件是这两个方程的对应系数相等,把上式右边展开,就可以得到更为一般形式的韦达定理\n,,。\n有兴趣的读者,可以尝试把上面的表达形式拓展到更为一般的n次方程的情况,可以得到更为拓展的韦达定理。可以看到,在所有的表达式中,交换方程两个根x~p~与x~q~的位置方程组保持不变。根据这样的性质,十九世纪初,法国数学家伽罗华和挪威数学家阿贝尔在研究方程求根公式存在的充分必要条件的过程中,相继提出了群的概念。后来,人们称这样的变换下标的群为置换群。\n问题13 如何理解函数?\n函数是数学最重要概念之一,这个概念从初中数学开始、一直延伸到高中、大学,虽然随着学段的提升、函数的定义越来越抽象,但函数定义的本质没有发生变化,这个本质就是两个变量之间的关系,大体上是:一个量发生变化,另一个量也随之发生变化。\n函数概念是如此重要,以至于整个微积分的运算对象就是函数。如果说,人类对数学的创作,第一个重要贡献是发明了十进制所表达的数和数的运算,那么第二个重要贡献就是发明了微积分。正如恩格斯在《自然辩证法》中所谈到的那样[^60]:\n在一切理论进步中,同17世纪下半叶发明的微积分比较起来,未必再有别的东西会被看作人类精神如此崇高的胜利。如果说在什么地方可以出现人类精神的纯粹的和唯一的业绩,那就正是在这里。\n这是因为,微积分的出现使得数学的研究反生了根本变化:从常量走向变量,从静止走向动态,从平直走向弯曲,这些变化都是源于微积分用极限的方法研究函数。1673年,德国哲学家、数学家莱布尼兹创造了函数\nfunctiong\n一词,用来表示曲线上变动点的纵坐标[^61],用点的切线、即函数增量比的极限、刻画曲线的变化状态。经过近十二年的研究,莱布尼茨于1684年在《教师学报》上发表了他关于微积分的第一篇论文,这也是第一篇公开发表的、系统阐述微积分的论文[^62]。\n函数的变量定义。随着微积分研究的深入,数学家逐渐认识到,要把微积分的理论基础研究清楚,就必须建立一个相对成体系的学科,于是称这个学科为数学分析,可见那个时代的数学家对这个新创建学科的重视。1748年,瑞士数学家欧拉在著作《无穷小分析引论》中明切地说:\"数学分析是关于函数的科学\",并且使用符号f(x)\n表示函数,这样的表述方法延续至今。1755年,欧拉在著作《微分学》中给出了函数的定义:\n如果某变量,以如下的方式依赖于另一些变量,即当后面这些变量变化时,前者也随之变化,则称前面的变量是后面变量的函数。\n比较莱布尼茨最初的定义,欧拉的定义发生了本质变化,莱布尼茨的定义借助了几何图形,欧拉则摆脱了几何背景,刻画了函数本质,这就是两个变量之间的变化关系。因此,人们称欧拉的定义为函数的变量说。那么,什么是变量呢?柯西在1821年的著作《分析教程》中这样定义:\"这样的量称为变量,它必须依次取许多互不相同的数值。\"可以看到,在那个时代数学家的头脑中,变量的取值依然是跳跃的、不连续的,这样的认识是基于数学直观的。同样,人们对于极限的认识也是从数列的极限开始的,也是基于跳跃的、不连续的数学直观。\n函数的对应定义。利用变量定义函数,依然有函数表达式的影子,虽然表达式可以是基于几何、也可以是基于代数的,但无论如何,这样的定义还依赖现实背景和实际意义,这样的定义还没有展示函数概念的一般性,就像1848年左右英国数学家斯托克斯所说的那样:\"确实,我认为至关重要的是对函数的认识应当撇开一切代数表达式。\"基于这样的思想,1851年,黎曼给出了函数新的定义:\n假定z是一个变量,它可以逐次取所有可能的实数值。如果对它的每一个值,都有未知量w的唯一的一个值与之对应,则w称为z的函数。\n这样,黎曼采用实数值与实数值对应的方法定义了函数,其中\"对应\"是数学上不加任何定义的基本术语,因此是表达数学最基本概念的原始词汇,比如,康托利用这个的术语定义了无穷、以及无穷大小的度量(参见话题8)。从字面上理解,使用对应这个词刻画函数,就意味着只关注结果而不关注过程,这样就使得函数的表述摆脱了代数表达式的束缚。\n法国布尔巴基学派给出了函数概念更为一般的表述。布尔巴基学派最初是由一些法国的年轻数学家组成的数学学派,包括后来成为著名数学家的[韦伊](https://baike.baidu.com/item/%E9%9F%A6%E4%BC%8A/10309899?fromModule=lemma_inlink)、嘉当等人,特别需要指出的是,嘉当是当代华人最著名数学家陈省身的老师。布尔巴基学派的宗旨是在[集合论](http://baike.baidu.com/view/26152.htm)的基础上,用形式化的方法重新构建数学最基本的概念和法则。1939年,布尔巴基学派给出的函数定义为[^63]:\n设E和F是两个集合,它们可以不同,也可以相同。E中的一个变元x和F中的变元y之间的一个关系称为一个函数关系,如果对于每一个x∈E,都存在唯一的y∈F,它满足与x给定的关系。\n称这样的运算为函数,它以上述方式将与x有给定关系的元素y∈F与每一个元素x∈E相联系。称y是函数在元素x处的值,函数值由给定的关系所确定。两个等价的函数关系确定同一个函数。\n人们通常称这样的定义为函数的关系说。这样,函数的定义就完成了形式化的符号表达,人们不仅找不到当年牛顿和莱布尼茨构建的函数的影子,甚至也找不到变量之间的变化关系、实数之间的对应关系。虽然为了数学的严谨性,需要对于函数的定义进行深层次的抽象,但也应当注意到,深层次的抽象对数学教学带来的挑战。因此对于函数的教学,一方面要让学生认知抽象定义与变量变化的关联,另一方面要让学生理解抽象定义的必要性,在这样的过程中,引导学生感知数学抽象的层次性。\n基础教阶段函数的定义。我国基础教育阶段的数学教学,函数的定义大体分为两个层次,一个层次是初中数学的基于变量的定义,另一个层次是高中数学的基于对应的定义。但是,无论是初中数学、还是高中数学,教材中的定义都存在一定的瑕疵,我们分析这个问题。\n现行初中数学教材函数的定义大体采用欧拉的变量说,又受到黎曼定义的影响,表述为:\n在一个变化过程中有两个变量x和y,如果对x的每一个值,y都有唯一的值与它对应,那么就说y是x的函数,称x为自变量。\n这样的定义至少可以引发两个问题,这两问题都不利于函数教学的实施。第一个问题是,这样的定义舍弃了欧拉定义强调的两个量相依的变化关系,进而舍弃了相应的数学直觉,不利于第一次接触变量的初中学生对于变量的理解、对于函数的认知。之所以作出这样修订,据说,是为了避免常值函数的出现,怕初中学生理解不了因变量y取常值也是一种变化,我想,这样的因小失大是不必要的,事实上,只需要在教学过程中通过函数图像说明函数值取常值是一类特殊的变量。\n第二个问题是,忽略了黎曼定义中强调的自变量取实数值的要求,进而忽略对函数本质的理解。事实上,初中阶段的三角函数在本质上并不是函数,这是因为,初中数学中角的度量不是实数[^64],因此无法解释表达式sinx +\nx的意义,因为无法进行sin30° + 30° 的计算。\n我想,对于一名初中数学教师,大概了解一下高中数学的函数定义也是有必要的,对初中数学的教学也是有益的,这是更一般意义上的教学整体设计[^65]。高中函数的定义采用黎曼的对应说,又多多少少受到布尔巴基学派关系说的影响,虽然各个版本的定义不尽相同,但大体可以表述如下:\n令A和B是两个非空实数集合。如果存在一个从A到B的对应关系f,使得对A中的任意元素x,B中都有唯一元素y与之对应,则称f是A上的函数,记为y=f(x)。并且称x为自变量,y为因变量,集合A为函数的定义域,集合B为函数的值域。\n可以想象,高中数学的函数教学,首先应当向学生说明,高中函数定义与初中函数定义的共性与差异,通过对共性与差异的分析揭示函数定义的数学本质[^66],但非常遗憾的是,无论是高中的数学教材、还是高中的数学教学,都没有进行这样的说明。\n高中的和初中的函数定义,都是通过对应表述的,都强调对应值是唯一确定的,这就是函数的本质特征;但有所不同的是,初中是说两个变量取值之间的对应,高中是说两个集合元素之间的对应,并且特别强调必须是实数的集合。这样,高中函数的定义就强调了自变量的取值必须是实数,因此,为了使三角函数符合函数的定义,就必须学习弧度制,是为了用长度定义作为三角函数自变量的角度,然后通过长度与实数对应。\n可以看到,高中函数的定义更为抽象,因此结论更为一般,体现了抽象的层次性。比如,初中函数的定义述说的是变量之间的关系,具有表达式的影子,会认为\nf(x) = sin^2^x + cos^2^x 和 g(x) = 1\n表达的是两个不同的函数。但是,根据高中函数的定义,定义域和对应关系一样的函数是等价的,于是如布尔巴基学派所说,两个等价的函数关系确定同一个函数,因此上述两个函数确定的是同一个函数,尽管表达式不同。通过差异分析,可以更深层次地把握函数的本质,一是定义域,二是对应关系。\n第三部分 图形与几何\n虽然小学数学有图形与几何的内容,但重点是几何直观的感悟和空间观念的建立,这些都依赖于对空间图形的抽象。或许,空间图形抽象的本质,就是舍去三维空间物体的物理属性保留物体的形状,然后把这样的形状通过线条表达于二维平面;相应的思维过程,就是把人的关于距离远近感知的本能转换为对物体大小的认知。毋庸置疑,这样的感悟能力培养的最佳时机是在小学,这是因为,基于本能的感悟是在朦胧中形成和发展起来的。\n这样,几何概念的确立、以及几何命题的表述,都是从初中数学开始的,是借助对抽象了的平面图形的感知完成的。因此,初中几何教学的首要任务是把学生对图形的感知提升到对概念的认知,如同第一部分述说的那样,几何学最基本概念的定义必须是名义的,这样,为了帮助学生在提升的过程中建立几何直观和空间观念,几何基本事实的确立就变得非常重要。这就意味着,对于初中几何教学,几何基本事实的确立不仅仅是为了证明的需要,也是为了帮助学生建立几何直觉的需要。\n虽然近些年,义务教育阶段的数学教育开始强调代数推理,但至少在现阶段,传统意义的几何推理仍然是培养学生逻辑推理能力的重要内容。也如同第一部分述说的那样,因为近代数学公理体系相当严谨、进而表述相当庞杂,因此初中阶段的数学教育,不可能通过几个公理的述说就建立起基于公理体系的论证,因此把论证的前提称为基本事实还是比较恰当的。初中几何证明的教学必须要让学生感悟演绎推理的基本规则,这就是,论述明所要证明的问题是一般情况下的特例,在这样的过程中感悟和理解传递性的原则,感悟和理解论证过程的逻辑性。在思考的过程中学会思考,这就是基于四基的、或者说、基于数学核心素养的教学。同样的道理,在几何作图的教学过程中,要引导学生思考为什么会想到要这样作图,进一步培养学生的几何直观和空间想象力。\n初中几何教学的一个重要内容就是数形结合,表现于两个层次,一个层次是通过数轴和绝对值的表述,把小学阶段\"点与数的对应\"拓展到初中阶段\"距离与数量的对应\",这是数形结合的发端;另一个层次是通过笛卡尔直角坐标系表述函数的图像,表达形式从\"直线上表达一个量的数轴\"拓展到\"平面上表达两个量关系的直角坐标系\"。这样的两个层次的数形结合,就形成了\"通过几何建立直观、通过代数予以表达\"的数学研究的基本路径,这样的基本路径一直拓展到高中、大学,甚至拓展到现代数学的研究。\n问题14 为什么说数轴和绝对值是数形结合的发端?\n至少对于数学教育而言,数形结合始于初中数学,是通过数轴和绝对值表述的。但是,仔细阅读现行初中数学教材可以发现,这些内容的表述不尽合理,不仅不能自圆其说,更没有揭示数形结合的本质。\n现行初中数学教材在定义了有理数和数轴之后,通过举例直观表述有理数可以与数轴上的点对应,甚至有的教材还特别说明像\n√2和 π\n这样的无理数也可以与数轴上的点对应。在这个基础上,给出相反数的定义,说明相反数到原点的距离相等,把这样的现象拓展为绝对值的定义:\n在数轴上,表示一个数的点到原点的距离叫作这个数的绝对值。\n显然,根据这样的定义,必须把绝对值理解为距离,而距离是通过线段的长度定义的。这样,在给出了绝对值线段长度的定义之后,才开始表述绝对值的真实含义:非负数的绝对值是它本身,负数的绝对值是它的相反数。最后,借助绝对值的概念表述有理数的四则运算法则。\n这样,关于绝对值概念的表述就出现了矛盾:非负数的绝对值到底是线段的长度呢?还是它本身所表达的数量的多少呢?因为在本质上,如同我们在问题8所表述的那样,无论是正数还是负数都是对数量的抽象,相反数是说:数量相等、意义相反。绝对值表达的是两个相反数相等的数量,因此才会有\"相反数的绝对值相等\"这样的结论,事实上,这也是数学家定义绝对值的初衷。\n因为在一般情况下,复数是无法比较大小的,于是德国数学家魏尔斯特拉斯于1841年发明了绝对值这个符号[^67],用以表示复数的大小:复数的实部与虚部平方和的开方。因此,对于实数的情况,绝对值就是这个数的平方的开方,这就是:非负数的绝对值是它本身,负数的绝对值是它的相反数。也就是说,实数\na 的绝对值可以表示为\n\n的形式。由此可见,最初定义的绝对值与数轴无关,可以称为绝对值的代数表示。\n如话题10将要表述的那样,1905年,德国数学家甘斯用绝对值表示一般向量的长度,如果把这样的表示用于数轴,那么对于数轴上任意两个点a和b,这两点构成的线段长度可以表示为\n\n的形式,这恰好是数轴上的线段长度,可以称为绝对值的几何解释。\n可以看到,绝对值的代数表示与几何解释在形式上是一致的,体现了数量与长度的一致性,这样就构成了数形结合的理论基础,事实上,也构成了数形结合的直观基础。德国数学家戴德金在建立实数理论、定义实数连续性时就借助了这样的形式和直观,提出了一个基本原则,现在人们称这个基本原则为戴德金连续性公理[^68]:\n苟直线上之点,裂为前后两段,前段各点均在后段各点之左,如是则必有一点,且仅有一点使此两段之分裂得以产生。\n是说,数轴上的点是连续的,基本特征是:任意一个点都可以把数轴上的点划分为两类,一类点在另一类点的左边,这样的划分能并且只能产生一个点。类比数轴上的点,戴德金认为实数的连续性也具有这样的特征:任何一个实数都对应一个划分,可以把实数分为两类,一类中的实数小于另一类中的实数,这样的划分能并且只能产生一个实数。借助连续性公理,戴德金最终定义了具有连续性的实数,使得极限的严谨定义与表达成为可能。\n综上所述,初中数学教材的内容最好既包括绝对值的代数表示,也包括几何解释,在教学过程中引导学生理解,正是因为这两种表示形式上的一致性,可以使得有理数与数轴上点的对应(小学数学的内容)升华到数量与距离的对应(初中数学的内容),在感悟数学抽象的前提下,帮助学生建立数形结合的直观,知道可以通过几何建立数学的直观、通过代数进行数学的论证。\n问题15 如何理解反证法的推理逻辑?\n反证法是重要的数学证明方法,因为证明论证方法的正确性,因此反证法属于演绎推理,是现代数学是不可或缺的证明方法。虽然用反证法证明的问题大多数都是代数问题,但因为《义务教育数学课程标准(2022年版)》最初提及反证法,是为了证明平行线性质定理(见例74,感悟反证法),因此我们在\"图形与几何\"领域讨论反证法。\n据说,反证法是欧几里得创造的。无论如何,下面两个著名反证法证明都是欧几里得给出的,第一个是证明素数有无穷多个,第二个是证明\n√2是无理数,分别表述如下。\n命题一 素数有无限多个[^69]。\n证明:假设命题不成立,那么存在最大的素数p。\n用p!\n表示所有小于等于p的素数的乘积,那么,自然数p!+1除以任何素数都将余1,所以\n是一个素数。但p!+1大于p,与假设矛盾。\n假设不成立。所以,假设的否命题\"不存在最大素数\",即\"素数有无限多个\"成立。\n命题二 √2是无理数[^70]。\n证明:假设命题不成立,那么√2不是无理数。\n√2是有理数。根据有理数定义,√2能够表示为两个整数的比,比如√2=a/b,其中\na和b为整数,不失一般性,假定a和b没有公因数。\n可以得到a^2^ =2b^2^,于是a^2^\n为偶数。因为只有偶数的平方才能为偶数,所以a为偶数。因为\na和b没有公因数,因此b为奇数。\n因为a为偶数,可设a=2c。因为a^2^ =4c^2^,可以得到4c^2^ =2b^2^ 或者2c^2^\n=b^2^。因此b^2^为偶数,\n根据同样的道理,b为偶数。\nb不可能同时又是奇数又是偶数。所以假设不成立,假设的否命题\"√2是无理数\"成立。\n下面,我们分析反证法的证明思路,进而论证证明方法的逻辑性。如果论证了反证法证明方法本身的逻辑性,那么就说明反证法是一类特殊的演绎推理,可以作为数学证明的方法。可以看到,上面的证明过程在形式上是一致的,如果舍去具体的内容,那么可以把论证形式表述为[^71]:\n1.为证明命题P,提出归谬假设:命题P不成立(假设素数是有限多个;假设√2是有理数);\n2.通过论证引发矛盾(得到所有素数乘积加1这样的更大的素数;得到又是奇数又是偶数的数);\n3.根据矛盾律,归谬假设不成立。\n4.根据排中律,原命题P成立。\n话题9将讨论康托如何用反证法证明实数的个数多于自然数的个数,为此,我们可以引用德裔美国数学家柯朗所说[^72]:\"几乎所有的用反证法证明的问题都可以构造出正面的证明,但是康托的这个反证法的证明却是一个例外。\"虽然柯朗强调的是康托反证法的重要性,但柯朗的\"可以构造正面证明\"的论断是有道理的,比如,对于上面两个反证法的证明,可以构造正面的直接证明,分析如下。\n命题一 素数有无限多个。\n证明:用S表示任意一个由不同素数所组成的[有限集合](https://baike.sogou.com/lemma/ShowInnerLink.htm?lemmaId=351849&ss_c=ssc.citiao.link)。令N表示S中所有素数乘积加1,即\n,\n其中,Π表示乘积。因为N不能被S中的任何一个素数整除,那么可能有两种情况:N为素数,但不在集合S中;N为合数,但被集合S以外的素数整除。无论哪种情况,集合S中的素数都得到了扩充。这样,任意一个由素数组成的有限集合,都可以扩充为更大的素数集合。所以,素数有无限多个。\n命题二 √2是无理数。\n证明:因为不存在使得a^2^ =2b^2^成立的非0自然数a和b,所以√2是无理数。\n虽然我们从正面直接证明了上述两个命题,但从中仍然可以体会到,反证法的论证更加强有力,特别是对于命题二的证明,其中\"不存在使得a^2^\n=2b^2^成立的非0自然数a和b\"这个命题还必须作为一个引理给出证明,否则证明并不完整。因为在大多数情况下,正面直接证明的构造将会相当繁杂,因此反证法在数学证明中被频繁使用。\n问题16 如何理解几何作图的教育价值?\n数学教育所说的几何作图是指尺规作图,如问题3所说的那样,尺规作图的规定源于欧几里得几何五条公设的前三条公设,即:\n1. 由任意一点到任意一点可以作直线。\n2. 一条有限直线可以继续延长。\n3. 以任意点为心及任意的距离可以画圆。\n前两条是说,可以用无刻度的\"尺\"画直线,后一条是说,可以用\"规\"画圆。中国古代也有\"没有规矩,不成方圆\"的说法,其中所说的\"规\"是一样的,所说的\"矩\"比\"尺\"更一般,是一个可以画直角的曲尺,因此不仅可以画直线、并可以画直角。\n虽然尺规作图是初中数学的传统内容,但《义务教育数学课程标准(2022年版)》把其中两个内容下放到小学数学,这就是:例26,作一条线段等于已知线段;例29,自主探索三角形周长。与此同时,对初中数学的尺规作图提出了更高的要求,这就是:\"能想象出通过尺规作图的操作所形成的图形,理解尺规作图的基本原理和方法,发展空间观念和空间想象力。\"这就是意味着,尺规作图再也不是技能的学习,而是要通过尺规作图理解几何原理、培养想象能力。\n我想,在本质上,可以认为义务教育阶段的教育、即14岁以前的教育是早期教育,就思维能力的培养而言,早期教育主要应当培养抽象能力和想象能力[^73]。我们在第二部分讨论了抽象能力,那么是想象能力、如何培养想象能力呢?关于这个问题,马克思有着精辟的论述[^74]:\n最蹩脚的建筑师从一开始就比最灵巧的蜜蜂高明的地方,是他在用蜂蜡建筑蜂房以前,已经在自己的头脑中把它建成了。劳动过程结束时得到的结果,在这个过程开始时就已经在劳动者的表象中存在着,即已经观念地存在着。\n这就意味着,想象是指,在劳动开始就已经在头脑中形成了的劳动以后的结果;想象能力是指,操作前就能够预想操作后得到的结果的能力;能够根据预想设计操作流程、指导操作过程的能力;通过操作后的实际结果、反思预想设计和操作流程合理性的能力。而课程标准希望的就是,通过尺规作图培养这样的想象能力,比如下面的例子。\n作角平分线的思维路径和操作流程。通过对\"作一个给定角的平分线\"的教学,分析尺规作图的思维路径和操作流程。传统教学的基本流程是,老师告诉学生如何操作,然后引导学生按部就班作图,最后告诉学生用全等三角形证明作图得到的结果是正确的。\n为了实现课程标准所要求的教学目标,需要改变传统教学模型。要培养学生的想象能力,在作图前就要引导学生想象作图后的情境;然后鼓励学生设计作图的步骤,指导实际操作,验证自己的想象;最后,启发学生利用全等三角形证明作图的正确性。\n无论如何教师应当知道,为了实现上述流程,必须把握作角平分线的数学本质。这就需要启发学生理解:角平分线是把角的大小平均分为两部分的那条线;因此需要知道:角的大小是由角所对应的单位圆的弧长或弦长决定的[^75];所以,角平分线是这个角的顶点与对应弦长中点的连线;这样,作角平分线的方法等价于作弦长垂直平分线的方法。基于这样的思路,教材尺规作图安排体例,需要先学习作线段垂直平分线、然后再学习作角平分线。\n上面的教学案例设计,这就是课程标准所要求的\"能想象出通过尺规作图的操作所形成的图形\"的教学理念和实践流程。\n通过尺规作图想象基本事实。回顾课程标准中关于\"几何直观\"内涵述说:\"几何直观主要是指运用图表描述和分析问题的意识与习惯\"、以及功能述说\"几何直观有助于把握问题的本质,明晰思维的路径\"。因此,可以通过尺规作图启发学生想象、猜想数学的结论。比如,得到并表述两个三角形全等所需要的基本条件。\n这样,为了引导学生经历猜想、表达数学结论的过程,可以把课程标准所要求的[^76]:\"能用尺规作图:已知三边、两边及其夹角、两角及其夹边作三角形\"的内容,可以安排在\"三角形全等\"内容的一开始,通过\"作一个三角形全等于已知三角形\"的尺规作图的教学,引导学生自主探索作图最少需要什么条件,感悟三角形全等基本事实的合理性,理解什么是基本事实。\n问题17 如何理解和表达图形的运动?\n这里所说的图形运动主要是指:平移、旋转和轴对称。事实上,这些内容贯穿整个数学教育,从小学数学开始,历经初中、高中,直到大学线性空间的正交变换[^77]。各个学段教学重点有所不同,大体上是:逐渐抽象概念、揭示本质。比如《义务教育数学课程标准(2022年版)》在小学阶段大体要求:能借助方格子认识图形平移、旋转和轴对称,能欣赏生活中的相关图案,感受数学美,形成空间观念;在初中阶段大体要求:能够理解这些运动、以及与这些运动有关的概念,能够探索与运动有关图形的性质,能够进行相关图案的设计;《普通高中数学课程标准(2017年版)》选修A类课程进一步要求:了解平面变换的含义,理解平面的等距变换,特别是三种基本变换:直线反射、平移、旋转,了解空间变换的含义,理解空间的等距变换,特别是三种基本变换:平面反射、平移、旋转。容易看到,教学的主线是存在的,这就是,述说三种图形运动的形式和运动的不变量。\n首先,应当让学生感知,运动是需要参照物的,因为没有参照物无法感知运动。比如,坐在拉上了遮光板的飞机上,往往就感觉不到飞机的运动;坐在相对运动的两列绿皮火车的窗口,往往会以为自己乘坐的火车在动,直到对面的火车开走、看到站台边的房屋,才会发现自己乘坐的火车并没有动。因此图形运动的教学,要让学生知道平移、旋转和轴对称三种运动参照物的参照物是什么,特别是,知道数学所说的图形运动如何借助参照物进行表达。\n其次,应当让学生感知,运动中不变量的重要性,因为几何不变量往往揭示了物理运动、或者、几何变换的本质[^78]。如高中数学课标所表述的那样,这三种变化是最基本的等距变化,或者更通俗地说,通过平移、旋转和轴对称这三种图形运动,图形中任意两点间的距离保持不变。这也就意味着,这三种图形运动等价于图形的全等。\n根据课程标准的要求,小学阶段应当让学生感悟这三种运动的基本性质,初中阶段应当让学生尝试用数学的语言表达这三种运动的形式特征。我们依次分析如下。\n平移运动。参照物是一条射线,初中数学可以定义为:\"平移运动后,图形上每一个点沿射线方向移动相同距离。\"如果以射线的始点0为原点、射线方向为横坐标正方向建立平面直角坐标系。用\nα\n表示图形运动后点移动的距离,在图形上任取两个点x和y,经过平移运动后对应的点分别为a和b,那么运动前后坐标有如下关系:\n,;,。\n可以得到a-b=x-y,因此平移运动不改变两点间距离。\n旋转变换。参照物是一条射线,初中数学可以定义为:\"旋转运动后,物体上的每一点到射线原点的距离不变、相对射线方向旋转相同的角度。\"与平移运动一样设立平面直角坐标系,仍然用x、y和a、b表示运动前后的点。用\nρ~x~和 ρ~y~分别表示向量x和y的长度,用 θ~x~和\nθ~y~分别表示向量x和y与参照物射线的夹角;用 φ\n表示运动以后旋转的相同的角度。可以用极坐标表示运动前和运动后的点:\n,;\n,;\n,;\n,。\n回忆三角函数公式:\n\n\n可以得到[^79]\n,\n因此,旋转变换保持两点间距离不变。\n轴对称运动。参照物是一条直线,初中数学可以定义为:\"轴对称运动后,图形翻转到直线的另一侧,运动后对应点到直线的距离保持不变。\"因为图形翻转需要借助三维空间,因此,上面的定义只是一种形象的描述,更重要的是数学表达。\n与平移运动一样设立平面直角坐标系,仍然用x、y和a、b表示运动前后的点,那么运动前后点坐标之间的关系为:\n,;,。\n因为\n,,\n因此可以得到\n,\n因此轴对称运动保持两点间距离不变。\n高中数学的选修课程将会通过矩阵表述上面的图形运动的过程,大学数学称这样的运动形式为线性变换,把三种形式的变换分别称为:平移变换、旋转变换和反射变化,并且证明这三种变换都属于正交变换,形式上对应矩阵的行列式为1,实质上变换保证两点间距离不变,物理上是对刚体运动的刻画。这就意味着,这三种形式的变换、以及这三种变换的复合变换就刻画了欧几里得几何的运动形式,也就刻画了牛顿力学的运动形式。\n问题18 相似图形的本质是什么?\n如果把图形全等看作图形相似的特例,那么,就应当很好地理解图形相似的本质。人们通常把两个形状一样、但不一定相等的东西称为相似,基于这样的常识,初中数学所说的相似是指成比例的平面图形,特别针对多边形,可以抽象出\"对应角相等、对应边成比例的两个多边形相似\"的定义。这样,两个多边形全等就是相似比为1的相似,因此全等是相似的特例。\n关于相似多边形,初中数学的教学难点是两个三角形的相似,之所以成为教学的难点,是因为,两个三角形相似只需要三个角相等这个条件,而不需要对应边成比例这个条件。因为这个命题与多边形相似的定义所需要的条件少,因此这个命题的正确性是需要证明的,人们称这个命题为三角形相似的判定定理。这个判定定理的证明需要基本事实,2011年版和2022年版的数学课程标准选定的基本事实都是:两条直线被一组平行线所截,所形成的对应线段成比例。人们也称这个基本事实为平行线切割定理。既然称为定理,那么这个基本事实就是可以证明的,比如,可以通过计算面积的方法证明。但这个证明对于初中生还是有一定的难度,所以课程标准把这个定理作为基本事实。\n一个更为直观的基本事实。事实上,还可以建立更为直观的基本事实,这个基本事实对于相似形是非常一般的,这就是:\n对于任何给定比例,相似多边形存在。\n可以看到,这个基本事实非常类似欧几里得几何最初给出的公理,因此可以称这个基本事实为相似多边形存在公理。如下所示,基于这个基本事实,很容易证明三角形相似判定定理。\n\n现在述说证明过程。设角度对应相等的两个三角形分别为 Δabc和\nΔABC。如图所示,在 ΔABC中以A为端点在AB上截AD=ab,作与 ΔABC相似三角形\nΔADE,根据多边形相似存在公理,这样的作图是可以的。因为∠a=∠A,∠b=∠B=∠ADE,因此\nΔabc与 ΔADE全等,所以 ac=AE,bc=DE,即 Δabc与\nΔABC的对应边成比例,因此判定这两个三角形相似。\n通过上面的证明过程可以知道,判定两个三角形相似之所以可以只考虑角相等、而不用考虑边成比例,是因为\"角边角\"这个三角形全等的判别定理只涉及一条边;因此,只要假定任意给定比例的相似多边形存在,那么判定两个三角形相似就不用考虑对应边成比例了、或者说、对应边就自然成比例。进一步,如果证明了三角形相似的条件,那么反过来再证明平行线切割定理就比较简单了。\n可以看到,上面的证明路径简洁明快,但需要比较深刻的逻辑推理。在修订《义务教育数学课程标准(2011年版)》时,我曾经希望把上述存在公理作为基本事实,但修订组的部分成员反对这样的方法,认为其中的逻辑论证、特别是关于存在性的论证方法不适于中国学生,于是我就放弃了这个想法,把平行线切割定理作为基本事实。\n存在性的重要性。确实如此,中国传统思维、进而中国传统数学重视构造性论证,几乎没有关于存在性的论证,但无论如何,存在性的思维对于数学研究和哲学研究都是重要的[^80]。比如现在小学数学教学,对于三角形内角和180度这个命题,有一个非常流行的解释方法:\n从矩形出发,矩形是由四个直角组成的,因此矩形内角和为360度;连接矩形的对角得到两个相等的直角三角形,因此直角三角形的内角和为180度;因为任何一个三角形都可以化为两个直角三角形,去掉中间的平角180度,得到三角形的内角和为180度。\n这个论证方法似乎非常有逻辑、非常合情合理,但人们忽略了论证的前提,这个前提就是存在性的基本事实,这就是矩形的存在性。如果没有存在性的基本事实,那就需要论证四个角都是直角的四边形存在,具体论证这个命题就会发现,这比论证三角形内角和180度还要困难。\n因此,对于中国的数学教育,完全忽视表述存在性假的基本事实是不可以的,这将会失去逻辑论证的起点。现在,我把这些内容写在这里,希望初中数学教师在教学活动中参考,尝试设计有效的、基于存在性的教学方法。如果在教师的引导下,学生能够理解、并且很好地接受基于存在性的论证思路,可以为中国基础教育阶段数学教育的创新性发展提供有益的经验。\n问题19 如何理解初中数学中的三角函数?\n我们在问题13曾经论证,在本质上,初中数学中的三角函数不是函数,这是因为,初中数学角的表达、也就是三角函数自变量的取值不是10进制的实数,而是60进制的角度。因此,在表达上,不符合高中函数定义\"实数到实数对应\"的要求;在使用上,无法进行形如sinx +\nx的计算。\n表达直角三角形的边角关系。因此,初中数学学习三角函数不是为了研究函数,而是为了表达直角三角形的边角关系。如果说勾股定理是表达直角三角形三个边关系的重要工具,那么三角函数就是表达直角三角形边角关系的重要工具。\n初中三角函数的教学,可以引发学生思考这样的问题:在直角三角形中,最重要的表达边角关系的三角函数是什么?我想,对于高中数学或者大学数学,重要的三角函数是余弦函数,这个重要性是基于数学意义的,因为余弦函数蕴含了三角函数的算律[^81];对于初中数学,重要的三角函数是正切函数,如下所述,这个重要性是基于现实的。\nb\na\nB\nC\nA\n正切函数述说的事实是:无论直角三角形相差多大,如果有一个锐角相等,那么这些三角形对应直角边长度的比相等,也就是说,这个常数就是所说的正切值。如图所示,如果两个直角三角形的一个锐角相等,把对应直角边分别表示为\na,b和A,B,那么可以得到 b/a=B/A。如果用 β\n表示这个锐角,那么就可以把正切函数表示为\n\n的形式。这就是在直角三角形中,一个锐角与两个直角边之间的关系。\n不可思议的是,在距今三千多年以前、甚至在更早的时候,古巴比伦和中国古代就发现了这样的关系,并且借助这样的关系解决实际问题。佐证就是:古巴比伦利用这样的关系计算了正切表,中国古代利用这样的关系测量了太阳的高度(参见话题13)。\n古巴比伦制作了正切表。初中数学利用正切关系计算不可直接测量物体的高度,比如,如果上图中B的高度不可直接测量,那么测量了a,b和A就可以计算出B的高度。或者更一般地,如果事先分别对于不同的角度\nβ\n计算对应的正切值,那么在应用的时候,只需要测量A就可以计算B的值。人们称记载正切值的数表为正切表。考古发现,在公元前1600年以前的古巴比伦人就已经造出正切表[^82],究其原因,大概与古巴比伦的城市建设有关。\n奔流不息的底格里斯河和幼发拉底河发源于现今的土耳其,流入波斯湾,这两条河流浇灌出了美索不达米亚平原,养育了两河流域文明。公元前19世纪,这片土地上曾经建立了一个强盛的巴比伦王国,首都建设在巴比伦城,于是人们称那时的文明为古巴比伦。两河流域文明延绵3000多年,是世界古代文明的重要组成部分,古巴比伦是两河流域文明最重要的阶段,但不是全部。关于巴比伦城,希罗多德在《历史》这部书中是这样描述的:\n这座城市位于一个大平原之上,形状是正方的,每一面有120斯塔迪昂长,因此它的周围就一共是480斯塔迪昂了。这座城市的幅员有这般大,而它的气派也是我们所知道的任何城市所难以相比的。\n文中提到的长度单位一个斯塔迪昂大约为211-224米,如果希罗多德的记载是可靠的,那么古巴比伦城一面的长度大约为26公里,这座城市的占地面积大约为670平方公里,大小相当于现在的新加坡,确实是一个相当大的都市。当时的人们在巴比伦城建了许多高大的建筑,包括列为世界七大奇迹之一的空中花园[^83]。但是,希罗多德的许多记载是不可靠的,不像司马迁的《史记》那样经得起推敲。\n两河流域的人们在泥版上刻写楔形文字得以保存,在已经发现的几十万块泥版中大约有300块是与数学有关的,包括一些数表,比如乘法表、倒数表、平方表、立方表,以及前面提到的正切表。特别是,其中有一个被称为\"普林顿322\"的泥板,纪录了15组勾股数(详细内容参见话题13)。\n可以看到,在日常生活和生产实践中,古埃及、古巴比伦和中国,都创造出了实用且丰富多彩的经验几何学,但都没有对这些知识进行归纳与抽象,没有总结出几何学的一般概念、原理和方法。对于经验几何学进行高度抽象、从而建立几何学公理体系的,是追究本原、思维严谨的古希腊人。\n问题20 为什么只有五种正多面体?\n对于初中数学的学习,\"为什么恰好有五种正多面体\"这个话题是有趣的,涉及的数学本质也是深刻的,因此,可以作为数学探究的题目,也可以作为综合与实践项目式学习的课题。\n\"空间存在五种正多面体\"的结论是毕达哥拉斯学派发现并证明的,是毕达哥拉斯学派对几何学做出的重要贡献。这五种正多面体是:正四面体、正六面体、正八面体、正十二面体和正二十面体。不言而喻,即便是在今天,能够归纳总结出空间正多面体的种类也是相当困难的[^84],这需要非常丰富的空间想象力。事实上,类似的分类问题至今依然是数学研究的重要研究内容。\n毕达哥拉斯学派为了验证结论,建立了一个从大前提出发的论证方法,开创了演绎推理的先河,成为欧几里得几何的范例。这里所说的大前提,是一个表达多面体点、棱、面个数之间关系的公式。据说笛卡尔1640年已经注意到了这个结果,最终是欧拉在1752年清晰阐述并赋予应用,因此人们称为欧拉公式。如图所示,如果用V表示多面体顶点的个数,E表示棱的个数,F表示面的个数,那么可以把欧拉公式表示为\n\n的形式,这是一个几何不变量。\n\n或许,毕达哥拉斯学派是通过对若干多面体的具体计算归纳得到这个公式,因为没有史料表明毕达哥拉斯学派曾经论证过这个结论的正确性。下面,我们先讨论,如何利用欧拉公式论证只存在五种正多面体,然后再讨论欧拉公式的证明。\n只有五种正多面体。正多面体是说:每个面都是相同的正多边形,假设每个面都是正n边形,交于每个顶点的棱的个数都是相同,假设有m个棱。尝试用面的个数计算棱的个数,因为每条棱属于两个面,因此可以得到\n;\n再用顶点的个数计算棱的个数,因为每条棱有两个顶点,可以得到\n;\n把这些结果代入欧拉式,可以得到\n,\n整理以后可以得到\n。\n因为每个面的多边形至少有三个边,因此n≧3;每个顶点处至少有三个棱相交,因此m≧3。又因为E必须是正整数,由上式知道,n和m不能同时为大于3的数,否则上式的左边将会不大于1/2。这样,就只有下面的两种情况:\n当n=3时,m=3,4,5;E=6,12,30。分别对应正四面体、正八面体、正二十面体。\n当m=3时,n=3,4,5;E=6,12,30。分别对应正四面体、正六面体、正十二面体。\n这样就得到了毕达哥拉斯学派的结论。\n欧拉公式的证明。用L(G)=2表示欧拉公式,也称为欧拉示性数,是凸多面体的不变量。下面,我们直观论证这个结果的正确性。\n把一个多面体去掉底平面,可以想像一个多面体形状的孔明灯[^85],棱是支撑骨架,底面敞开,其他的面粘上橡皮薄膜。因为底面是敞开的,这个孔明灯实际上只有F-1个面。把这个孔明灯向敞开的底面压缩,骨架保持不变、每个面可以膨胀或收缩,直到把孔明灯的其他几个面平铺到一个平面上。这样操作的结果,孔明灯的顶点、棱和面的个数都没有改变,最终形成一个网络。用H表示这个平面网络,因为只是缺少一个面,那么欧拉示性数L(G)=2等价于证明L(H)=1。\n接下来的论证需要借助简单网络。称一个由三个顶点和三个棱组成的网络为简单网络,可以想象,一个简单网络就是一个三角形,由三个顶点、三个棱和一个面组成。可以把多面体压缩的平面网络与简单网络之间的关系表述如下:\n任何一个多面体压缩的平面网络,都可以由简单网络生成,生成过程中欧拉示性数不变。\n是说,欧拉示性数为1是不变量。\n这个关系之所以成立,是因为,如果在简单网络的一个棱上再粘上一个简单网络,使得一个棱是共同的,这样就增加了一个顶点、两个棱和一个面,欧拉示性数没有变。进一步,把这个共同的棱去掉,得到一个四边形,这样的操作去掉一个棱和一个面,欧拉示性数也没有改变。同样的方法,在四边形的四条棱上各粘一个简单网络,欧拉示性数仍然没有变化。如此重复,可以生成各种形式的平面网络,欧拉示性数L(H)=1始终没有变。因为恢复多面体只需要加上一个面,这就证明了欧拉公式。\n通过上面的讨论可以看到,古希腊学者经历了百年以上的几何学的研究,甚至还开展了学院式规范的几何学教学活动。比如,著名的柏拉图学院(Plato\nacademy),那是在公元前385年左右的事情,是柏拉图在雅典城创建的,除讲授天文学、音乐等课程之外,数学内容包括算术和几何。这个学院直至公元529年被[查士丁尼大帝](https://baike.baidu.com/item/%E6%9F%A5%E5%A3%AB%E4%B8%81%E5%B0%BC%E5%A4%A7%E5%B8%9D)封闭,前后延续将近千年。学院创建初期,就培养了伟大的学者亚里士多德。这些都为欧几里得写出《原本》奠定了深厚的学科的和思维的基础。\n问题21 什么是空间与空间观念?\n空间是几何学最基本概念,课程标准\"图形与几何\"这个领域,第一学段的开篇就要求:辨认简单的立体图形和平面图形。这里所说的立体和平面都是空间的具体内容,前者说的是三维空间、后者说的是二维空间。这样,入学伊始,空间这个概念就伴随数学的学习,直到初中、高中、大学。那么,到底什么是空间呢?\n如何认识空间。空间与时间是人类认识、理解和表达现实世界最重要的概念,也是最难解释清楚的概念。中国古代用宇宙这个词表述空间和时间,宇是说空间、宙是说时间[^86]。当今时代,人们用定量方法给出了时间和空间的定义:1967年第13届国际计量大会定义了时间单位\"秒\",1983年第17届国际计量大会借助秒定义了距离单位\"米\",分别为:\n秒:铯133辐射9,192,631,770个周期的时间间隔\n米:光在真空中1/299792458秒所经过的距离\n这样,空间的本质就是距离,是量化定义的。因为几何学是关于空间形式的科学,因此,几何学的本质就是距离,如法国数学家庞加莱所说[^87]:\n如果距离、方向、直线这种直觉,简言之,空间的这种直接的直觉不存在,那么我们关于它所具有的信念从何而来呢?如果这只不过是一种幻觉,那么这种幻觉为什么如此牢固呢?考察一下这些问题是恰当的。我们说过,不存在关于大小的直接的直觉,我们只能达到这数量和我们的测量工具的关系。因此,如果没有测量空间的工具,我们便不能构造空间。\n庞加莱的论述是非常有道理的,如果没有测量空间的工具,便不能构造空间,而确定测量工具的关键是确定距离。我们在问题1曾经讨论,人对于数量多少的感知和对距离远近的感知是本能,因此,人对空间的感知源于对距离远近感知的本能,基于这样的本能,人能够判断线段的长短、面积的大小和体积的大小,形成对于空间的直观。\n如果上面的分析是正确的,那么,空间的本质在于维数,维数是人们表达线、面、体这些几何学最基本概念的基础,如亚里士多德在《论天》中所说[^88]:\n连续乃是可以分成部分的东西能够永远再分,物体就是在一切方面都可分的东西。大小如在一个方面可分就是线,两个方面可分乃为面,在三个方面可分则是体。除了这些之外,再无其他大小,因为三维就是全部,三个方面就是一切方面。\n这样,通常所说的\"线\"对应于1维空间,\"面\"对应于2维空间,\"体\"对应于3维空间,如果进一步补充,在任何方向都不可分就是点,\"点\"对应于0维空间。这样我们就建立了描述空间的最基本概念。\n空间观念与相应的教学设计。空间观念的核心是空间想象力,包括对空间静止物的想象、也包括对空间运动物的想象,静止物是指,能够认识、想象、并且描述空间物体的形状,能够用数学的语言表达物体之间的位置关系;运动物是指,能够认识、想象、并且描述空间物体的简单运动,能够用数学的语言表达运动的规律、以及运动过程中的不变量。\n在现实世界,我们看见的物体都是3维的,所谓0维的点、1维的线、2维的面都是基于3维物体的形状抽象出来的东西,并不是真正的存在。这就像数字一样,现实世界并不存在数字2,存在的只是与数字2对应的那些具体的2匹马、2粒米。因此,对于基础教育阶段的数学教育,所谓图形的抽象,就是利用线条把3维物体的形状表达在2维平面上,包括0维的点,也包括1维的直线;还包括需要借助想象力表达的2维平面和3维空间。也就是,利用适当的语言或者恰当的符号,表达那些对空间物体的形状抽象了的东西,就像我们在问题1中讨论过的那样。遵循这样的理解,2022年版的义教数学课标,设计的\"图形与几何\"领域的教学路径如下。\n小学数学。第一学段,通过分类认识立体物体的形状;第二学段,借助长方体得到点、线、面等图形的抽象;第三学段,借助线段、面积、体积等几何度量,进一步认识空间和平面的图形。引导学生直观感悟空间和那些以空间为载体抽象并表达的图形,形成空间观念和几何直观。\n初中数学。在小学直观认识的基础上,建立几何图形的概念,研究几何图形的性质,理解并初步掌握几何证明、即演绎证明的形式;通过平移、旋转和轴对称等图形的运动,初步感悟几何变换的规则和几何不变量的重要性,发展空间观念和几何直观。\n数学语言的表达。对于空间的认识,正如我们在问题14所讨论的那样,初中数学借助数轴和直角坐标系,量化表达点、线、面等空间的基本概念,反过来,又通过图像直观表达函数的变化规律,这样就构建了几何与代数之间的桥梁,形成了数形结合的基础。量化表达的核心是空间的维数,比如表达一个\"点\"的\"数\"的多少决定于这个点所在空间的维数。比如,1维空间的\"点\"用1个数表达,2维空间的\"点\"用2个数组成的数对表达,如此类推。\n在上一个问题,我们强调了几何变换与几何不变量的重要性,特别说明,刚体变换适用于欧几里得几何,这种变换保持两点间的距离不变,所以也保持角度、面积这些特性不变,进而可以建立全等这样的概念。由此可见,刚体变换是限制最为严格的一类变换。另一个极端,是限制最为宽松的一类变换,这就是拓扑变换。拓扑变换下的不变量是空间维数,允许\"把直线变为曲线\"\"把三角形变为椭圆\"\"把金字塔变为圆球\",因此,可以完全忽略物体的形状。如果说最一般就是最本质,那么这也从另一个角度说明,维数是空间最为核心的要素,就像我们在前面分析的那样。\n问题22 如何理解一笔画?\n上一个问题谈到,限制最为宽松的几何变换是拓扑变换,作为一个说明,我们简单回顾拓扑学的起源。拓扑学起源于一个类似游戏的问题,被称为哥尼斯堡七座桥问题。\n哥尼斯堡七座桥问题。十八世纪,普莱格尔河流经东普鲁士的哥尼斯堡,也就是现在隶属于俄罗斯的加里宁格勒,如下图的左图所示,人们修建了七座桥把河的两岸与河中的两个岛连接起来。当地的居民经常在这里散步,后来他们提出这样的问题:是否能在一次散步中不重复地走遍这七座桥,他们始终得不到问题的答案。当时正在圣彼得堡的欧拉知道了这个问题,决定解决这个问题。\n首先,欧拉把问题抽象成四个点和七条线所构成的图形,如下图的右图所示。于是,问题就可以等价地变为:是否能够一笔把这个图形画出来,后来人们称这样的问题为一笔画问题。\n{width=\"5.083333333333333in\"\n哥尼斯堡七座桥问题\n可以看到,欧拉所展示的图形抽象非常重要,这样的抽象可以明晰数学问题、启迪研究思路,这也就是我们所说的\"几何直观\"的核心要素。抽象的过程表明,问题中的河流、桥、岛、河岸等等都不是本质的,本质的要素只有点和线、以及它们的关系。借助欧拉的抽象可以这样分析问题:如果从某一点出发不重复走遍每一个点,那么中途经过的点一定有进有出,应当有偶数条线与其相连;如果终点与始点重合,那么这个点也应当有偶数条线与其相连。但从右图可以看到,图中的每个点都是奇数条线与其相连,因此欧拉断定,无论是否要求最终回到始点,都不可能在一次散步中不重复地走遍这七座桥。这样,欧拉就解决了哥尼斯堡桥问题。\n1736年,欧拉于发表了这个结果,文章的题目就是《哥尼斯堡的七座桥》。他在文章的开头说出了研究这类问题的重要性,即研究这类问题的几何学实质[^89]:\n讨论长短大小的几何学分支一直被人们热心地研究着,但是还有一个至今几乎完全没有探索过的分支;莱布尼茨最先提起过它,称它为\"位置几何学\"(geometria\nsitus)。这个几何学分支讨论只与位置有关的关系,研究位置的性质;它不去考虑长短大小,也不涉及量的计算。但是至今尚未有令人满意的定义,来刻画这门位置几何学的课题与方法。\n高斯也认为研究这类问题很有意义,他的学生、哥廷根大学物理教授李斯廷在1848年出版的著作《拓扑学的初步研究》中讨论了这类问题。李斯廷之所以使用\"拓扑学\"而没有使用\"位置几何学\"这个术语,是因为当时已经有人把射影几何学称为位置几何学,比如一年前的1847年,德国数学家施陶特出版的《位置几何学》,希望用摆脱代数和度量的、全新的方法来建立射影几何学[^90]。\n拓扑学一词的原意也是关于位置的学问,现代英文中\"拓扑\"一词topology来自李斯廷创造的德文topologic,这个词是由希腊语\nτοποζ(位置、形势)和\nλογοζ(学问)组合而成的。因此,这个词体现了这门几何分支学科所要研究的问题。\n可以看到,在这样的研究中,平面上的线是直线还是曲线已经不重要了,比如右图是由一些点和线组成的,拓扑学称这样的图为网络,称其中的点为顶点,称连接顶点之间的线为棱,称由一些棱首尾相连组成的线为路径。如果一个网络的任意两个顶点之间都可以通过路径连接起来,则称这个网络为连通网络,称连接某个顶点棱的个数为这个顶点的指数。\n一个重要的问题,是讨论网络中顶点个数与棱个数之间的关系。用E表示棱的个数,用a~k~表示指数为k的顶点的个数。如果一个网络中最大的指数为n,即连接顶点的棱最多有n个,可以得到\n。\n比如在哥尼斯堡桥问题中,n = 5、a~1~ = a~2~ = a~4~ = 0、a~3~ = 3、a~5~ =\n1,所以棱的个数数为\n,\n通过右图可以验证这个计算结果是正确的。\n用网络语言表达的一笔画问题。如欧拉所述,哥尼斯堡的七座桥问题可以归结为一笔画问题,下面通过网络定义一笔画问题。首先,借助网络的术语描述一笔画问题:\n通过网络的所有顶点,每个棱只能通过一次。\n这样,一笔画要求网络是连通的,并且通过对哥尼斯堡七桥问题的分析知道,奇顶点的个数不能超过2。又因为连通网络奇顶点的个数必为偶数,因此可以用代数的方法定义一笔画:\n一个网络是一笔画,当且仅当这个有限网络是连通的,奇顶点的个数为0或者2。\n如右图所示,哥尼斯堡七桥问题奇顶点的个数为7,因此不能一笔画。同时也可以想象,如果在哥尼斯堡七桥问题中任意去掉一条棱,那么就可以一笔画。\n更为一般地,用W表示一个网络,用V表示这个网络顶点的个数,用E表示棱的个数,人们通常把度量指标\n\n称为网络W的欧拉示性数。通过几何直观可以知道,对于任意连通网络,欧拉示性数都不大于1。我们通过最简单的连通网络证明这个直观的正确性。\n最简单且应用广泛的连通网络被称为树,在网络中,两个顶点之间至多有一条棱,并且所有指数为1的顶点都是终点。这样的网络就像树与树枝的关系一样,每个树枝都有一个顶点。通过数学归纳法可以证明[^91],树的欧拉示性数是一个不变量:L(W)=1。因为,任意连通网络都可以在保持顶点个数不变的前提下、去掉一些棱得到树,因此树就构成了连通网络最简单的形式。因为只是在连通网络中去掉一些棱,这就意味着,任意连通网络的欧拉示性数都不大于1。\n有向网络与贝叶斯网。如果在连通网络中,在棱上用箭头标出方向:箭头起始的顶点为先、箭头所指的顶点为后,那么就称这样的连通网络为有向网络。有向网络有着广泛的应用:如果把顶点看作事件,就可以把先看作原因、把后看作结果,于是有向网络就构成了一个因果关系图,是研究现代信息科学、计算机科学的重要工具;如果把顶点看作生物的代,把先看作父代、把后看作子代,于是这个有向网络就构成了一个遗传图谱,在传统生物学、以及基于DNA的遗传学中展示重要意义。如果在一个有向网络中,每一个顶点都既为先又为后,那么这个有向网络是首尾相接的,称这样的网络为环。\n在现实世界中,人们往往事先不知道一个路径一定会经过哪一个棱,因此对于每一个具体的过程,路径是随机的,可以用概率的语言刻画每一个棱经过可能性的大小,人们称赋予概率的有向无环的连通网络为贝叶斯网。之所以称为贝叶斯网,是因为贝叶斯网中棱概率的计算与条件概率有关,而英国统计学家贝叶斯提出的先验概率的思想可用于计算这一类问题的条件概率。\n人们称现今是大数据时代,这是因为计算机技术和信息技术的飞速发展,使得信息获取能力和储存能力都获得很大的提高,并且能够对这些信息进行快速的整理和分析。比如,互联网、股票市场、基因组学、流行病学、生态环境学、认知科学等等,都需要构建相当庞大的有向网络系统,这是因为,利用贝叶斯网表达这些情境的信息是比较便捷的。这类网络的数量化研究与传统数学有很大的区别,传统数学更多地是用显性表达式,比如,人们致力于构建表述变量之间因果关系的函数,但对于大数据,不仅变量巨多而且关系非常复杂,使用传统数学的方法不仅非常困难、而且没有必要,因为人们关心的不是因果关系,而是更多地关注变量之间是否存在关联,比如,寻求随机变量之间的相关关系,甚至只需要寻求变量之间是否存在关系、以及从此关系到彼关系之间路径的可能性,这恰好可以用网络的语言进行数学定量化表达,如同下一部分所要讨论的那样。\n4. 统计与概率\n在本质上,数学研究的是确定性问题,是变量之间的因果关系,也就是说,当自变量的值确定了,那么对应的函数值就唯一确定了。但在现实生活中,大多数的事物都是不确定的,在同样的条件下,发生过的事物可能发生、也可能不发生,可能以这种程度发生、也可能以那种程度发生,人们称这样的现象为随机现象。人们尝试用数学的方法认识、理解和表达随机现象,这就是概率论和统计学。\n但是,并不是所有的随机现象都可以从数学的角度进行研究,概率论和统计学研究那些发生可能性有规律的随机现象,人们称这样的随机现象为随机事件,称随机事件发生可能性大小的度量为概率。概率是随机现象的固有属性,也就是说,虽然随机事件发生的可能性是变化的,但发生可能性大小的度量、即概率是不变的。正是因为具有这样的属性,使得数学同一律得以成立,使得用数学的方法研究和表达成为可能。但是,概率论与统计学的研究思路却是有所不同。\n概率论从思辨的角度进行研究,其中的概率是通过定义得到的。比如,拉普拉斯给出了概率的古典定义,柯尔莫哥洛夫创立了概率论公理化体系,毋庸置疑,这些都是数学发明的杰作。但是,在公理化的概率论中,已经感悟不到随机事件的可能发生也可能不发生、可能以这种程度发生也可能以那种程度发生的神秘感了。\n统计学从事实的角度进行研究,其中的概率是通过推断得到的。事实是说研究的基础是数据,更确切地说,统计推断的基础是数据。统计学的研究通常要经历分析数据背景,设计方案获取数据、创造方法估计概率、构建模型预测发生等流程,最终形成关于随机现象的知识。因为随机现象中变量的关系不是因果的,而是随机的、关联的、是用概率表达的,因此统计推断在本质上是一种判断、或者说、是一种决策。统计学对随机现象的决策或判断只有方法的好坏之分、而无结论的对错之分。也正因为有方法的好坏之分,因此一个合理的决策过程,应当事先确立判断方法好坏的准则,然后按照准则行事,并且用准则衡量决策的结果。\n因此,无论是研究的基点、还是思维的路径、分析的过程、判断的准则,统计学与数学都是\"合而不同\"。相对而言,数学更侧重于科学,强调确定性和因果关系,统计学是科学、但更侧重于艺术,强调或然性和相关关系。大数据时代为统计学的发展提供了机遇,这是因为大数据最基本的特征就是不确定性,于是统计学通过机器学习等融入信息技术,得到了长足的发展。\n问题23 如何理解随机事件和概率?\n数学历来被认为是确定性的科学,这就意味着,从同样的条件出发就应当得到同样的结论,如果得到的结论不一样,那么,人们就会认为其中至少有一个结论是错误的。在这个意义上,数学研究事物之间的因果关系,数学结论的确立最终需要通过演绎推理的论证、即通过思辨的验证,而不是通过现实世界的验证。几乎所有从事过数学研究的人都知道,如果要否定一个命题,那么只要举出一个反例。\n但是,在我们的现实生活中,遇到的事情大多数都是不确定的,也就是说,事先无法确定这个事情是否一定会发生,会发生到什么程度。比如,在日常生活中,学生在学习的过程中很难预料期末考试是否会得到90分以上,热衷于购买彩票的人在购买彩票时很难预料自己购买的彩票是否会中奖;在生产实践中,农民在春天播种的时候很难预料秋天的收成,投资者在项目资金注入时很难预测是否一定会盈利;在军事活动中,在发射炮弹时很难预料是否能够命中目标,在实施突袭的时候很难预料是否会出现意外;等等。人们通常称这样的结果不确定的事情为随机现象。\n如果要用数学的方法研究随机现象,那么就需要对随机现象的发生进行假设,要求随机现象的发生是有规律性的;所谓规律,是指随机现象发生可能性的大小是可以度量的。在这个意义上,\"数学的本质在于度量\"这个断言依然成立。人们把发生可能性大小可以度量的那些随机现象称为随机事件,称随机事件的度量为概率。这样,概率就是随机现象的固有属性,也就是说,虽然随机事件发生的可能性是变化的,但发生可能性大小的度量、即概率是不变的。这样的属性使得数学同一律得以成立,使得用数学的方法研究和表达成为可能。\n概率论从思辨的角度研究随机事件。虽然概率论和统计学都是用数学的方法研究随机事件,但研究的思路、进而研究的路径有所不同。概率论从思辨的角度进行研究,统计学从事实的角度进行研究。为了说明这个区别,我们从一个简单的问题入手。比如,过去教材中会出现的抛掷硬币的问题。\n连续抛掷均匀的硬币5次,出现的都是正面,问第6次出现正面的概率。\n这是概率论的问题,正确答案是,出现正面的概率仍然是1/2,原因是抛掷硬币的行为是独立的,因此概率保持不变,这是基于思辨的。但是,统计学更基于事实,认为发生了小概率事件,因此会考虑推翻出现正反面概率相等的假设,对硬币的均匀提出质疑。\n现在,我们分析下面的例子,研究概率论是如何定义随机事件的概率。问题是\n> 掷一枚骰子,求出现点数为偶数的概率。\n>\n> 显然,\"出现点数为偶数\"这个事件可能发生、也可能不发生,是一个随机事件。凭借直观,我们可以认为这个随机事件发生的概率为1/2,现在分析确定随机事件概率的道理。\n>\n> 首先,明确这个随机事件的背景。这个问题的背景是\"掷一枚骰子\",基于这个背景,可能出现的结果是集合\n> Ω = {1,2,3,4,5,6}\n> 中的一个,因此,称每一个结果是一个基本事件,称这样的集合为样本空间。因此,样本空间只与问题的背景有关,与提出的问题无关。\n>\n> 然后,分析随机事件与样本空间的关系。显然,\"出现点数为偶数\"这个随机事件发生等价于样本空间的子集A={2,4,6}中的一个元素出现,因此,人们把随机事件定义为样本空间的子集。\n>\n> 最后,确定随机事件发生的概率。可以想象,如果这枚骰子是均匀的,那么每一个基本事件发生的可能性是相等的,即每一个基本事件发生的概率是1/6,这是定义在样本空间上的计数测度。因为概率是随机事件发生可能性大小的度量,等价于基于计数测度的对子集A的度量,通常把这个概率表示为Pr(A)。最初的概率是拉普拉斯在1814年出版的一本小册子中给出的[^92]:\n机遇理论的要义是:将同一类的所有事件都化简为一定数目的等可能情况。即化简到这样的程度,我们可以等同地对待所有不确定的存在,并且确定欲求其概率那个事件的有利情况的数目,此数目与所有可能情况之比就是欲求概率的测度。简而言之,概率是一个分数,其分子是有利情况的数目,分母是所有可能情况的数目。\n现在,几乎所有概率论与统计学的教科书,关于概率的定义都采用了上文中的最后一句话:概率是一个分数,分子是有利情况的数目,分母是所有可能情况的数目。可以知道,拉普拉斯的定义是对于表示随机随机的子集的基于计数测度的度量。对于我们的问题,概率为\n,\n其中符号 # 表示集合中元素的个数。\n离散型与连续型。对应于拉普拉斯的\"化简为一定数目的等可能情况\"和\"可以等同地对待所有不确定的存在\"这两个限制,可以用现代数学语言表述为:样本空间中元素的个数是有限的,每一个元素都是不可再分割的基本事件;有元素、即基本事件的概率是相等的。现在,人们称满足这两个限制的概率模型为古典概型,称这样的概率分布为离散型的,离散型概率分布对应于计数测度。\n还有许多随机现象,形成的样本空间是整个实数空间、或者、是实数空间的一个区间,比如,与测量误差、观察误差有关的随机现象。这时,随机事件对应的是实数空间的一个子集,定义的概率是对实数空间子集度量,这样的度量会涉及到积分的运算,人们称这样的概率分布为连续型的,连续型概率分布对应于勒贝格测度。初中数学只讨论离散型的情况,并且只讨论古典概型。\n前苏联数学家柯尔莫哥洛夫,于1933年出版了德文著作《概率论基础》,在样本空间的基础上,借助测度论和实变函数的理论,确立了概率论公理体系。与纯粹数学一样,随机现象的高度抽象对理解和表达问题的本质非常重要。但是,高度抽象是以舍弃直观为代价的,基于概率论公理体系,人们从定义了的概率出发,借助演绎推理验证所有数学化的结论,在这样的过程中,人们已经感悟不到事物发生的随机性,更感悟不到随机事件那种变幻莫测的神秘感。于是,许多学者把基于公理体系的概率论归于纯粹数学,这样,统计学就与概率论分道扬镳了。\n问题24 统计学的思想方法是什么?\n与概率论一样,统计学研究的数学基础也是样本空间,也是用样本空间的子集表示随机事件,但不同的是,对随机事件发生的概率不是定义的,而是基于样本推断的,由此,样本空间这个称谓更适用于统计学。与正因为如此,我们说概率论的研究是基于思辨的,统计学的研究是基于事实的。\n在整个基础教育阶段,统计推断的内容主要包括估计、检验和预测。统计推断的基础是数据,包括收集得到的数据,也包括通过调查研究、或者、实验试验得到的数据。互联网的出现,为数据的获得提供极为丰富的源泉,于是人们称这样的数据环境为大数据。大数据分析已经成为现代科学的重要内容,促使计算机和信息技术得到长足发展,也为数学的发展提供了机遇、进而提出了挑战了。这里所说的数学,涉及的领域主要是计算科学和统计学。比如,最近几年,统计学就相继出现了诸如数据挖掘、特征提取、机器学习等全新的研究领域。\n统计学从现实的角度研究随机事件。统计推断所说的随机事件是指那些可以重复观察的随机现象,这样,如果每一次观察到的随机事件的背景都是类似的,那么显而易见,随机事件发生可能性的大小就可以估计。比如\"期末考试成绩在90分以上\"是一个随机事件,在一般情况下,这个随机事件发生可能性的大小取决于这位学生平时的学习成绩:平时成绩好则发生的可能性大。这里所说的平时成绩就是对于随机事件的重复观察,每一次的成绩都为这个学生的学习状况提供了信息。事实上,有经验的教师对于班级学生的学习状况是有预期的,这也是有经验教师期末考试命题的基本依据。\n这样,统计学的概率就是通过数据提供的信息估计得到的。比如,前面提到的抛掷硬币的问题,如果用n表示抛掷的次数,用m表示出现正面的次数,那么就估计出现正面的概率为m/n,通常称这个比值为频率。我们可以设想,如果抛掷的硬币是比较均匀的,那么,这个频率应当在50%的左右,也就是说,出现正面和出现背面的可能性相当。为了验证这个猜想是不是符合现实,曾经有几位学者进行了极为重要的尝试性试验,谱写了统计学发展历史上的重要篇章。\n起源于意大利的文艺复兴引发了整个欧洲思想的繁荣和科学的发展,主要表现在16世纪到19世纪这段时间。在那个时代,有一些学者开始探究不确定现象中所蕴含的数学规律,最初工作就是验证上面所说的抛掷硬币的直观想象是否正确,这些学者包括英国数学家德·摩根,法国博物学家蒲丰等人。下面数据来源于互联网:\n试验者 抛硬币次数 出现正面次数 频率\n德·摩根 6140 3109 50.64%\n蒲丰 4040 2048 50.69%\n费勒 10000 4979 49.79%\n皮尔逊 24000 12012 50.05%\n维尼 30000 14994 49.98%\n罗曼若夫斯 80640 39699 49.23%\n可以看到,试验结果大体一致,都集中在50%左右,这就说明\"出现正面和负面的概率相等\"这个直觉是正确的,这样说明这些硬币大体上都是均匀的。\n借助频率推断概率,是典型的归纳推理的思维过程,可以表述如下。比如,用A和a分别表示样本空间和样本空间中的元素,用a→P表示基本事件发生,用a~P表示基本事件没有发生。那么,可以把归纳推理的思维过程表示为:\na~1~ ∈ A,验证 a~1~ → P 或者a~1~ ~ P;\na~2~ ∈ A,验证 a~2~ → P 或者a~2~ ~ P;\n......\na~n~ ∈ A,验证 a~n~ → P 或者a~n~ ~ P;\n有m个元素使得性质 P发生;\n/ a ∈ A,推断有m/n的可能性a → P。\n这就意味着,在大多数情况下,通过统计推断获得的结论借助的是归纳推理,因此,不仅结论的正确与否是或然的[^93],就是结论的表述形式也是或然的。这样,统计学就与数学有着本质的区别,数学通过演绎推理验证的结论是必然的,不仅如此,数学结论的表达也是确切的。\n问题25 如何理解样本和总体?\n样本和总体是统计学的最为基本的概念,也是很难述说清楚的概念。在上面两个问题中,我们分别讨论了概率论和统计学对随机事件的研究思路和手法,前者是基于思辨的,后者是基于现实的。但在事实上,比用集合表达随机事件的更为一般的表达是随机变量。借助随机变量,可以更清晰地表述样本和总体之间的关系,展现通过样本认识总体的统计推断过程。\n随机变量类似定义在样本空间上的函数[^94],但与函数有本质差异,函数要求对应于自变量的函数值是唯一的,随机变量却可以取不同的值。比如掷一枚骰子,每一次都可能取1到6中任何一个数,是不确定的。在通常的情况下,人们假定随机变量取某一个值的概率是确定不变的,因为只有这样,才可能得到随机变量的取值规律,称这样的规律为概率分布。如问题23所说,概率分布主要分离散型和连续型两种形式,在初中阶段,主要学习离散型概率分布,并且限定可能取值的个数有限、取每一个值的概率相等,也就是拉普拉斯所表述的古典概型。\n离散型随机变量及其概率分布。考虑一般的离散型随机变量,假定随机变量可能取k个值,把这些可能取值表示为1,...,k,取值概率分别表示为p~1~,...,p~k~,这样,就可以把取值规律表示为\n\n的形式,通常称这样的表达为离散型随机变量的概率分布列。显然,只要把握了概率分布列就把握了离散型随机变量的取值规律,因此,人们把随机变量的概率分布列称为总体。\n在一般情况下,人们并不知道总体是什么,通常采用两种方法进行研究:一种方法是建立假设,通过随机变量的背景建立假设,基于假设推导出随机变量的分布;一种方法是进行估计,通常是对总体抽取样本,通过样本对分布列中的概率进行估计。\n比如,针对上述总体,进行有放回地抽取数据,显然,每一次抽取得到的结果是k个值中的一个,称每一个得到的结果是一个样本。如果有放回地抽取n次,通过对n个样本整理,可以得到样本分别取1到k数值的次数,表示为n~1~,...,n~k~,即n\n= n~1~ + ... + n~k~,那么可以考虑用随机变量取第\nm个数值的频率n~m~/n估计概率p~m~,其中 m = 1,...,k,更一般地,可以得到形如\n\n的概率分布列的估计,这就表述了样本和总体之间的关系。\n由此可见,统计学的研究基础是数据,可以认为总体是数据产生的背景,样本是基于背景收集到的具体数据。比如,要研究某一个城市初中生的身体状况,总体就是这个城市初中生的与身体状况有关的指标,比如身高、体重等等,样本就是抽取若干初中生测量得到的身高、体重等具体数值。对于这样的问题,许多初中数学教材往往会认为总体是这个城市初中生的全体,可以看到,这样的表述并不准确,因为为了得到概率分布,不仅涉及所要研究问题的背景,还要涉及数据所表达的指标。\n那么,为什么可以通过样本对总体进行估计呢?这就涉及到随机变量的两重性。\n随机变量的两重性。随机变量的两重性决定了统计推断的可能。我们还是借助抛掷硬币为例,讨论什么是随机变量的两重性。\n一个随机变量只可能有两个结果,不失一般性,把这两个结果表示为\n0和1,比如,抛掷硬币出现正面记1,出现反面记0;用p表示结果是1的概率,人们称这样的最简单的统计模型为伯努利模型,表示为B(1,0)。为了估计概率p,统计学的基本要旨就是进行独立重复的试验,如果用x表示每一次试验的结果,那么这个结果可能取1、也可能取0,是一个随机变量;如果重复试验n次,把得到的样本表示为x~1~,...,x~n~,令y\n= x~1~ + ... + x~n~\n表示n个样本数据之和,那么y也是一个随机变量,可能取0到n的任何一个数值。\n现在的y就担当了一个非常重要的角色。在n次摸球之前,我们不可能知道具体取值,因此是一个随机变量;但在n次摸球之后,可以计算出具体的结果,因此是一个具体数值。人们通常用大写字母Y表示随机变量,用小写字母y表示随机变量的具体取值;称这样的特性为随机变量的两重性,利用两重性进行统计推断。\n比如,针对上面的问题,首先,利用随机变量的特性研究概率分布,也就是,基于伯努利模型n个独立同分布的随机变量,通过基于组合的数学推导,可以得到概率为p的二项分布;然后,利用随机变量的具体取值进行统计推断,也就是,如果得到y\n=\nm,那么就用频率m/n估计未知概率p。事实上,对于二项分布,频率m/n是参数p的最大似然估计,这是一个非常重要的统计特征,是通过随机变量的特征分析得到的[^95]。这样,我们就完成了通过样本推断总体的过程。\n问题26 为什么要把百分数纳入统计的内容?\n通过上面的论述可以知道,在本质上,统计推断是对随机现象的决策、或者更确切地说、是对随机现象决策的判断。这是因为,随机现象之间的关系不是因果关系,而是随机关系、相关关系、甚至仅仅是一种可能发生的关系,在绝大多数情况下,对于随机现象的决策可以有多种选择,因此可以说,统计推断是对随机现象决策的判断。这样的判断没有对错之分、只有好坏之分,判断原则的不同,这也是统计学与数学的重要区别。也正因为如此,对于随机现象的决策,需要事先建立判断好坏的原则,事后依据原则进行检验和判断。\n在现代社会,基于机器学习的人工智能决策越来越显示其强大的威力,比如,围棋比赛中胜过人类棋手的\nAlpha Go,风靡全球的 Chat GPT 语言大模型,令人惊叹的\nSora视频大模型,等等,其中的思维逻辑就是统计推断,判断的依据就是使得路径达到最优的概率,这样的判断是人类智慧的体现。\n这样的发展趋势体现于《义务教育数学课程标准(2022年版)》,其中一个内容,就是把小学数学中的百分数,从\"数与代数\"领域移到\"统计与概率\"领域。\n在\"数与代数\"领域中的百分数是对不变量特征的刻画,比如,某种饮料中果汁的含量、某银行的年利率等等,述说的是相对稳定的比例关系。在\"统计与概率\"领域,百分数将是对随机变量特征的刻画,比如,某篮球运动员投篮命中率、某个季节下雨的概率等等,述说的是随机事件发生的频率、也就是,对随机事件发生概率的估计。这样,就把百分数作为随机决策、或者说、统计推断的工具,到了初中数学的\"统计与概率\"领域,进一步增加了四分位数、箱线图等与百分数有关的内容。\n事实上,在日常生活和生产实践中,人们经常会把百分数作为随机决策的工具。为了让我国的学生从小就感知随机决策的重要性,知道随机决策的流程,《义务教育数学课程标准(2022年版)》不仅把百分数移到\"统计与概率\"领域,并且设计了相应的教学案例予以说明。下面的案例是提供给项目学习的,也就是说,这样的学习是以完成项目为目标,可以是跨学科的,比如与体育课、语文课一起完成。设计的案例如下[^96]:\n例46 确定五年级学生跳绳达标线\n为了促进学校体育活动的开展,五年级学生决定开展跳绳活动,准备确定五年级学生跳绳达标线。请你设计一个确定达标线的方法。\n这个案例是为学校制定高年级学生跳绳达标线。基本原则要符合学校学生的实际情况,因此要进行调查研究。也就是说,首先需要收集数据,比如,记录五年级100名学生跳绳的次数。为了公平客观,可以让每一位学生跳三次,采用平均或者最多,也可以记录一分钟跳绳次数。应当让学知道,许多决策无所谓对错,但要制定一个规则,然后按规则操作。然后,可以把跳绳数据从少到多排列,利用百分数制定达标线,需要确定原则:如果希望同学们很快就可以达标,那么选择第25名学生跳绳数作为达标线,即四分位数的25%;如果希望同学们经过一定的努力才能达标,那么选择第75名学生跳绳数作为达标线,即四分位数的75%的。这就是随机现象决策的基本思想和操作过程。事实上,我国的蓝天计划就是用这样的方法确定的。\n可以看到,这里所说的百分数实际上就是频率,可以作为概率的估计。在实际应用,上面的操作方法是一种惯例,也就是说,人们更多地关注四分位点,即25%、50%、75%所对应的数据。在初中统计与概率的教学,还要求基于数据,引导学生画箱线图进行进一步的统计分析,感悟和理解统计分析的基本思想方法。\n问题27 如何理解数据分组的原则?\n作为随机决策的参考,数据分类也是统计推断的重要方法。事实上,分类研究是中国古代哲学思想的特色,这是因为[^97]:西方古典哲学更强调一般与特殊之间的关系,中国古代哲学更强调此类与彼类之间的关系。伴随着大数据时代的到来,包括现代数学在内的现代科学,越来越重视分类研究,大体上有两个方面的需求,一个方面是主动的,另一个方面是被动的。\n所谓主动的,是因为科学研究越来越精细,一个放之四海而皆准的方法或结论往往不存在,那么只能把整体分成若干个部分,于是产生了分类的问题。这里之所以说产生了分类的问题,是为了强调分类的标准,因为只有基于合适标准的分类,才可能得到具有相对共性的、相对稳定的方法或结论。所谓被动的,是因为大数据分析的需要,大数据的出现与网络数据有关,不仅数据量庞大,并且种类繁多、结构庞杂、信息稀疏,因此,对数据进行分类研究不仅是方便的、甚至是必须的,通过分类提取类数据的特征,建立特征之间的关系,最终形成产生数据背景的知识。\n基于这样发展趋势,我国基础教育阶段的数学教育,从《义务教育数学课程标准(2011年版)》开始就设置了分类的内容,课标的例20说明了教学目标。教学内容是对扣子进行分类:有黄蓝两种颜色、方圆两种形状、两个或四个扣眼数,要求学生分类,在\"说明\"中阐述了教学目的:\n本活动的目的是希望学生能够清楚,分类是要依赖分类标准的,如扣子的形状、扣子的颜色或者扣眼的数量都可以作为分类的标准,而在不同的分类标准下分类的结果可能是不同的。\n因为在那个时代,这样的教学内容对小学数学教学还是陌生的,因此,在这个例子的\"说明\"中对教学方法也提出了一些建议:\n教师提出问题,引导学生讨论分类标准。可以启发学生这样思考:先关注一个指标作为分类标准,如先关注颜色;在此基础上,在进一步关注两个指标作为分类标准,如进一步关注颜色和形状;最后再关注颜色、形状和扣眼数。这样可以避免出现混乱。\n《义务教育数学课程标准(2022版)》不仅保留了这些内容(见例38),并且在初中的统计与概率的教学中,进一步拓展到数据的分类。分类的方式统计学最常用的方法,即借助离差平方和的分类方法。因为对于随机决策的问题,在本质上没有对错之分,只有好坏之分,因此如下所述,随机决策往往需要事先制定进行决策的原则、或者、判断决策好坏的标准,然后用数学的语言进行表达。最通常的统计方法是借助均值和方差进行表达。\n均值和方差。均值和方差是统计学的两个重要概念。我们在前几个问题中多次讨论,概率论和统计学的目的是用数学的方法研究随机现象的规律,研究随机事件发生的概率、或者、随机变量取值的概率分布。对于统计学,称概率分布为总体,研究手法就是通过样本估计总体。但在许多情况下,我们得不到、或者、也没有必要知道随机变量的概率分布,于是退而求其次,研究随机变量取值规律的特征,均值和方差就是两个非常重要的特征,称为总体均值和总体方差,前者表达了随机变量取值的集中趋势,后者表达了随机变量取值对于均值的离散程度。基于样本计算的样本均值和样本方差分别是总体均值和总体方差的估计,小学数学学习样本均值,初中数学学习样本方差。\n离差平方和。通常称样本值减去样本均值为离差,表示样本值与样本均值之间的差异;称对所有离差的平方求和得到的数值为离差平方和,表示这组样本对于样本均值的离散程度。人们还称离差平方和除以样本个数为样本方差,这是为了比较不同样本对于各自的样本均值的离散程度。因此,对于一组样本而言,往往可以直接使用离差平方和。下面,分析如何利用离差平方和进行数据分类[^98]。\n假如我们得到了一批数据,希望把这批数据分成两组。首先,建立一个分组的基本原则:在同一个组内,数据的差异越小越好;在不同的组之间,数据差异越大越好。基于直观,可以认为这样的分组基本原则合情合理。下面,借助数学的语言表达这样的原则。把得到的数据,从小到大按顺序排列,并且对数据的下标重新标号,得到\n\n的形式,通常称这样整理了的样本为顺序统计量。可以想象,基于上述基本原则,分组的结果不应当改变顺序统计量的顺序,也就是说,第一组的数据一定会小于第二组的数据。\n因此,可以在不改变顺序的前提下,把这些数据划分为两组,如果两组中数据的个数分别为n~1~和n-n~1~个,那么,可以把数据的样本均值、这两组的数据及每个组内的样本均值,分别表示为\n\n;\n和\n,\n其中 n~1~可以取到\n2,...,n-1中的任何一个数。容易知道,离差平方和可以分解为\n\n\n\n的形式。这样,上面最后式子中的第一项表示的组内的差异,称为组内离差平方和;第二项表示的是组间的差异,称为组间离差平方和。\n因为总体离差平方和是不变的,因此组间的差异变小和组间差异变大是同步的,根据分组原则,只需要求求出使得组内离差平方和达到最小的分组。如果让n~1~依次取1到n-1,得到相应的组内离差平方和为\n。\n那么最后的工作,就是在这些值中选取最小,比如,当n~1~=k时值达到最小,那么根据分组的基本原则,最好的分组方法就是\n\n和\n。\n不同组数的比较。我们讨论了把数据分两组的情况,但是在许多情况下,我们事先并不知道把n个数据分成几组最为合适,那么只能采取逐一尝试的方法,优中选优。\n类比上面的利用离差平方和的方法,我们可以考虑把n个数据分为三组、四组、直到分n-1组的情况,然后对每种情况找出最好的分组方案。这样,就得到n-1个最好的分组方案,接下来的工作就是对这n-1个最好分组方案进行比较。虽然也要通过组内离差平方和的大小进行比较,但是,通过计算可以验证,分组的个数越多则得到的组内离差平方和会越小,因此,必须在比较的过程中去掉分组个数的影响,人们称这样的方法为AIC方法[^99]。\n需要特别说明的是,面对大数据分析的现代统计学,人们创造了各种各样的数据分类方法,成为数据特征提取、形成背景知识的有效手段。\n问题28 如何理解分布式算法?\n传统计算机的计算逻辑强调计算过程的传递性,比如《普通高中数学课程标准(2017年版)》要求的二分法就是典型范例。为了更好地理解传递性,分析如下。\n对于给定函数 f(x),如果知道 f(x)=0在区间 [a,b]\n有解,那么可以通过计算函数值找到这个解的近似解。这样的求解方式非常有意义,因为在实际问题中,往往得不到求解公式,只能用近似解来代替真解。甚至,因为现代计算机的运算速度极快,对于大多数问题,即便知道求解公式,也可以通过计算函数值得到近似解。\n具有传递性的计算逻辑。令f(0)是定义在区间 [0,1]\n的连续函数,如果f(a)<0,f(b)>0,那么知道这个函数在这个区间上有零解,设这个解为\nx~0~;对于一个近似解 x^*^,︱x^*^- x~0~︱≤\n10^-n^,则称x^*^是精确到10^-n^\n的近似解。下面,通过具体的数值计算,说明二分法求近似解的过程。\n令c=(b-a)/2,计算f(c),如果f(c)>0,那么函数在区间 [a,c]\n上有零解;否则在区间 [c,b]\n上有零解。按照这个计算逻辑,直至得到需要的近似解。因为每次的解都是前一个区间的中点,这样的计算具有传递性,是说可以编一个统一的程序控制计算机的计算,可以把计算逻辑表述如下。\n输入f(x),a,b,n。\n1. 计算c = a + (a + b)/2。\n2. 如果︱c-a︱≦ 10^-n^,到指令7。否则\n3. 计算 f(c)。\n4. 如果 f(c) < 0,令 a = c。否则\n5. 令 b = c。\n6. 回到指令1。\n7. 令x^*^ = c。停止。\n输出x^*^。\n上面计算指令并没有使用正规的计算机语言进行表述,因为我们表述的是计算逻辑:虽然计算机使用的语言可以不同,但各种计算机语言所遵循的计算逻辑是一致的。遵循上面的计算逻辑就可以达到计算目的:借助有限步指令,实现函数得到零解的智能运算。\n可以分步式的计算逻辑。可以看到,传统计算机计算逻辑的优势在于传递性,传递性使计算过程构建了迭代形式,一环扣一环,实现了计算机持续不断的智能计算。但也应当看到,这种计算逻辑的弱点也在于传递性:如果不知道前一步运算的结果,则无法进行下一步的运算。这就意味着,这样的计算逻辑无法进行几台计算机的同时计算,特别是对于统计学而言,很难进行累加数据的计算,比如累加计算样本平均和样本方差,因此,不利于大数据分析。\n如前所述,大数据不仅是海量的,并且是动态变化的,因此在许多场合,传统的基于传递性的计算逻辑已经不适用了。比如一些简单的问题:某网络希望即时知道某个媒体平均每分钟上网的人次,某网络商家希望即时知道某些商品的销售热度,某舆情中心希望即时知道网民关注某个话题的百分比。针对这样的大数据分析问题,用传统的基于传递性的方法是无法完成的,这需要创造出计算结果能够叠加的计算方法,这就是分步式计算方法、或者说、并行计算方法。\n新方法的计算逻辑是:把数据分组用多台计算机并行计算,然后创造出一个计算方法,把多台计算机的计算结果合并到一起进行计算;或者,对前个时间的数据进行实时计算,然后创造出一个计算方法,把实时计算结果融合前个时间至今的新数据进行计算,得到新的结果。可以看到,这两种情况都必须突破传统的具有传递性的计算逻辑。\n我们通过两个简单的例子,分析如何构建可以用多台计算机并行计算、或者、可以处理动态数据的计算逻辑,形成相应的计算方法。可以看到,这样的例子适合初中统计与概率的教学。\n平均数的并行计算。计算n个数据的平均数E,传统的方法是把这些数据相加求和,然后除以数据的个数n。因此,在进行计算之前,必须得到所有的数据,不能用于并行计算。一个简单的处理方法,是把n个数据分为m组,记录每组数据的个数、比如n~k~,计算每组的平均数E~k~,k=1,...,m,然后计算组平均数的加权平均,即\n。\n这样,就可以用m台计算机进行同时计算,这便是并行计算的雏形。需要注意的是,最终用于计算的数据已经有所改变,不再是原始数据、而是经过加工过的成对数据,即每组数据个数n~k~和每组平均数E~k~。为了大数据分析的需要,必须改变传统的对数据的理解,数据是信息的载体,并行计算需要的是能够提供相应信息的数据,这就是大数据计算提出的新的要求。\n仔细分析这个例子可以知道,如果一个计算过程能够化解为若干加法叠加的计算形式,那么,这个计算就能设计出进行分步式计算的方法。这就像最初的计算只有加法,其他运算都是加法的派生一样,一个计算过程只要能够回归到加法运算,那么就可以进行分步式计算。事实上,从加法出发的运算法则是最原始的、也是最稳健的、最有效的。\n这样,为了顺应时代发展需要,《普通高中数学课程标准(2017年版)》提出样本方差分步式计算的要求,《义务教育数学课程标准(2022年版)》提出样本均值分步式计算的要求。\n百分数的即时计算。如问题26所述,为了让学生感悟和理解随机现象的决策,《义务教育数学课程标准(2022年版)》把百分数的学习内容从\"数与代数\"移到\"统计与概率\"。在这个话题,我们进一步讨论这个内容。\n考虑网络舆情中某一个话题的热度,用某一个时段关注话题的百分比刻画这个热度。如果用小学阶段计算百分比的方法,对于时间t时的热度,需要用t时关注这个话题的个数、比如表示为M~t~,除以网上总体个数、比如表示为N~t~,计算得到百分比x(t)%\n=\n(M~t~/N~t~)×100%,因为对于每个t时都需要收集数据进行计算,因此,这样的计算很难得使用以往的百分比的信息,比如x(t-1)%的信息,也就是不可能得到即时结果。\n可以这样计算即时结果。如果t到t+1这个时间段,总体个数增加n~t+1~,关注话题的个数增加m~t+1~,因为已知这个话题t时的关注话题的个数为N~t~x(t)%,因此t+1时关注话题的个数为\nN~t~x(t)% + m~t+1~,总体的个数为 N~t~ +\nn~t+1~,可以得到t+1时这个话题的热度、即在总体中所占百分比为\n。\n容易知道,在这样的计算过程中需要的数据包括,前一时刻的百分比和总体个数,新增总体个数和关注话题的个数。因为使用的不是前一时刻的所有数据、而是前一时刻的计算结果,因此这是分步式计算的一种形式,称为即时计算。\n大数据时代,海量的、动态的数据蕴含了人们社会生活的各种信息,甚至可以毫不夸张地说,这些信息提供了社会生活的全部。如何分析这些数据、挖掘这些数据所蕴含的知识,是当代数学遇到的挑战和机遇;可以想象,如果能够创造出全新的、适合计算机的计算方法,必将会产生很大的经济和社会效益;如果要合理解释新的方法,很可能要创造出新的数学理论,必将极大地促进数学自身的发展;无论是计算方法的创新、还是理论体系的构建,解决问题的基本思路,或许就是要回归数学到的本源。\n问题29 如何理解数据的集中趋势?\n为了更好地了解一个事物,人们需要抽象出这个事物的典型特征,甚至用量化指标表述抽象出来的典型特征。比如,要了解某一个地区的生活状况,就可以把人口分布、日常生活指数、人均GDP、人均住房面积等作为典型特征,然后通过这些典型特征的平均数作为典型特征的量化,借助这样的量化判断这个地区的生活状况,或者与其他地区的生活状况进行比较。\n平均数是人们最常使用的数据指标,代表了数据的集中趋势。如果知道数据来源背景,那么还可以根据归纳推理的原则,认为平均数表达了数学来源背景的集中趋势,比如,某一个班级期末考试的平均分,大体表达了这个班全体学生的学习状况。\n在古代汉语中,\"平均\"一词最初见于\"修身及家,平均天下\",是《礼记 •\n乐记》中记载子夏回答魏文侯问题时所说的话,其中\"平\"是说无上下之偏,\"均\"是说无远近之异,\"天下\"是指周的疆域,因此\"平均天下\"是说在周的疆域中,上下各安其所,华夏一视同仁。因为这样表达中蕴含\"不区别轻重多少\"\"把总数按份数均匀计算\"的意思,因此,根据所要研究问题的不同,可以有几种计算平均数的方法。\n加权平均。加权平均是离散型随机变量的数学期望、或者说、是离散型随机变量的总体均值。假设一个随机变量X有k个可能取值,分别是a~1~,...,a~k~,对应的取值概率分别为w~1~,...,w~k~,那么这个随机变量的数学期望\n\n表达了这个随机变量取值的集中趋势。因为在一般情况下,随机变量的概率是未知的,于是人们就用频率估计概率,得到数学期望的近似表达\n,\n其中频率表示为\n。\n可以看到,表达式中的概率表述了对应数值的权重,因此人们称这样的表达为加权平均,称其中的概率或频率为权[^100]。如果所有的权都相等,那么上面的表达就是小学数学中所说的平均数,可以估计取值概率相等随机变量的数学期望,刻画这类事物发生的集中趋势。\n下面,我们计算一个实际问题:吉林省人均GDP。吉林省一共有九个市州,在网上可以查到2021年这九个市州的人均GDP和常住人口,数据如下:\n吉林省2021年各市州人均GDP(百元)\n市州 长春 吉林 通化 松原 延边 四平 白城 白山 辽源\n人均GDP 783 428 464 363 413 306 354 570 464\n人口(万) 907 362 181 225 194 181 155 95 100\n我们通过上述数据计算吉林省2021年的人均GDP。因为市州GDP = 市州人均GDP ×\n人口,因此可以先计算吉林省各市州的GDP,相加得到吉林省全省的GDP,再除以总人口就得到吉林省的人均GDP。这就是加权平均的基本思想,注意到,人均GDP数据与人口数据是成对出现的,成对数据是加权平均的基本要素。容易计算,2021年吉林省全省的GDP为13236(亿元),常住人口为2400万,最后得到吉林省人均GDP大约为5万5千元。\n几何平均与加权几何平均。如果说加权平均是加法运算的平均,那么几何平均就是乘法运算的平均。如图所示,如果设线段AD长度为a,DB长度为b,那么,圆的半径OC长度为a和b的算术平均;又因为\nΔACD与 ΔBCD相似,因此 AD:CD =\nCD:DB,说明CD的长度为a和b的几何平均。这样,就可以把线段OC和CD的长度分别用算术平均和几何平均表示为\n\n和\n\n的形式,因为任意直角三角形的斜边都比直角边长,下图直观讲述了算术平均大于几何平均的故事。回忆排列组合的计算,并联的时候使用加法,串联的时候使用乘法,与此类似,算术平均讲述的是并联的故事,几何平均讲述的是串联的故事。\n\n算术平均与几何平均\n现在,我们思考一个实际例子:银行变动利率的平均。\n比如,某一银行在十年的时间里,储蓄利率变动了三次,分别为:a~1~%,3年;a~2~%,5年;a~3~%,2年。那么,应当如何计算这个银行十年的平均利率呢?一个简单的方法可以计算加权平均,比如,平均利率为a%,其中\n。\n但是,如果三次的利率相差较大,那么用加权平均计算会引起较大的偏差。这是因为,储蓄要考虑复利,因此是一个连续的、或者说、是一个串联的过程,合理的方法,应当计算几何平均。\n假设最初的本金为1,3年以后连本带息为 (1+a~1~%)^3^,5年后为\n(1+a~1~%)^3^×(1+a~2~%)^5^,10年后为\n(1+a~1~%)^3^×(1+a~2~%)^5^×(1+a~3~%)^2^。如果用a表示平均利率,那么,本金为1的10年后的利率为\n(1+a%)^10^,这样就得到\n,\n可以得到\n,\n上面的第一个式子就是加权几何平均。\n同样的道理,凡是涉及若干年的增长指标等问题,都应当利用几何平均刻画年均增长率。比如,一个企业要表达资产的年增长率,起始年的资产为M,n年以后资产增加到N,如果用a表示年增长率,可以得到:N\n= M×(1+a)^n^,因此可以得到年增长率为\n。\n可以把这个表达看作几何平均的变形。\n调和平均。如果说加权平均表达并行问题的集中趋势,几何平均表达串联问题的集中趋势,那么调和平均表达的就是平行路径的集中趋势。比如,考虑一个简单的问题,一个人往返于同一条道路,去程的车速是60公里/小时,回程因为堵车,车速是20公里/小时,现在希望表达这个人往返的平均速度。如果不仔细思考,会认为平均速度就是算术平均40公里/小时,但仔细思考就会发现,因为往返的路程是一样的,因此去程速度快、用的时间少,回程速度慢、用的时间少,因此用算术平均的值表达平均是不合适的,应当考虑用加权平均,具体分析如下。\n如果这段路程一共有20公里,那么,这个人去程用时20分钟,回程用时60分钟,一共用时80分钟,因此平均速度应当为\n60×20/80 + 20×60/80 =\n30(公里/小时),比算术平均要更慢一些,这是因为回程慢速占的比重要更多一些。如果用调和平均进行计算,就更简单了,平均速度为\n,\n这与加权平均计算的结果一致,那么,这个一致性是不是偶然的巧合呢?事实上,这个结论是必然的,下面通过工程模型进一步分析这个问题。\n工程模型与调和平均有关。可以把问题表述为:有一个工程,甲单独做需要60天时间,乙单独做需要20天,问甲乙一起做需要多少时间?\n因为甲一天能够完成工程的1/60,乙一天能够完成工程的1/20,所以甲乙一起一天能够完成工程的1/60 +\n1/20 = 4/60 =\n1/15,也就是说,甲乙一起做需要15天的时间。在这个意义下,平均一个人完成这个工程需要2×15\n=\n30(天)时间,这就是调和平均。我们曾经说,调和平均表达的是几个平行问题的集中趋势,那么在工程问题中,甲和乙单独完成就是两个平行的路径。把这样的思想推展到一般情况。对于给定的n个正数a~1~,...,a~n~,称\n\n为这n个数的调和平均。\n三种平均之间的关系。上面,我们分别讨论了三种平均对数据集中趋势的表达,可以看到,这三种平均分别适用于不同的问题背景。下面讨论这三种平均值之间的大小关系,事实上,对于同样的一组取正值的数据,可以得到\n加权平均 ≧ 几何平均 ≧ 调和平均\n这样的关系。我们证明这个结论,为了简单起见,讨论n=2的情况,令a和b是两个正数。因为\n,\n因此:加权平均 ≧ 几何平均。因为这两个正数的调和平均为\n2ab/(a+b),通过加权平均 ≧ 几何平均的等式,可以得到\n,\n因此:几何平均 ≧ 调和平均。等号成立当且仅当a=b。\n由此可以看到,不仅构建数学模型要充分考虑问题的背景,即便是用数学算式表达事物的特征也需要充分考虑问题的背景,这就是话题30将要专门讨论的,如何构建数学的模型,用数学的语言讲述现实世界的故事。\n但是,这三种平均都容易收到极端数据的影响,也就是说,如果出现特别大或者特别小的数值,会很大程度地影响计算结果。因此,使用这三种平均需要一个比较合理的假设,对于统计学而言,就是假设数据独立同分布地来源于同一个总体、或者说、来源于同一个背景。在这样的假设下,如果出现了极端数据,可以考虑舍弃这样的数据,就像跳水比赛打分或者体操比赛打分那样,去掉一个最高分、去掉一个最低分,然后计算总分、或者、计算算术平均。\n问题30 如何理解定性数据定量化?\n随着大数据时代的到来,一个热门的词汇就是数字化,这个词汇几乎涉及到各个行业。数字化是指将信息转变为可以用计算机处理的数字格式,与传统的模拟信号比较,数字格式的信息传递更加稳定可靠,上个世纪八十年代人们就尝试把这样的技术使用于电视机,后来又使用于照相机。进入这个世纪以来,随着计算机技术和信息技术的飞速发展,数字化已经成为大数据处理的必要手段,因为人们需要对网络、文本、声音、图像等反映的信息进行数字化处理,其中很重要的一部分内容就是定性数据的定量化。在一般情况下,定性数据主要包括两种,即名义数据和顺序数据。\n名义数据。虽然名义数据也是数字表达,但只是一种类别的代表,适用于分类、不适用于运算,名义数据又可以分为命名数据和标记数据。\n所谓命名数据,是指对一类事物命名的表达,比如,每一位同学的学号,每一位成年人的身份证号,每一辆汽车的车牌号,等等。虽然这样的数据只是一种命名,但在数据的编排中,也要尽可能地提供被命名者的信息,比如,同学的学号可以包括年级和班级,成人身份证可以包括所在省市、出生年月和性别,汽车牌号可以包括登录省市、车型类别等等。\n标记数据要比命名数据复杂一些,可以提供更多的信息。比如购买产品的调查问卷,可能会要求受访者提供性别、大概年龄、职业信息等等,据此可以分析产品与购物者之间的关系,为有的放矢地进行宣传或推销提供信息。在大数据时代,这样的数据发挥着越来越重要的作用,商家甚至会记录购物者曾经购买过的产品,划分可能没有见过面、但具有同样喜好的好友,逐步实现精准推送。更为现实的是,借助手机的普及,这样的推送已经从产品拓展到新闻、消息、文章、评论。这样的推送带来的好处是,可以看到自己喜爱的内容,带来的坏处是,可能会对某些问题的认知越来越狭窄。\n无论是命名数据还是标记数据,都可以利用统计学现有的方法进行数据处理,比如,通过频数图表或者频率图表,得知各种类型事物所占比例,估计各种情况发生的概率。但至今为止,统计学处理这样的数据还没有形成足够的经验,还没有形成相对合理的理论,如下面所论述的,对于标记数据,统计学还不没有形成能够充分利用好友信息的理论和方法。\n比如,一个商家要推销一种新产品,利用以往信息可以推断某一位顾客购买的概率,可以利用最大似然估计等方法[^101]。但是,如果还知道这位顾客的好友已经买了这个新产品,那么凭借直观我们可以推断,这个顾客购买这个产品的概率会更大一些,这样的推断会引发概率大于1的情况,与人们传统的对概率的理解不符,因此需要构建新的理论和方法处理这样的问题。或许,可以构建概率可靠性的概念,虽然概率大小不能增加,但可以增加概率的信度。\n顺序数据。考虑评价酒的问题,分析评价的合理性。比如,有十位评委评价A、B、C、D、E五种酒,如果有五位评委把A酒列为第1,四位评委把B就列为第1,那么就可以认为A酒比B酒好吗?事实上,还可以考虑的更周全一些,比如,可以请十位评委对五种酒排序。如果得到下面的排列\n第一 第二 第三 第四 第五\nA酒 5 0 0 3 2\nB酒 4 3 2 0 0\n你还会认为A酒比B酒好吗?如果采用这样的记分方式\nA酒记分 = 5×5 + 4×0 +3×0 + 2×3 + 1×2 = 33\nB酒记分 = 5×4 + 4×3 +3×2 + 2×0 + 2×0 = 38\n这是一种加权平均的方法,其中的顺序决定了权重。\n可以看到,在许多情况下,利用顺序数据分析定性问题是合理的,可以根据记分设计权重,因此顺序数据可以用于决策。在本质上,利用顺序数据进行决策是一类随机决策,如问题26所述,在大数据和信息社会,随机决策的问题变得越来越重要,这类问题的基本特征是:没有结论对错之分,只有方法好坏之分。于是,随机决策的思维方法和判断的方法与传统数学教育大相径庭。正因为如此,在现在和未来的义务教育阶段的数学教育中,融入这样的内容是非常必要的。\n比如,2011年版数学课标例18(2022年版数学课标例39),是关于班级新年联合会购买水果的问题,希望通过对同学的调查数据进行决策。这就是一类随机决策,学生可以广开思路,讨论决定获取数据的方法和分析数据进行决策的方法。无论如何,合理使用顺序数据是一类可行的选择。\n再比如,2011年版数学课标例35(2022年版数学课标例30),是关于图画还原的问题,这是现代信息传递常用方法的最为初级的阶段。首先,把一个图画数字化,也就是把图画分割成若干个小方块,标上序号[^102],为了信息保密,人为打乱小方块顺序,但为了让指定接收人能够还原图画,需要记录打乱的规则。比如,用一组顺序数据记录平移,用另一组顺序数据记录旋转,然后把这样的数据告知指定接收人,这样,指定接收人就可以通过反向操作还原图画。\n下面再分析两个例子,说明处理定性数据需要特别关注的问题。这两个例子都是非常现实的,第一个例子说明获取的信息要尽可能反映全貌,第二个例子说明如何获取看似不能得到的信息。\n关于社会调查问题的推断。社会调查是认识和分析社会现象的重要手段,大体是经历剖析具体、获得一般的思维过程,因此隶属于归纳推理。如果希望这样的思维过程具有逻辑性,参见第一部分讨论,那么就需要把握推断的关键步骤:构建一个类,通过类中部分事物的属性推断类中所有事物的属性。在这样的过程中特别要关注两个问题,一个问题是,如何选取所说的部分事物、也就是选取调查对象;另一个问题是,如何获取所说的事物属性、也就是设计调查问题。\n如何选取调查对象。我们通过一个著名的例子分析这个问题。1936年美国的总统选举有两位候选人,一位是民主党的罗斯福,一位是共和党的兰登。当时,大多数政治观察家和新闻机构都预测罗斯福会获胜,但《文学文摘》杂志的预测与众不同,他们预言兰登将会以57∶43的优势战胜罗斯福,这个预测产生了很大的反响。但实际情况是,罗斯福以62∶38的压倒性优势当选。由于这个重大失误,这家杂志不久便宣告破产。\n但在事实上,《文学文摘》做出这个预测推断并非主观臆断,而是基于240万份调查报告的统计结果。那么,为什么会出现如此大的偏差呢?问题就在于这240万个样本。因为《文学文摘》的访问对象是从电话号码簿和俱乐部会员名册上选取的,但在1936年,美国家庭的电话尚未普及,尤其是有条件参加俱乐部的人,大多是经济上富有、政治上保守、倾向于共和党的选民,在这个样本下的得到的结论就造成了显著的误差。总结了这次民意调查的教训,美国社会学家盖洛普提出了一个有效的调查方法,不仅大选结果几乎预测无误,而且调查的人数只需要几千人。\n如何设计调查问题。许多社会问题的调查,如果直接提出所要调查的问题,往往会让被调查者难以起口,主要是因为两方面的原因,或者是因为问题过于宏观,或者是因为涉及个人隐私。\n对于过于宏观的问题,需要把问题分解为若干个部分,针对每一个部分提取具体要素,基于这些要素提出容易回答的问题,然后获取数据、形成知识。事实上,调查数据的设计与分析是非常重要的,统计学设有专门的领域研究社会调查的问题。因此,为了培养学生的统计素养,除了前面提到的一些例子之外,《义务教育数学课程标准(2011年版)》还专门设计了调查方法的例题、即例67,也见《义务教育数学课程标准(2022年版)》的例83。\n对于涉及个人隐私的问题,需要设计变通的提问方法,使得被调查者能够无顾忌地回答问题。比如在学校调查学生考试是否作弊的问题,如果直接提问,大概百分之百的学生都会回答\"否\",因此需要设计变通的提问方法。一个简单可行的方法是同时询问两个问题,其中一个问题是不相干的:\n问题1 考试是否作弊;\n问题2 手机尾号是否是偶数。\n然后让学生抛掷一枚硬币,要求学生:硬币出现正面回答问题1,出现背面回答问题2。因为调查者不知道学生抛掷硬币的结果,因此学生可以如实地回答问题。可是,如何知道学生回答的情况呢?这就需要进行统计分析,假如调查了100名学生,回答\"是\"的30人,我们能知道考试作弊的频率吗?我们来分析这个问题。\n假设硬币是均匀的,那么回答两个问题的学生大约各占一半,可以认定均为50\n人;因为手机尾号为偶数的大约为1/2,也就是有25人;因此回答\"是\"的30人中有25人是因为手机尾号是偶数;于是50名学生中对回答问题1回答\"是\"的学生大约有5人。这样,可以得到结论:学生考试作弊的频率大约为5/50\n= 1/10。\n\n话题篇\n话题1 数学定义的基本原则\n如前所述,与小学数学比较,初中数学有两个重大变化,一是初中数学开始学习数学的定义,二是初中数学开始学习数学的推理。这两个重大变化涉及数学的本质特征,前者与数学抽象有关,后者与逻辑推理有关。因此,在初中数学的教学过程中,必须非常重视这两个重大变化,设计出切实可行的教学方案,让学生理解相关的教学内容、感悟相关的数学本质。这个话题,主要讨论前者。\n如何理解数学的定义。要对定义本身进行定义是一件非常困难的事情[^103],现代哲学和认识论创造出名目繁多的构建定义的理论,提出各种各样的表述定义的形式,让人目不暇接、难以遵从。或许,我们应当回归人们构建定义的初衷,出发点往往是最朴素的,也是最本质的。\n古代的人们对于定义的理解,大体可以分两个不同的学派,这就是强调逻辑的古希腊哲学和强调实用的中国古代哲学,这两个学派的哲学路径大相径庭[^104],导致对于定义的理解也有很大的差异,我们可以在这样的差异中探寻定义的本质。\n古希腊盛行辩论,辩论被视为公民基本素养和政治参与形式,辩论通常会就特定的议题在公共场所举行,通过逻辑推理、论证述说表述自己的观点,说服听众和评委。这样辩论文化在雅典民主制度的发展中起到了重要的作用,也在罗马帝国时期得到继承和发展。辩论文化对于定义的要求相当苛刻,因为严格的定义是逻辑推理的基础。比如,苏格拉底就在论证过程中非常强调定义的严格,美国哲学史家杜兰特评价苏格拉底的辩论风格时说[^105]:\"再也没有比下定义更困难,更能严峻地考验和锻炼一个人思路的清晰和措辞的技巧了。\"在这种文化的熏陶下,出现了亚里士多德,出现了欧几里得。\n与古希腊学者正好相反,中国古代先哲认为,定义只不过是给某一类东西命名而已。因为人们对中国古代哲学或者认识论不很了解,为此,我们在这里进行一些简单的论述,主要是分析先秦名家公孙龙子关于定义的论述,公孙龙子以提出命题\"白马非马\"闻名于世。\n公孙龙子的《指物论》是一篇讨论定义的文章,我想,这篇文章应当是中国古代讨论形而上学最重要的文献之一[^106]。这是一篇非常难理解的文章,以至于引发了几位现代著名学者意见的不同[^107]。文中所说的\"指\"是定义了的抽象,相关同义词有:名、谓词、共相、一般;文中的\"物\"是被定义的具体,相关同义词有:实、主词、殊相、个体。之所以使用这么多的同义词,是因为在那个文字初创的时代,表达思维的术语实在是太少,不可能把概念的理解分析的很仔细,而现今,我们可以尝试回归公孙龙子的思考,并且用更恰当的语言表达他的思考。\n公孙龙子的《指物论》可以用现代哲学语言表述为《论定义中的殊相与共相》,这个题目对于现代哲学都是相当难以讨论的[^108]。为了与现代语言融合,我们用\"名\"来代替\"指\",并且在不同的场合使用相关的同义词,把文章开篇一段翻译如下[^109]:\n物都可以有名,名不能再命名。如果没有名,天下物就没有称谓了。但是,如果天下没有物,又怎么会有名呢?事实上,抽象的名是不存在的,存在的是具体的物。具体的物不能代替抽象的名。即便是天下没有名,具体的物也不是名;之所以不是名,因为个体不能代替一般;但就个体而言,每一个个体都蕴含着一般。既然物不能代替名,而物又都必须有所称谓,就不能没有抽象的名。这就是我说的\"物都可以有名,名不能再命名\"的道理。\n其中\"名不能再命名\"大概是说:名是抽象了的东西,因此不能再一次命名。这样,公孙龙子就强调了\"名\"的一般性。可以看到,上面这段话语把具体与抽象、个体与一般、殊相与共相之间的关系论述得非常清楚,从中可以体会到,中国古代先哲认为,定义就是对某一类东西起名。也正如我们在本书第一部分所讨论的那样,现代数学的发展表明,在重视古希腊所强调的苛刻定义的同时,中国古代先哲提倡的朴素定义也是不可或缺的。我们称前者为实质定义,后者为名义定义。初中数学重大变化所说的数学定义,主要是指数学的实质定义,而理解数学实质定义的最佳途径,就是分析人们如何构建数学实质定义。下面,我们分析构建数学实质定义的思维前提和表达形式。\n构建实质定义的思维前提。如果希望对一个数学概念构建实质定义,那么在构建之前就必须考虑清楚两个基本要求:第一个要求,这个数学概念的所指必须足够明确;第二个要求,这个数学概念的内涵必须足够清晰。我们先举例说明这两个基本要求的核心所在,然后尝试用数学的符号表达这样的要求,并且称这样的表达为思维前提。\n第一个要求针对的是数学概念本身。所谓数学概念所指必须足够明确,是说,要定义的数学概念能够把某一类东西与其他的东西分辨清楚。比如,要构建\"偶数\"的实质定义,那么,偶数作为自然数的一个类,就必须与那些不是偶数的自然数泾渭分明,这有这样,才可以说\"偶数\"具备了构建实质定义的基本条件。反之,如前所述,我们无法构建\"点\"的实质定义,这是因为,无法借助类、或者说、无法借助语言区分\"点\"与其他[^110]。\n下面,我们尝试用数学符号表述这样的思考。首先,找到一个比所要定义的数学概念更大的类,比如定义偶数,如果希望在自然数中构建这个定义,那么自然数就是那个更大的类,用符号\nB\n表示;然后,把所有对应于数学概念的元素构成一个集合,比如所有偶数形成一个集合,用符号A表示。显然,A被B包含,那么\"数学概念所指必须足够明确\"是说:\n对于任意x∈B,要么x∈A 要么x∈B--A。\n仍然考虑偶数的实质定义。因为对于任意一个给定的自然数,这个自然数要么是偶数、要么就不是偶数,符合上述数学表达的要求,因此偶数这个数学概念所指足够明确,可以构建实质定义。但是,对于那些更为基础的数学概念,比如自然数、集合,点、线、面等概念,无法形成上述数学表达,因此这些概念只能采用名义定义。\n第二个要求针对的是数学概念性质。回顾问题1的讨论可以知道,数学实质定义的内涵是通过数学概念的性质表述,这就意味着,如果用符号P表达数学概念的性质,那么包含所要定义的数学概念的集合必须可以表达为\nA = {x∈B;x → P}\n的形式。这样,为了满足第一个要求,性质P揭示的数学概念的内涵必须足够清晰,比如偶数,是指那些能够被2整除的自然数,P表述的就是能被2整除这样的性质。而如问题1所论述的,欧几里得曾经用\"没有部分\"述说\"点\"的内涵是不可以的,因为\"没有部分\"的状态不能形成一个性质。\n构建实质定义的表达形式。也如同问题1所讨论的那样,实质定义的表达形式是具有系词结构的陈述句,是具有隶属关系的属加种差的表达形式。可以用数学符号表述为:\nA是B中满足性质 P 的子集 ←→ x∈A,则 x∈B并且x→P。\n其中符号 ←→\n表示充分必要条件,也就是,通过符号左边的内容可以推断符号右边的内容,反之亦然。称被定义项、即集合A为种,定义项、即集合B为属;表述的基本特征是,集合A中的元素是集合B中的元素、并且具有性质P,称性质P为种差。因此称这样的表达形式为属加种差,种差用于区别属中的其他种。比如,偶数的定义\"偶数是能被2整除的自然数\",其中偶数是种、自然数是属、能被2整除是种差。\n事实上,实质定义的构建是比较复杂的,为了更好地规范和把握,人们制定出一些规则,传统意义的规则可以包括下面五条[^111]:\n1. 定义应当揭示种的本质属性。\n2. 定义不能循环。\n3. 定义既不能过宽又不能过窄。\n4. 定义不能用歧义的、晦涩的或比喻的语言表述。\n5. 定义可以用肯定表述就不用否定表述。\n这五条规则似乎非常合理,可是,要使用这些规则来具体判断一个话语是否能成为数学的实质定义却是非常困难的,因为这些要求过于笼统。我们简要分析这五条要求。\n第1条是重要的,为了构建数学的实质定义,揭示种的本质属性的性质P必须是充分必要的;第2条极为重要,正如问题1讨论过的那样,数学定义的不循环是通过名义定义和实质定义这两个层次的实现的;第3条的要求被我们阐述的充分必要条件所包含;第4条的要求对于数学的定义是显然的,因为数学性质的表述不能含糊不清。\n但是,第5条的要求对于数学的实质定义不是必要的,因为上述\"第一个要求\"使得数学实质定义对研究对象的判断泾渭分明,因此可以使用否定表述。比如:\n称能够被2整除的自然数为偶数,不能被2整除的自然数为奇数。\n如果一个自然数只能被1和自己整除,则称这个自然数为素数;否则,称这样的数为合数。\n传统的数学教学往往不重视概念的教学,强调的是对概念的记忆、而不是对概念的理解,这是不可以的。众所周知,中国基础教育最大的问题是缺乏创新的培养,包括创新意识培养、也包括创新能力的培养,培养的关键在于理解,不能单纯凭借记忆,也不能单纯凭借训练。通过上面讨论可以看到,真正理解概念是非常困难的,至少对于教师,只有站在如何构建数学实质定义的角度,才可能在形式上、并且在本质上理解,才可能设计合理的教学方案,把概念理解的教学付诸实践。\n话题2 数学命题判断的基本原则\n前面多次谈到,与小学数学比较,初中数学有两个重大变化,一是开始学习数学的定义,二是开始学习数学的推理。上一个话题讨论了构建数学定义的思维基础,在这个话题将讨论进行数学推理的思维基础。如问题4所说,数学的推理是数学命题判断到数学命题判断的思维过程,因此数学推理的思维基础就是命题判断,我们讨论数学命题判断的基本原则。\n判断是因人而异的,依赖于判断者的价值取向,依赖于判断者的思维习惯。但是,为了保证数学的严谨性和科学性[^112],必须建立判断数学命题的基本原则。\n我们遵循形式逻辑中最古老的三个定律,这就是:同一律,矛盾律和排中律。在许多逻辑学教科书中,称这三个定律为逻辑三大基本规律,但是,至少对于数学的推理而言,这三个定律的直接作用是命题的判断,与推理无关。这是因为,三个定律涉及的对象都是集合中的元素,至多涉及两个性质命题,而我们在问题4中曾经强调,一个推理过程至少要包含三个性质命题。于是,这三个定律的逻辑推理功能表现于命题的判断。下面,基于数学命题的判断讨论这三个定律。\n数学同一律。同一律是指一个事物与自身同一,表示为A=A。基于同一律的原则,在数学论证的过程中,一个符号、或者、一个定义必须始终保持一致,也就是说,在数学论证过程中不能变换概念。但在现实世界中,事物总是相对的,事物也总是变化的,如果在历史发展的长河中认识问题,同一律就显得僵化了,如同恩格斯所批评的那样[^113]:\n旧形而上学意义下的同一律是旧世界观的基本原则:a=a。每一个事物和它自身同一。一切都是永久不变的,太阳系、星体、有机体都是如此。这个命题在每一个场合下都被自然科学一点一点驳倒了,但是在理论中它还继续存在着,而旧事物的拥护者仍然用它来抵抗新事物:一个事物不能同时是它又是别的。抽象的同一性,与形而上学的一切范畴一样,对日常应用来说是足够的,在这里所考察的只是很小的范围或很短的时间。\n在上面的论述中,恩格斯强调一切事物都不是永恒不变的,要学会辨证地分析问题。恩格斯的说法是有道理的,对于数学也是如此,比如对于几何学的认识,人们最初认为欧几里得几何是永恒不变的真理,包括\"过直线外一点能作并且只能作一条平行线\"这个公理是唯一正确的。但是,后来发现可以建立一个有无数条平行线的几何学,这便是罗巴切夫斯基几何;还可以建立一个没有平行线的几何学,这便是黎曼几何。特别是,这三种几何体系都有着明确的现实背景[^114]。即便如此,因为在一般情况下,我们讨论的数学问题的范围是有限的、时间是短暂的,因此,数学的论证必须使用同一律。数学同一律可以用数学的定义表述如下:\n数学同一律。如果一个集合A是确定的,那么,可以确切判断一个元素x是否属于集合A,在论证过程中这个关系保持不变。\n可以看到,这样的表述与上一个话题中的第一个要求、即\"数学概念的所指必须足够明确\"的表达形式完全一样。事实上,只有借助这样的表达,我们才可能判断一个数学性质命题是否成立。\n从表面看,现代数学的某些研究领域的研究似乎不符合数学同一律,但究其本质,依然是不悖的。比如模糊数学,虽然一个元素是否属于一个集合可以是模糊的,但是,这个元素是否属于这个集合依赖于取值于闭区间\n[0,1]\n上的示性函数,这个示性函数本身是不变的、是符合数学同一律的。再比如概率论与统计学,虽然随机变量的取值可以不确定,但是,随机变量取某一个值的概率是不变的、是符合数学同一律的。\n对于数学推理,基于等价性的原则,人们把数学同一律拓展为A=B的形式。这样的拓展对于数学非常重要,比如现代数学的基础是ZF集合论公理体系,公理体系中的第一个公理外延公理就采用了这样的表达形式[^115],外延公理说,如果集合A中的元素都属于集合B,集合B中的元素都属于集合A,那么这两个集合等价,表示为A=B。因此,两个等价集合中的元素未必完全一样,比如关于有理数的表达,A集合中的元素可以是所有可以表示为分数形式的数,B集合中的元素是所有可以表示为有限小数或无限循环小数的数,虽然这两个集合中元素的形式不尽相同,但可以证明这两种形式是等价的。由此可以看到,这样的拓展对于数学的发展至关重要。\n数学矛盾律。不仅在数学中、即便是在现实生活中,矛盾律都是判断事物的基本原则。矛盾律说:正命题与否命题不能同时成立。如果用F(P)表示一个关于性质P的性质命题,用F^c^(P)表示这个性质命题的否命题,那么可以把矛盾律表示为\nF(P)∩F^c^(P)=Ø的形式。现有资料表明,矛盾律最初是亚里士多德提出的,他在《形而上学》中写道[^116]:\n但我们明确主张,事物不可能同时存在又不存在,由此我们证明了它是所有原本中最为确实的。有些人由于学养不足认为需要对此加以证明,但是他们不知道哪些应当证明哪些不应当证明,这正是学养不足的表现。\n于是,人们遵循亚里士多德的建议,把矛盾律作为不证自明的判断原则。在汉语中,矛盾这个词出自春秋战国时期的一个寓言[^117],就像寓言所述说的那样,这个原则与人们的生活常识是一致的。矛盾律也可以用数学定义的形式表述如下:\n数学矛盾律。用P表示数学性质命题中的性质,那么对于任何集合A,都不存在x∈A,使得x→P和x~P同时成立。\n虽然对于同一个事物,矛盾的双方不能同时成立,但是,在事物产生与发展的过程中,可以认为矛盾的双方是同时存在的,这种思想是中国古代哲学解释世界的基本出发点,如《周易·系辞传》所说:\"一阴一阳之谓道\",其中所说的一阴一阳就是矛盾的双方[^118]。老子更是把所说的\"道\"上升为哲学概念,标志着中国哲学的诞生。为此,在《老子》中出现大量\"正言若反\"的表达:有无相生,难易相成,长短相较,高下相倾,音声相和,前后相随。对于西方哲学,大体到了18世纪,德国哲学家黑格尔受中国古代哲学的启发,提出了基于辩证的思维方法[^119]。\n无论如何,对于一件具体事物的判断,矛盾律这个原则总是成立的。矛盾律对数学推理非常重要,问题15中曾经讨论,矛盾律是数学反证法的逻辑前提,没有这个原则数学将寸步难行。\n数学排中律。排中律也是命题判断的基本定律:一个命题不是真的就是假的。仍然用F(P)表示一个关于性质P的性质命题,用F^c^(P)表示命题的否命题,那么可以把排中律意表示为F(P)∪F^c^(P)=1的形式。排中律也是亚里士多德在《形而上学》中提出的,在下面的论述中可以看到,亚里士多德在提出这个原则的时表现出犹豫不决[^120]:\n在对立陈述之间不允许有任何的居间者,对于一事物必须要么肯定要么否定其某一方面。......\n如果不是为理论而理论的话,在所有对立物之间,应当存在居间者,故一个人可能既以其为真又以其为不真。在存在与不存在之外它也将存在,因此,在生成和消灭之外有另外某种变化。\n这是因为,与矛盾律不同,排中律的原则过于极端,完全取消了中间状态,以至于在日常生活中不一定合适。比如,评价一道菜,人们很难接受这个菜要么就是辣的、要么就是不辣的判断原则,常常会说这个菜是比较辣的、或者说、这个菜不太辣。特别是中国传统文化,很难接受\"非此即彼\"的思维模式,比如,很难接受\"非福即祸\"\"非强即弱\"这样的二分法。\n无论如何,我们认定数学是一种为了理论而理论的学问。虽然数学的产生离不开现实世界,但正如我们将要在话题4讨论的,数学的发展最终要脱离现实世界,实现研究对象的符号化、证明过程的形式化、论证逻辑的公理化。因此,针对这种为了理论而理论的学问,如亚里士多德所说,数学还是需要排中律的。排中律可以用数学定义的形式表述如下:\n数学排中律。用P表示数学性质命题中的性质,那么必然存在一个集合A,使得任何x∈A,满足x→P或者x~P。\n比较数学矛盾律定义中\"对于任何集合A\"的表述,数学排中律定义只是要求\"必然存在一个集合A\"。需要特别强调,对于统计学的许多问题,不能直接套用数学排中律,比如假设检验问题,一个检验统计量否定了原假设,并不意味就必须接受对立假设。\n如问题15的讨论,排中律也是数学反证法的逻辑前提。这样,如果同时承认矛盾律和排中律,那么数学的性质命题将会得到这样的表达:F(P)∩F^c^(P)=Ø,F(P)∪F^c^(P)=1,这样的表达对于数学的基于符号的逻辑推理非常必要。\n因为数学推理的对象是数学命题,数学推理是数学命题判断到数学命题判断的思维过程,我们确立判断数学命题的原则,这就是意味着,我们就确立了数学推理的思维基础。或者说,数学推理的准备工作也已经完善,接下来需要讨论的是那些基于传递性的、相对具体的推理方法,比如,下一个话题将要讨论三段论的论证形式。\n话题3 三段论与数学证明\n我们曾经说到,欧几里得的论证问题的思维方式可能受到亚里士多德的影响,主要是指欧几里得对于问题的证明,通常都是采用三段论的。三段论也是亚里士多德的发明,他非常重视三段论,认为三段论是包括数学证明在内的更广泛的论证形式[^121]:\n我们之所以要在讨论证明前先讨论三段论,是因为三段论更加普遍些。证明是一种三段论,但并非一切三段论都是证明。\n这里所说的证明主要是指数学的证明。\n后来人们发现,亚里士多德对数学证明的认识不够全面,因为就论证形式而言,三段论不能包含所有的数学证明形式,比如《义务教育数学课程标准(2022年版)》给出的关系传递\na=b,b=c → a=c\n的形式,就不属于三段论的范畴。但是无论如何,数学的证明是依据规则的推理[^122],其中一类规则的思维基础和表达形式就是三段论,因此,为了更好地理解数学的证明,认真分析三段论是必要的。\n经典三段论。三段论有不同的类型,亚里士多德称这些类型为格,亚里士多德定义了三种格,后来中世纪经院学者又增加了第四格。现在人们已经证明,后三种格都可以归结为第一格[^123]。第一格又分为四种型,为了便于比较分析,我们把亚里士多德对这四种型的举例一并归纳下:\n全称肯定型:凡人都有死,苏格拉底是人,所以苏格拉底有死。\n全称否定型:没有一条鱼是有理性的,所有的鲨鱼都是鱼,所以没有一条鲨鱼是有理性的。\n特称肯定型:凡人都有理性,有些动物是人,所以有些动物是有理性的。\n特称否定型:没有一个希腊人是黑色的,有些人是希腊人,所以有些人不是黑色的。\n从上面的阐述中看到,虽然亚里士多德讨论的不是数学的证明,但已经构建了数学证明形式的基本框架。下面,我们逐一分析这四种形式,讨论这样的形式与数学证明的关系。\n全称肯定型。全称肯定型的专业术语是AAA型[^124]。亚里士多德给出的例子是:\n凡人都有死,苏格拉底是人,所以苏格拉底有死。\n这是由三个性质命题组成的论证形式,依次称为大前提、小前提、结论。可以看到,这就是第一部分讨论的简单推理,我们依次称为前提命题、论据命题、结论命题。\n我们用数学语言表达全称肯定型的论证过程。如果用A表示所有人的集合,用x表示苏格拉底这个人,用P表示死这个性质,那么上面的推理形式可以表达为\nA→P,如果x∈A,则x→P。\n这个论证形式与问题4中所讨论的演绎推理的表述形式完全一致,因此,这样形式的推理是有逻辑的,得到的结论必然成立,也就是说,如果前提为真,那么结论为真。\n按照思维常理,人们会认为这个形式的推理似乎多此一举:如果所有人都会死,那么苏格拉底这个具体的人当然也会死;并且,这个形式的推理似乎本末倒置,因为前提命题\"所有人都有死\"的验证要比结论命题\"苏格拉底有死\"的验证困难得多。可以看到,这样的思维方法是非常特殊的,事实上,古希腊以外的其他古老民族都没有产生过这样的思维方法[^125]。但无论如何,这样的论证形式在辩论的过程中、特别是在数学证明的过程中是行之有效的。\n在数学证明的过程中,前提命题通常是公理、假设、或者已知事实,因为结论命题述说的性质与前提命题述说的性质是一样的,因此,证明的关键在于验证中间命题是否成立,这也是称中间命题为论据命题的缘由。下面,我们通过三段论的省略形式进一步分析论据命题的重要性。在日常生活中,人们论述问题往往会省略论据命题,把全称肯定型表达为:\n凡人都有死,所以苏格拉底有死。\n在日常生活中,这种省略形式的三段论或许可以,但在数学证明的过程中,却一定要慎重使用,否则不仅会导致论据不足,甚至会引发错误的结论。比如,\n凡数都可以比较大小,所以复数可以比较大小。\n这个结论显然是不对的,因为复数不可以比较大小,引发错误的原因,就在于这个表述中省略了\"复数是数\"这个论据命题,进而缺少对于这个命题的判断,于是就有了蒙混过关的嫌疑。\n全称否定型。全称否定型的专业术语为EAE型[^126]。亚里士多德给出的例子是:\n没有一条鱼是有理性的,所有的鲨鱼都是鱼,所以没有一条鲨鱼是有理性的。\n全称否定型的推理形式与全称肯定型一致,只是前提命题和结论命题均为否定形式的性质命题。如果用A表示所有的鱼,用x表示鲨鱼,用P表示理性,那么上面的推理形式可以表达为\nA~P,如果x∈A或者x⊆A,则x~P。\n这样形式的推理依然属于演绎推理,可以称为否定形式的演绎推理,如果前提否定的正确,那么结论否定的也必然正确。可以考虑一个数学的例子,\n有理系数方程的根不可能是π,所有整数是有理数,所以整数系数方程的根不可能是π。\n与全称肯定型的论证形式比较,有一个问题应当引起注意,这就是:全称肯定型中论据命题关注的是一个元素,而全称否定型中论据命题关注的往往是集合A的一个子集合。比如在上面的例子中,所有整数组成一个集合,这个集合是自然数集合的一个子集合。\n事实上,子集合的推论也可以用于全称肯定型,因为可以把元素x用子集合替代。亚里士多德没有注意到这样的区别,但现代逻辑学家认为这样的分辨区别非常重要,比如,罗素就认为这样的变化可能会出现逻辑上的问题,他曾经把亚里士多德关于苏格拉底的经典例子变化为:\n凡人都有死,所有希腊人都是人,所以所有希腊人都有死。\n针对这样的表述形式,罗素认为有一个问题是需要注意的,这就是:判断\"苏格拉底是人\"与判断\"所有希腊人都是人\"是不一样的,前者是具体的存在,后者是抽象的存在,因此,后者的陈述比前者的陈述在形式上要复杂得多。罗素认为不能混淆这样的陈述,这是因为[^127]:这种纯形式的错误,是形而上学与认识论中许多错误的一个根源。\n但是,罗素所说问题对于数学推理是不存在的,因为数学研究的对象就是抽象的东西,我们只需要把全称肯定型的推理形式变化为\nA→P,如果B⊆A,那么B→P。\n就可以了。事实上,集合中的一个元素也可以构成这个集合的子集,因此,可以认为上面的表达是全称肯定型推理的一般形式。\n但罗素所说的,判断抽象存在要比判断具体存在困难,这是千真万确的,如同前面所说,这就是三段论推理形式的本质:把判断困难的、具有一般性的命题作为前提,把判断不困难的、具有特殊性的命题作为结论。可是,也只有这样,才能保证得到的结论必然正确。\n上述两种形式的三段论之所以称为全称型,不仅仅是因为前提命题表述的是一个集合A中所有元素具有某一种性质,更重要的是,论据命题指明的研究对象是集合A中的一个元素或子集,结论命题表述的是这个元素或子集具有相同的性质。\n与此对应,三段论第一格的后两种形式被称为特称型,与全称型不同之处在于,论据命题指明的研究对象是包含集合A的更大的集合B,结论命题表述集合B中存在一类特殊的元素或子集具有与前提命题述说的同样的性质,因此这样的表述是特称的。因为结论命题表述的特称蕴含着前提命题论述的对象A,因此得到的结论必然正确。或者更确切地说,如果前提命题的结论为真,那么结论命题的结论也为真。下面,我们具体讨论经典三段论的后两种形式。\n特称肯定型。特称肯定型专业术语为AII型[^128]。亚里士多德给出的例子是:\n凡人都有理性,有些动物是人,所以有些动物是有理性的。\n如果用A表示人,用B表示动物,用P表示有理性这个性质,那么,可以用数学的语言把上面的推理形式表达为:\nA→P,如果 A⊆B,则存在a∈B 使得 a→P。\n可以看到,对于数学的推理,上述论证形式没有任何意义,这是因为,数学的结论必须是一般的,只是认定了某些特殊情况是没有意义的。比如哥德巴赫猜想,容易验证小于100的偶数都可以表示为两个素数和的形式[^129],可以得到下述特称肯定型的推理形式\n所有100以下的偶数都可以表示为两个素数的和,有些偶数是100以下的,所以有些偶数可以表示为两个素数的和。\n显然,这样推理得到的结论对于数学没有任何意义。\n特称否定型。特称否定性专业术语为EIO型[^130]。亚里士多德给出的例子是:\n没有一个希腊人是黑色的,有些人是希腊人,所以有些人不是黑色的。\n如果用A表示希腊人,用B表示人,用P表示黑色的这个性质,可以用数学的语言把上面的推理形式表达为:\nA~P,如果 A⊆B,则存在a∈B 使得 a~P。\n可以看到,对于数学的论证,特称否定型三段论是强有力的,因为对于数学、进而对于科学,否定结论只需要举出一个反例。比如,关于尺规作图三等分角的问题,虽然只讨论了60度角这一种情况[^131],但基于这种情况可以得到特称否定型推论:\n60度角是不能三等分的。有些角是60度角。所以,尺规作图三等分角是不能的。\n这样的证明形式在数学中屡见不鲜。\n整体演绎推理。可以看到,虽然可以把三段论的论证形式划分为全称和特称,但在本质上,与我们在问题4讨论的演绎推理的表述形式是一致的。现在,我们拓展三段论的论证形式、也就是、把简单演绎推理拓展到更为复杂的推理过程,依然借助传递性的准则。\n称一个推理过程是整体演绎推理,如果这个推理过程可以分解为若干个简单演绎推理首尾相接的形式,使得前项的结论命题是后项的前提命题。\n这里所说的简单演绎推理,是指问题4中所说的由三个性质命题构建的演绎推理形式,是第一类具有性质传递性的逻辑推理,其中三个命题分别为:前提命题、论证命题、结论命题。这样,可以用数学的语言把整体演绎推理表达为:\nA→P,如果B⊆A,那么B→P ;如果x∈B,则x→P。\n这样的论证形式是具有传递性的,因为命题的论证对象或者论证对象的替代物始终保持不变,最初命题述说的性质与最终命题述的性质也始终保持不变,这样就定义了一个推理过程的整体逻辑性。也可以用三段论的形式述说这样的论证形式。\n复合三段论。无论是日常生活的问题、还是纯粹的数学问题,一个有逻辑的推理过程往往可以表示为复合三段论的形式,进而形成整体演绎推理。下面,我们借助一个数学推理的过程分析复合三段论的逻辑性。\n三角形内角和为180度,两个直角和等于180度,所以一个三角形不能有两个角等于或大于直角。等腰三角形两个底角相等,所以等腰三角形的底角不能等于或大于直角。小于直角的角为锐角,所以等腰三角形的底角为锐角。\n这个推理是由三个全称肯定型三段论组成的,形成传递性连接,即前项的结论命题是后项的前提命题,符合整体演绎推理的表达形式,因此整个推理过程是有逻辑的。分析上面的论证过程还可以知道,满足性质的论证对象的范围由大到小、即由一般三角形的两个角到等腰三角形的两个底角,这样就保证演绎推理的传递性结构,也就是人们通常所说的,从一般到特殊,因此得到的结论必然正确。\n需要特别注意的是,上述推理过程中的简单推理只能是演绎推理的形式,而不能是归纳推理的形式、即不能是满足性质的论证对象的范围由小到大,否则会引发一系列的谬误。我们分析一个诡辩的经典论述,这是鲁迅在文章《论辩的魂灵》中对某些顽固派诡辩方法的描述:\n你说甲生疮,甲是中国人,就是说中国人生疮了。既然中国人生疮,你是中国人,就是你也生疮了。你既然也生疮,你就和甲一样。而你只说甲生疮,则竞无自知之明,你的话还有什么价值?倘你没有生疮,是说诳也。\n这个推理显然是荒谬的,可是,导致错误的原因是什么呢?\n一般来说,诡辩最常用的方法就是整个推理过程貌似符合演绎推理的形式,但在其中掺杂着归纳推理,于是就偷换了概念。在上文中,第一个简单推理的表述形式貌似演绎推理,但实际上是归纳推理,因为甲是中国人的特例。如问题4所述,归纳推理得到的结论或然成立,因此,把或然成立的结论命题作为第二个简单推理的前提命题是不可以的,不符合整体演绎推理的论证规则。正因为如此,导致以后推理得到的结论都是荒谬的,甚至,以后的推理过程表述的越是严谨得到的结论越是荒谬。\n此外,还可以把三段论拓展到假言三段论的论证形式,在本质上,假言三段论就是把简单推理中的三个性质命题更换为关系命题,这样的论证形式也经常出现在数学证明的过程中[^132]。\n话题4 基于公理体系和运算法则的四则运算\n从小学数学开始,数的认识是借助现实背景,数的运算是述说实际意义,然后通过数学符号予以表达,经历了从感性具体到感性一般、从感性一般到理性具体的思维过程,这是数学第一个层次的抽象。但是,数学最终要脱离现实背景和实际意义,实现研究对象的符号化、证明过程的形式化、论证逻辑的公理化[^133],经历了从理性具体到理性一般的思维过程,这是数学第二个层次的抽象。\n虽然第二个层次抽象的学习需要到大学阶段的数学教学,但是,这种学习的发端最好还是始于初中数学教育。下面,讨论如何基于算术公理体系产生自然数和加法,然后讨论基于运算法则的四则运算,最后讨论逆运算与数域的扩充。\n基于算术公理体系的自然数。对于数学第二个层次的抽象,所有数都源于自然数,自然数是通过算术公理体系定义的,其他数的产生均是源于运算的结果。\n1889年,意大利数学家皮亚诺发表了题目为《用一种新方法陈述的算术原理》的论文,提出了算术公理体系,利用\"直接后继\"的概念,从1开始通过\"直接后继\"产生1以后的所有自然数,也就是下面的自然数的成过程:2\n= 1 + 1, 3 = 2 + 1,4 = 3 + 1,......\n直到产生无穷多个自然数。这样的产生过程意味着,用什么样的符号表达自然数不是本质的,甚至十进制的表达也不是本质的,自然数的本质是:自然数是一个一个大起来的。\n后来,皮亚诺又把自然数改为从0开始。这是因为,如果自然数不从0开始,那么0将不是任何自然数的后继;没有0就不能通过加法定义相反数,就产生不了负数,自然数集合将不能得到扩充。为了保证自然数的唯一性、以及加法运算的可行性,算术公理体系提出下面的九条公理:\n1. 0∈N。\n<!-- -->\n2. a∈N,则a=a。\n<!-- -->\n3. a,b∈N,a=b等价于b=a。\n4. a,b,c∈N,如果a=b, b=c,则a=c。\n5. a=b,如果b∈N,则a∈N。\n6. 如果a∈N,则a+1∈N。\n7. a,b∈N,如果a=b,则a+1=b+1。\n8. a∈N,则a+1≠0。\n9. 令A是一个类,1∈A。如果a∈N∩A,则必有a+1∈A,那么,N⊆A。\n其中N表示自然数的集合。\n在上述公理体系中,第5条是说:与自然数等价的元素都是自然数,保证了自然数的唯一性,也就是说,自然数与表达形式无关;第6条是说:自然数是一个一个大起来的。算术公理体系彻底摆脱了现实背景和实际意义,实现了最一般意义的抽象:任何\"数系\"只要满足公理体系,那么这些\"数系\"就是等价的。这就保证了计算机的\"二进制\"计算与通常使用的\"十进制\"计算的一致性。\n公理体系中的第7条和第8条是非常重要的,这两条公理保证了自然数的后继是唯一的,进而保证了用\"直接后继\"产生自然数的合理性。比如,要说明\n4 ≠ 3,\n可以用反证法来证明这个结论:如果假设4 = 3,那么根据第7条公理有3 = 2,2 =\n1,进而1 = 0,这个结果与第8条公理矛盾,因此假设不成立,根据排中律有4 ≠\n3。\n基于算术公理体系的加法。通过\"直接后继\"的方法可以定义加法。第3条公理保证符号\"=\"的对称性,可以如下定义加法:\n1=0+1 ←→ 0+1=1\n2=1+1 ←→ 1+1=2\n3=2+1 ←→ 2+1=3\n4=3+1 ←→ 3+1=4\n......\n虽然上述表示是等价的,但含义却有本质的不同,等号左边定义的是自然数,等号右边定义的是自然数的加法。自然数的加法是从加1开始的。下面讨论,如何把加1的加法拓展到一般,这要用到数学归纳法,公理体系的第9条述说了数学归纳法的公理框架[^134]。\n令 P(a) 是与元素a有关的命题,用A表示关于命题 P(a)\n成立的元素a所构成的集合。通过公理9可以知道:对于任何自然数a(表示为a∈N),如果命题P(a)\n成立(表示为a∈N∩A)必然有P(a+1)\n成立(表示为a+1∈A),那么,这个命题对所有自然数N都成立(表示为N⊆A)。可以看到,这正是数学归纳法的论证过程。下面,借助数学归纳法定义自然数的加法。\n从0开始。\n对于任意自然数a∈N,由6公理可以得到a+1。\n如果对于自然数b∈N,得到了a+b。\n那么,可以进一步得到\na+(b+1)=(a+b)+1。\n根据公理9,加法对a加以所有的自然数成立。\n因为a是任意自然数,所以加法对所有自然数成立。\n上面的论述可能过于抽象,为了便于理解,我们举一个具体的例子来说明上面的论述。比如,首先定义基于自然数5的加法,通过公理6可以得到5+1。又因为\n5 + 2 = 5 + (1 + 1) = (5 + 1) + 1,\n就得到了5 + 2。进一步,因为\n5 + 3 = 5 + (2 + 1) = (5 + 2) + 1,\n就得到了5 +\n3。如此类推,就得到了所有基于5的自然数的加法运算。而\"如此类推,就可以得到\"的合理性是由公理9保证的。因为上面论证的出发点自然数5是任意选取的,这就证明了加法运算对于所有的自然数是成立的。\n许多人或许会认为,这样产生加法真是繁琐、真是多此一举。但是,为了保证数学的合理性,数学家们不能不这样小心翼翼。虽然基础教育阶段的数学教育,不需要用这样的方法解释自然数、以及自然数的加法,但是对于数学教师,了解现代数学的研究路径是必要的。作为一种折衷,《义务教育数学课程标准(2022年版)》是通过计数单位,实现数认识和数运算的抽象,这是一种构造性的方法。\n现在,我们需要强调的是,对于数学的第二次抽象,只有自然数和加法是规定,其他运算、包括逆运算都是通过性质和算律得到的,其他的数都产生于逆运算的运算结构。我想,对于义务教育阶段的数学教师,最好能够很好地理解这样的拓展过程,在这样的过程中理解数学运算的本质:算律决定算理、算理决定算法,并且把这样的理解落实在数学教学的过程之中。下面,我们逐一讨论。\n基于相反数定义的减法。如问题8中说,负数也是对于数量的抽象,与正数的关系是:数量相等、意义相反;但是,为了脱离现实背景和实际意义,人们基于加法和0定义了相反数,于是从运算的角度得到了负数。\n现在,我们借助相反数定义减法,进而得到基于自然数公理体系的减法运算。回顾相反数的定义,对于任意a∈N,如果b满足a+b=0,则称b为a相反数。令\nZ = {a,b;a+b=0,a∈N},\n是包括所有自然数和相反数的集合,称为整数集合。在整数集合Z中,正整数与负整数互为相反数。这样,通过相反数使得数域得到扩充:从自然数域扩充到整数域。\n对于a,b∈N,定义a-b = a+(-b) =\nc为减法运算,称其中的a为被减数、b为减数、c为差,这就是基于加法运算和相反数定义的减法运算。因为通过减法运算得到的差必然是整数,因此,整数集合对于减法运算封闭。\n显然,如果a-b=c,那么a=b+c,也就是说,被减数是减数和差的和,因此可以把减法运算看作加法运算的逆运算,这就回归到了最初的基于实际意义的减法运算。\n基于运算律定义的乘法。我们在自然数集合N上定义一种运算,用符号 *\n表示这样的运算,要求这种运算满足两个性质和三个算律。\n对于任意自然数a,b,c∈N,\n满足性质:a*0=0;a*1=a。\n满足算律:交换律 a*b=b*a;结合律 (a*b)*c=a*(b*c);分配律\n(a+b)*c=a*b+a*c。\n下面我们证明,所定义的运算与通常所说乘法运算是一致的。首先考虑自然数集合,对任意a,b∈N,把通常所说的乘法表示为a×b,那么\n先讨论对于2的运算。\n因为2*a=(1+1)*a=1*a+1*a=a+a=2×a,与乘法运算一致。\n如果对于k∈N,k*a=k×a成立,那么\n验证k+1∈N的情况,\n因为(k+1)*a=k*a+1*a=k×a+1×a=(k+1)×a,与乘法运算一致。\n根据数学归纳法,证明了所要的结论。\n这样,我们就证明了在自然数集合,两个性质和三个算律定义的运算与通常所说的乘法一致。为了把这样定义了的运算拓展到整数集合,需要讨论有负数参与的运算。事实上,只需要证明\n-1*1=1*(-1)=-1,(-1)*(-1)=1\n这两个式子成立,因为这两个式子成立就可以把我们定义的乘法运算拓展到整数集合,并且说明在整数集合,我们定义的乘法运算与通常的乘法运算也是一致的,进而说明乘法运算完全可以由两个性质和三个算律定义。这两个等式证明如下:\n从第一个性质出发,可以得到\n0 = 0 * 1\n= [(-1) + 1] * 1\n= [(-1) * 1] + 1 * 1\n= [(-1) * 1] +1\n因为1的相反数为\n-1,我们就证明了第一个等式。其中,第二个等式成立源于相反数的定义,第三个等式成立源于分配律,第四个等式成立源于第二个性质。类似地,可以得到\n0 = 0 * (-1)\n= [(-1) + 1] * (-1)\n= [(-1) * (-1)] + [1 * (-1)]\n= [(-1) × (-1)] + (-1)\n因为\n-1的相反数为1,我们就证明了第二个等式。其中,最后一个等式利用了第一个等式的结论。\n通过上面的论述可以知道,与加减运算一样,乘法运算可以通过现实背景和实际意义得到,也可以通过运算的性质和算律定义。因为通过性质和算律定义的乘法是形式化的,这样,乘法运算就摆脱了现实背景和实际意义的束缚,实现了数学的一般性。\n十进制的乘法运算:算律决定算理、算理决定算法。上面所定义的乘法是基于一般意义的自然数,但在日常生活和生产实践中,人们所使用的数是基于十进制表达的自然数,这就是涉及到具体算法。中国古代发明了九九表,得到了一位数乘以一位数的计算方法,下面讨论,如何把九九表的计算方法拓展到任意自然数。\n假设我们已经知道了两位数乘以一位数的算法,分析如何进行两位数乘以两位数的算法。我们通过一个具体的例子说明,有兴趣的读者可以尝试自己拓展到一般形式。比如,计算23×15,为了得到通常的计算乘法的竖式,需要进行横式的展开\n23×15 = 23×(10+5) = 23×(5+10) = 23×5 + 23×10 = 115 + 230 = 345\n其中用到了交换律和分配律。\n在上述的计算过程中,利用分配律把乘法分解为两项乘法之和,第一项和第二项分别为竖式计算的第一项和第二项,而这两项的运算是假定已知的,这样就实现了乘法算法从未知到已知的转换,这样的转换依赖算律。事实上,还可以进行这样的横式展开\n23×15 = 23×(10+5) = 23×10 + 23×5 = 230 + 115 = 345\n于是,我们就可以得到另一种竖式的计算方法。不仅如此,还可以把第一个乘数分解,进一步得到不同的横式展开和相应的竖式计算。这样,如果把横式称为算理、把竖式称为算法,那么,乘法运算的一般规律就是:算律决定算理、算理决定算法。显然,我们可以用类比的方法,把乘法运算拓展到任意十进制的数值计算。\n基于倒数定义的除法。我们知道,除法是乘法的逆运算:如果把乘法表示为a×b=c,那么就可以把除法表述为c÷b=a,这是基于实际意义的定义。同样,为了脱离现实背景和实际意义,可以通过乘法和1定义倒数,进而定义除法,实现形式化定义的乘法逆运算。\n首先定义倒数。对于任意a∈Z,如果a不为0,那么称满足a×b=1的b为a倒数。令\nR = {a,b;a×b=1,a∈Z-{0}} + {0},\n这是一个包括所有整数和相应倒数的集合,称为有理数集合。因为倒数的表达是对称的,因此对于任意a∈R-{0},如果a×b=1,那么a和b互为倒数,通常把a的倒数表示为1/a。\n对于a,b∈R(其中b≠0),定义a÷b = a×(1/b) =\nc为除法运算,称其中的a为被除数、b为除数、c为商,这就是基于乘法运算和倒数定义的除法运算。因为通过除法运算得到的商必然是有理数,因此有理数集合对于除法运算封闭。\n这样,我们就在自然数公理体系的基础上,通过运算性质和算律定义了四则运算,并且通过运算把数域由自然数集合拓展到有理数集合。\n话题5 有理数与音乐的故事\n古希腊的学者对于数学有着近乎宗教的崇拜,这里所说的数学主要是指基于图形的几何学和基于自然数的代数学。\n自然数之比与音律。毕达哥拉斯及他所领导的学派非常崇拜自然数,包括表达两个自然数比例关系的分数,使得他们对数学的研究从一开始就蒙上了神秘色彩。恰恰是因为这样的神秘色彩,为古希腊形成演绎推理奠定了思维基础,关于这一点,罗素在《西方哲学史》中是这样评价的[^135]:\n数学,在证明式的演绎推理的意义上的数学,是从他(毕达哥拉斯)开始的;而且数学在他的思想中乃是与一种特殊形式的神秘主义密切地结合在一起的。自从他那时以来,而且部分由于他的缘故,数学对哲学的影响一直都是既深刻而又不幸的。\n毕达哥拉斯学派对自然数的理解是深刻的,这样的深刻源于他们借助自然数理解现实世界,一个生动例子体现在他们对于音乐的理解。毕达哥拉斯学派发现,可以把音乐归结为自然数与自然数之间的比例关系:两个绷得一样紧的弦,如果一根是另一根长的二倍,就会产生和谐的声音,这两个音相差八度;如果两个弦长的比为3:2,则会产生另一种和谐的声音,这两个音相差五度。由此可以得到一般性的结论:音乐的和谐在于多根弦的长度成整数比,这样,他们就发明了音阶。据说,毕达哥拉斯最初是这样发现音乐和谐规律、也就是音律的[^136]:\n真是天赐好运,他碰巧走过一个铁匠铺,除了一片混杂的声响外,他听到了锤子敲打着铁块,发出多彩的和声在其间回响。毕达哥拉斯立即跑进铁匠铺去研究锤子的和声。......他对锤子进行分析,认识到那些彼此间音调和谐的锤子有一种简单的数量关系:它们的质量彼此之间成简单比,或者说简分数。就是说,那些重量等于某一把锤子重量的1/2,1/3或者1/4的锤子都能产生和谐的声音。\n许多人都有类似的经验,用不同大小的碗、或者、盛放不同水量的瓶子,可以演奏出和谐悦耳的音乐。但是,要在这样的现象中把音乐和谐的规律抽象出来,并且用数学的语言予以表达,却并不是一件容易的事情,这需要很好的数学素养。\n在古代中国,也有一种类似定音阶的方法,称为\"三分损益法\"又称\"五度相生律\",记载在《管子》这本书中[^137],这要比毕达哥拉斯还要早一些。\n三分损益包括\"三分损一\"和\"三分益一\",三分损一是将固定长度a进行3等分然后减去1份,得到a的2/3;三分益一是将a进行3等分然后增添1份,得到a的4/3。这样,可以得到长度比例为2:3:4,可以得到和谐的声音;把这样的两种方法交替、连续运用,各音律得以辗转相生。古代中国使用五声音阶,分别命名为:宫、商、角、徵、羽,相当于现在音阶的1、2、3、5、6,这样的方法也称为五度相生律。\n事实上,更为合理的音阶划分需要包含一些半音,称为十二平均律。如果把do音的频率与高音do的频率分别记为1和2,相应弦长分别记为a和2a。那么在a之后,每个音都比前一个音的频率高2的开12次方倍,对应的弦长分别为\n\n这样就得到了一个等比数列,公比为\n\n虽然这样限定的等比是一个无理数,但这个无理数大约等于有理数1.06,这个差异所产生的音乐的差异,人的耳朵是分辨不出来的。这样,通过运算可以得到\n\n就把从do音的频率到高音do的频率\"平均\"分为12份,因此称为十二平均律。\n明代朱元璋的九世孙朱载堉对十二平均律进行了精确的计算,写在他的著作《乐律全书》和《律吕精义》之中。朱载堉得到的公比为\n1.059 463 094 359 295 264 561 825\n这是2开12次方的精确到小数点后25位的近似。为了得到这样的精确计算,朱载堉创造了横跨81档的特大算盘,这样的算盘能够进行开平方的计算。\n在现代社会,十二平均律广泛应用于键盘乐器制作,源于德国作曲家巴赫于1722年发表的《谐和音律曲集》,这是专门述说十二平均律键盘乐器的著作。\n那么,为什么音频之间成比例就可以得到和谐的声音呢?原因大概是这样的,我们听到的声音是有一定频率的[声波](https://baike.baidu.com/item/%E5%A3%B0%E6%B3%A2),频率是指单位时间内声波周期性变化的次数,频率越高,则声音的音调越高,频率越低,则声音的音调越低。如果音频之间成比例,那么对应的频率就会有跳跃的共同周期,如图所示,因此各种声音就会和谐。\n{width=\"3.535416666666667in\"\n音频成比例可以得到共同的周期\n基于所发现的自然数与音乐的关联,毕达哥拉斯学派就更加崇拜自然数,认为自然数表现了宇宙的和谐,于是他们相信,现实世界中事物的所有关系都能用自然数予以表达,如他们所说\"万物皆数\"。正如亚里士多德的评价那样[^138]:\n有一些被称为毕达哥拉斯学派的人们投身到数学研究,并最先推进了这门科学。经过一番研究,他们认为,数学上的本原也就是一切存在的本原,既然在各种本原中,数目自然就是最初的,......。此外,由于他们看到和声的比例和属性是在数目之中,所以就认为,其他的那些东西的全部本性也是由数目塑造出来的。他们认为在整个自然中数目是最初的,数目的元素也就是所有存在物的元素。整个的天是和谐的,是数目。\n毕达哥拉斯在世时间大约是公元前580年到公元前500,亚里士多德比毕达哥拉斯大约晚200年左右,因此,亚里士多德的关于毕达哥拉斯学派的述说应当比较可靠,他们把数理解为数目的存在,而数目又是所有存在的基本属性,因此万物皆数、宇宙和谐。\n后来事情发生了变化,因为他们中的一员发现,边长为1的正方体的对角线的长度不可共度,于是他们称这样的数为无理数,并且希望用几何的方法解释代数的结论。比如,在欧几里得《原本》中,用尺规作图的方法解释了诸如根号2这样的无理数。再后来,人们终于发现用几何方法解释代数的能力是有限的,参见话题22的讨论。\n话题6 算术基本定理与素数的分布\n研究自然数性质的问题大多数都与素数有关,素数是指只能被1或者自身整除的自然数[^139],有些教材也称素数为质数。虽然按照定义,1也应当是素数,但为了论述问题的方便、特别是、为了表达形式唯一性的需要,人们规定素数不包括1,称1和素数之外的自然数为合数。因此,这里所说的合数不是基于加法意义的,而是基于乘法意义的。\n算术基本定理。通过素数的定义可以知道,任何大于1的一个自然数都可以表示为若干个素数乘积的形式,比如15\n= 3×5,60 =\n2×2×3×5,等等。后来人们发现,这样的表示方法是唯一的,于是就形成了下面的算术基本定理\n任意大于1的自然数都能表示为若干个素数乘积的形式,如果不考虑乘子的顺序,那么表示方法是唯一的。\n这个基本定理意味着,自然数中最本质的数是素数,因此可以把素数看作自然数的基本因子,于是人们对素数的研究有了更大的兴趣和动力。后来,如话题10所述,年轻的高斯在他的博士论文中,研究了基于复数的素数,并且把算术基本定理拓展为著名的代数基本定理。\n有两个关于素数的故事是众所周知的,一个故事是说,素数有无数多个,据说是欧几里得第一个证明了这个命题,并且在证明过程中,创造了被称为\"反证法\"的数学证明方法;另一个故事是说,任意大于2的偶数都能表示为两个素数的和,这就是著名的哥德巴赫猜想,至今为止依然是数学最重要的猜想之一[^140]。下面,我们再讨论两个更为深刻的与素数有关的故事。\n梅森数:如何得到更大的素数。虽然说素数有无数多个,但要把素数罗列出来,或者要得到更大的素数却是不容易的,无论如何,逐个验证每一个自然数是不是素数的方法是不可取。1644年,法国著名数学家梅森在著作《物理数学随感》中提出了一种快速验证大素数的方法,这就是计算形如\n\n的数,其中p是素数。梅森在书中断言,当p=2,3,5,7,13,17,19,31,67,127,257时,这种形式的数都是素数;前7个数,是整理前人工作得到的;后4个数,是他猜测的。后来,人们称这种形式的数为梅森数,并且按照p的大小顺序依次称第1个梅森数,第2个梅森数,...\n。\n梅森数与古希腊的一个数学猜想有关,这个猜想是关于完满数的。完满数与毕达哥拉斯学派有关,他们认为,如果一个自然数所包含的因数之和正好等于这个数,那么这个数就是一个完满数。第一个完满数是6,因为6的因数是1,2,3,而6=1+2+3。罗马基督教思想家圣奥古斯丁在《天堂》一书中说:虽然上帝能够在瞬间创造世界,但为了表现天地万物的完满,他还是用了6天。第二个完满数是28,因为1,2,4,7,14能够整除28,因数之和又等于28。古希腊学者猜想,所有完满数都具有\n\n的形式,后者是一个素数。这就意味着,完满数与梅森数一一对应。比如,6是一个完满数,对应第1个梅森数p=2;28也是一个完满数,对应第2个梅森数p=3。\n1772年,欧拉证明了p=31时梅森数是一个素数,这是第8个梅森数。在同一年,欧拉还证明了上述古希腊关于完满数形式的猜想是正确的,从而确立了梅森数与完满数的关联。\n但是,到了1903年事情发生了变化,因为美国数学家柯尔否定了梅森的猜测,他得到\n,\n这就意味着当p=67时梅森的猜测是不正确的。这个例子说明,在许多情况下,把一个合数分解为两个素数乘积的形式是非常困难的,正因为如此,人们把素数理论作为公共密钥的理论基础。\n但是,在大多数情况下,梅森数还是素数,人们利用计算机验证梅森数,使得用计算机搜索更大素数成为可能。2018年底,美国计算机专家帕特里克·罗什利用改进的互联网梅森素数大搜索(GIMPS)程序,找到了第51个梅森素数,这个数字是\n,\n是一个24,862,048位的数,是至今为止人们发现的最大的素数。可以猜想,人们还会利用计算机不断搜寻更大的素数。\n素数定理:素数个数的分布。虽然素数有无数多个,但经验告诉我们,随着自然数的增加素数的个数一定会越来越稀疏,比如,1到100之间有25个素数,401到500之间有17个素数,901到1000之间只有14个素数;如果继续这样的方法,把100个正整数作为一组,那么,到100万的最后一组只有8个素数,到10000亿,最后一组只有\n999 999 999 937, 999 999 999 959, 999 999 999 961, 999 999 999 989\n这4个素数。素数的个数越来越稀疏,那么,素数的分布是不是有规律的呢?\n德国天才数学家高斯曾经推导出正态随机变量的取值规律,这就是著名的正态分布函数[^141],因此高斯对于随机现象取值规律的理解是深刻的。大约在1792年前后,15岁的高斯就已经建立起了素数分布的想法:如果用x表示一个正整数,用\nπ(x) 表示小于等于x的素数的个数,那么比值\nπ(x)/x就表达了素数的分布规律(更确切地说,应当是素数出现的频率)。年轻的高斯开始计算这个比值,他一千个、一千个递增计算直到x大约为100万时,凭借惊人的直觉高斯发现,当\nx越来越大时,这个比值越来越近似于x的自然对数的倒数。后来的1849年,高斯在给他的学生、德国天文学家恩克的信中提到了这段往事,并表述了自己的猜想:\n素数定理。当x非常大时,比值π(x)/x大约等于1/ln(x)。\n高斯始终没有发表这个结果。但从高斯得到结论的过程中可以看到数学研究的基本路径,这就是,从简单的情况入手分析问题,经过一定数量的运算发现规律,最后得到一般结论,这就是基于归纳推理的得到数学结论的思维方法。当然,结论是否为真还要通过演绎推理进行验证。\n比年轻的高斯建立猜想稍微完几年的1798年,法国数学家勒让德在著作《论数论》中,第一个公开发表了类似的猜想:\n,\n其中A和B为待定系数。后来,勒让德猜想这两个系数为:A=1,B趋近于1.08366。在前面提到的1849年的那封信中,高斯对勒让德的猜想表示质疑,他仍然坚持他15岁时的猜想,认为上述比值中的B不应当有[^142],也就是说,表示小于等于x的素数的个数应当为\n。\n直到十九世纪中叶,俄国数学家切比雪夫深入地研究了素数分布的问题,写出了两篇关于素数定理的论文。第一篇论文写于1849年,结论奇怪并且有趣,因为他证明了:如果存在固定的数c,使得\n,\n那么一定有c=1。第二篇论文写于1850年,根据文章的结论可以得到著名的不等式\n,\n其中a和b是两个接近1的常数,并且证明[^143]:只要x足够大,那么\na=0.92,b=1.11。第二篇文章更为重要,因为这篇文章构造的函数启发了德国天才数学家黎曼,黎曼于1859年,在复变函数论中构建了一个类似的函数,人们为黎曼函数,黎曼函数成为黎曼猜想的基础。与哥德巴赫猜想一样,黎曼猜想是现代数学最著名的猜想。\n1896年,素数分布的猜想由法国数学家哈达玛和比利时数学家普森先後独立给出证明。证明过程中用到了复分析,其中用到了前面提到的黎曼函数、或者说、用到了较弱条件的黎曼猜想,导致证明过程非常间接、相当深奥。人们普遍认为应当有一个初等的证明方法,但直到1949年,才由美国籍挪威数学家塞尔贝格给出了一个相对初等的证明方法,因为这个证明方法,塞尔贝格获得1950年度菲尔兹奖[^144]。同年,匈牙利数学家爱尔特希也给出了一个证明素数基本定理的初等方法,爱尔特希获得1983年度沃尔夫奖[^145]。\n话题7 杨辉三角形与圆周率的有理数表达\n初中数学有一个重要的数学公式,就是完全平方公式,这个公式是二项式展开的特殊情况。从完全平方开始,二项式展开可以依次可以表示为\n,\n,\n,\n......\n,\n其中,系数\n,\n符号m! 读为m的阶乘,表示所有小于等于m的正整数的乘积,即m! = m(m--1)\n...1。这样的系数被称为二项系数,正是因为这些系数是二项式展开的系数。\n宋代数学家杨辉得到了一个计算二项系数的递推方法,因为递推方法呈现三角形,于是人们称这样的方法为杨辉三角[^146]。事实上,二项系数表达了重要的组合结构,因此也称为二项组合数,上面的表达式是意大利数学家卡尔达诺给出的,记载在他的著作《机遇的博弈》中。\n二项式系数的推导。因为二项式系数在组合数学中非常重要,因此也广泛应用于概率的计算。因为这样的计算对于初中数学是有意义的,甚至可以作为初中生数学探究的内容,为此我们通过具体的数值计算,分析公式所蕴含的数学思想。\n考虑n=5,m=3的情况,这是在指数为5的二项式展开式中,字母a的次数是2、字母b的次数是3的那一项的系数,因为二个字母的组成有\nbbbaa,bbaba,babba,abbba,bbaab,\nbabab,abbab,baabb,ababb,aabbb,\n这10种情况,因此这一项的系数应当为10。计算对应的二项系数公式,可以得到\n,\n这与我们通过推导得到的结论是一致的。\n牛顿对二项级数的使用极为熟练,在反函数的基础上,利用他所创造的级数反演法得到正弦函数和余弦函数二项级数[^147]\n\n\n的简洁对称的表达式。基于这个表达式,容易得到的导数为,的导数为,还可以得到反正切函数的导数。如果令,那么有,因此有\n,\n再利用牛顿-莱布尼茨公式,可以得到:\n。\n因为\n,当时,,因此,借助上面的积分表达,可以把圆周率写成定积分的形式\n。\n进一步,利用牛顿给出的二项级数,可以得到上述积分中的被积函数的展开式\n,\n然后对上式各项逐项积分,可以得到\n\n计算各项积分以后,就可以得到\n\n这样的表达式。\n上面的表达式表明,人们终于可以通过有理数求和的形式计算圆周率了,或者反过来说,人们终于可以把圆周率写成有理数求和的形式。这个公式是莱布尼茨写给牛顿的信中首次提到的,因此人们称这个表达式为莱布尼茨公式。\n话题8 如何理解无理数\n古希腊数学家丢番图在古希腊数学中独树一帜,丢番图活跃的时间大约在公元前250年左右,比欧几里得稍晚一些,欧几里得活跃的时间大约在公元前300年左右。但难能可贵的是,丢番图完全脱离几何背景研究算术问题,主要研究系数是整数的方程,并且只关注方程的整数(或者正有理数)解的问题,现在人们称这样的一类问题为丢番图问题,时至今日,仍然是数论的一个重要分支。\n因为在论述过程中,丢番图引入代数符号表达未知数,并且对这样的代数符号进行四则运算,因此可以认为,代数学发端于丢番图、形成于韦达。\n丢番图甚至给出了相当现在1/x和x的3次以上幂的表达形式,这在当时是极度抽象的符号,因为古代的人们普遍认为2次幂是平方、表述物体的面积,3次幂是立方、表述物体的体积,这样的表达有具体的几何背景,而\n-1次以及3次以上的幂无具体的几何背景,因此是无现实意义的。\n但是,即便是丢番图,也不能很好理解无理数,比如,当一个一元二次方程式有两个根时,他不知道如何处理这两个根,于是规定:如果两个根均为有理数时,取较大的一个;如果根为无理数或者虚数时,那么就认为这个方程不可解。这样,毕达哥拉斯学派发现的无理数就是丢番图问题的一个特例,因为\n√2是方程x^2^ =2 的一个根,按照丢番图的规定这个方程无解。\n面积的计算与无理数。与古希腊的数学完全不同,古埃及和中国古代强调实用性的数学,他们并没有严格地区分有理数与无理数,而是关注近似值的计算,比如,面积的计算,圆周率的使用。\n几乎所有数学史的著作,都认为几何学起源于古埃及。几何学之所以起源于古埃及,是因为土地测量的需要,这与古埃及人的生存环境有关。古埃及地处干旱荒芜的非州北部,只有周期出现的尼罗河泛滥才给这片土地带来生机。尼罗河每年6月份开始泛滥,洪水大约维持四个月,于是人们每年10月在土地干涸后开始播种,第二年尼罗河再度泛滥前收获完毕。当时洪水泛滥之宏伟是现代人难以想象的,古希腊历史学家希罗多德曾经到过埃及,他在著作《历史》中记载[^148]:\n尼罗河在泛滥的时候,它不仅泛滥到三角洲上去,而且也泛滥到被认为是属于利比亚和阿拉伯的那些地方上去;它泛滥到离两岸有两天的路程的地方,有时远些,有时则近些。\n当尼罗河泛滥到地面上来的时候,只有市镇才可以被看到高高地在水面之上并且是干燥的,和爱琴海上的岛屿非常相似。只有这些市镇露在水面之上,而埃及的其他地方则完全是一片水。......\n船只实际上就是经过金字塔的近旁的 ......。\n尼罗河泛滥对于古埃及人们的生活和经济发展影响巨大,甚至政府的税收政策也与洪水有关。国家规定:根据每年洪水的高度和耕种的土地面积征税,这就引发了几何学的诞生。关于这一点,希罗多德是这样记载的:\n如果河水冲毁了一个人分得的土地的任何一部分土地,这个人就可以到国王那里去把发生的事情报告他;于是国王便派人前来调查并测量损失地段的面积;今后他的租金就要按照减少后的土地面积来征收了。我想,正是由于有了这样的做法,埃及才第一次有了量地法,而希腊人又从那里学到了它。\n希罗多德是公元前五世纪的人,他关于古希腊人从古埃及那里学到几何学的论述应当可信。现在通用的英文几何一词geometry源于古希腊语\nγεωμετρια,就是土地测量的意思,这个词是由 γη(土地) 和\nμετρια(测量)复合而成。\n因此,古埃及人发明几何学完全是为了实际的需要。他们创造了一套有效的计算土地面积的方法,其中包括三角形、长方形和梯形的面积,还包括圆面积的近似公式,这些被纪录在公元前1700年左右的莱茵德纸草书上[^149]。现存的文献表明,虽然古埃及人并没有明确给出面积的定义,但古埃及人很清楚地知道,面积是对于平面图形大小的度量。\n莱茵德纸草书记载,古埃及人用\"四边形两组对边之和的一半的乘积\"作为计算四边形面积的公式,如果一个四边形的四个边的长度依次为a,b,c和d,那么这个四边形的面积为[^150]:\n。\n当这个四边形为长方形,即a=c和b=d时,计算公式为\"长乘以宽\",这就是面积的基本度量单位。很多学者认为这个公式过于粗糙,但我们应当知道,古埃及人发明这个公式是为了测量耕种用地,而耕种用地大多近似为长方形,因此这个公式是非常实用的。\n莫斯科纸草书第14题是一个更为复杂的求体积的问题[^151],原题表述如下:\n如果有人告诉你,一个截面四棱锥体高为6,底边长为4,顶边长为2。你将这个4平方,得到16;又将它加倍,得到8;将2平方,得到4。把16,8,4加起来得到28。你要取6的三分之一,得到2。你要取28的2倍,得到56。看,它是56,你会知道它是对的。\n我们用现代数学符号表述这个解题过程,设上顶正方形的边长为a,下底正方形边长为b,高为h,那么,计算截面四棱锥体的体积公式是\n,\n把a=2,b=4和h=6代入上面的公式,得到体积V=56,因此,你会知道它是对的。特别是,当上顶正方形与下底正方形一致、即a=b时,上面的公式恰为长方体的体积公式:底面积乘以高。这恰恰是计算体积的基本度量单位。\n古希腊学者海伦在著作《度量》中,给出了一个用三角形的三个边长计算三角形面积的公式,如果三角形的边长分别为a,b和c,令s为三角形周长的一半,那么三角形的面积为:\n,\n人们称这个算式为海伦公式。\n在古代中国,也有类似的计算三角形面积的公式,宋代秦九韶于1247年完成《数书九章》这部著作[^152],其中第五卷第二问题目为\"三斜求积\",原文如下:\n问沙田一段,有三斜,其小斜一十三里,中斜一十四里,大斜一十五里。里法三百步,欲知为田几何?答曰:田积三百一十五顷。术曰:以少广求之。以小斜幂并大斜幂减中斜幂,余半之,自乘于上。以小斜幂乘大斜幂,减上,余四约之,为实。一为从隅,开平方之,得积。\n是说,如果三角形三个边长依次为:小斜a=13(里),中斜b=14(里),大斜c=15(里),可以得到三角形的面积为315顷。按当时的计量单位换算:1里为300步,1顷为100亩,1亩为240平方步。可以计算得到1顷\n= 240×100平方步,1平方里 =\n300×300平方步。如果把面积换算为平方里,可以得到:(315×240×100)/(300×300)\n= 84。\n我们分析这个结果与海伦公式的关系,由s = (13+14+15)/2 = 21,s-a = 8,s-b\n= 7,s-c = 6,带入海伦公式可以得到21×8×7×6 =\n7056,把这个数开平方可以得到84。因此,秦九韶的计算结果与海伦公式完全吻合。\n那么,秦九韶是怎么计算的呢?在上文的\"术曰\"中解释了计算方法,称这样的计算方法为少广[^153],\"术曰\"中所说\"幂\"为平方的意思。用数学符号,可以把上述第一句和第二句分别表达为\n上;实;\n最后,对\"实\"开平方就得到面积。通过上面的讨论可以看到,无论是计算的结果、还是算法的解释,秦九韶\"三斜求积\"的方法与\"海伦公式\"都是一致的,于是人们也称海伦公式为秦九韶公式。可以看到,在大多数情况下,通过这样的公式计算得到的三角形面积都是无理数。\n后来,人们逐渐接受了无理数,因为最初的无理数产生于以有理数为系数的高次方程的根,因此称这样的根为代数数。那么,除了代数数以外还有其他的无理数吗?圆周率是无理数吗?如果是,那么圆周率也能通过解有理系数的高次方程得到吗?\n圆周率与无理数。人们很早就知道圆的周长与直径之比为一个常数、圆的面积与半径平方之比为同样的常数,也就是说:圆周长/直径\n= 圆面积/半径平方 = 常数。如果把这个常数表示为 π,把圆的半径记为\nr,那么,圆的周长和面积就可以分别表示为 2πr 和 πr^2^。\n古埃及人对圆的面积给出了很好的近似,他们用方的面积近似替代圆的面积,这与中国古代所说的方圆类似。《莱茵德纸草书》第50题说[^154]:\"直径为9的圆形土地的面积等于边长为8的正方形土地的面积。\"如果把圆周率作为未知数,利用正方形面积和圆面积的计算公式,可以得到方程:\n。\n这样,可以计算 π 大约等于16/9的平方,即256/81=\n3.1605,这是公元前1700年左右的事情,比毕达哥拉斯学派发现无理数要早一千多年。我们也可以看到,对于实用的数学而言,古埃及人没有必要研究这个数是有理的还是无理的。\n表示圆周率的 π\n是一个[希腊字母](https://baike.baidu.com/item/%E5%B8%8C%E8%85%8A%E5%AD%97%E6%AF%8D),是表示周边、地域、圆周等意思的希腊单词的第一个字母。英国数学家琼斯在1706年最先使用这个字母表示圆周率[^155],但并没有引起人们足够的重视,直到1736年,大数学家[欧拉](https://baike.baidu.com/item/%E6%AC%A7%E6%8B%89)也开始用这个字母表示圆周率之后,这个字母才逐渐成为圆周率的代名词。\n对于 π\n的近似计算,古希腊学者阿基米德做出卓越的贡献,他借助[单位圆](https://baike.baidu.com/item/%E5%8D%95%E4%BD%8D%E5%9C%86?fromModule=lemma_inlink),从内接正六边形和外接正六边形出发,分别拓展为内接正十二边形和外接正十二边形、内接正九十六边形和外接正九十六边形,求出圆周率的下界和上界分别为223/71和22/7,取平均值3.141851为圆周率的近似值[^156]。\n在中国古代,最早有《[周髀算经](https://baike.baidu.com/item/%E5%91%A8%E9%AB%80%E7%AE%97%E7%BB%8F?fromModule=lemma_inlink)》记载\"径一而周三\"的记载[^157],是说\nπ=3。后来,南北朝时期的祖冲之得到了非常精确的近似值,《隋书》卷十六《志》第十一《律历》记载的圆周率是:\n以圆径一亿为一丈,圆周盈数三丈一尺四寸一分五厘九毫二秒七忽,朒数三丈一尺四寸一分五厘九毫二秒六忽,正数在盈朒二限之间。密率,圆径一百一十三,圆周三百五十五。约率,圆径七,周二十二。...\n所著之书,名为《缀术》,学官莫能究其深奥,是故废而不理。\n是说,祖冲之得到圆周率在3.1415926和3.1415927之间,如果用分数表示,在约率22/7与密率355/113之间。由此可以看到,祖冲之得到的圆周率有8位可靠数字,这个结果领先世界长达九个世纪之久。可惜的是,记载祖冲之计算过程的著作《缀术》已经失传,现在已经无法知晓上述两个近似小数是如何得到的,因为22/7\n= 3.1428571...,355/113 =\n3.1415929...,因此可以断定,两个近似小数不是通过约率和密率得到的。\n祖冲之的约率与阿基米德的结果一样,是通过计算\"内接正96边形周长与圆直径\"的比得到。密率355/113对\nπ 的近似更为重要,因为按照分数的分母从小到大排列,下一个比密率更接近 π\n的分母最小的分数是52163/16604 =\n3.1415923...,比密率并没有精确多少,但要繁杂得多。为了纪念祖冲之的贡献,日本数学家三上义夫在著作《中日数学发展史》中,建议把密率355/113称为祖率。为此,著名桥梁学家茅以升经对三上义夫的建议表示感谢[^158]:\n冲之密率,千载之后西洋始有发现,......日畴三上义夫,以此率源于中国,尝有建议拟命\"祖率\"。他日举世景从,亦所以副先民之苦心者矣。\n一直到了十八世纪,为了数学的严谨性,数学家才开始认真思考无理数到底是一种什么样的数。欧拉认为,除了代数数以外还存在其他类型的数,称这类数为超越数,以此表明这样数的获得需要超越代数的方法,欧拉猜想圆周率\nπ 就是一个超越数。\n判定 π\n是否为超越数的问题十分重要,这涉及到古希腊的一个被称为\"化圆为方\"作图问题,问题要求:做一个面积等于单位圆的正方形[^159]。1844年,法国数学家柳维尔用构造性方法证明了超越数的存在,论文的题目是\"论既非代数无理数又不能化为代数无理数的广泛数类\"。1873年,法国数学家埃尔米特证明了e是一个超越数,所说的e是自然对数的底,是现代数学中一个非常重要的数。到了1882年,德国数学家林德曼修改了埃尔米特的方法,成功地证明了\nπ 是一个超越数,同时也就彻底解决了化圆为方这个古老的作图问题。\n再后来,基于集合论的理论体系,康托用对应的方法证明了超越数的个数要远远超过代数数,但至今为止,人们能够述说清楚的超越数依然寥寥无几。希尔伯特23个问题中的第7个问题涉及超越数,问题的题目就是\"某些数的无理性与超越性\"。\n从上面的讨论可以看到,合理定义无理数、进而合理定义实数并不是一件轻而易举的事情。虽然初中数学把数域由自然数集合扩充到了实数集合,但在数学发展的历史上,实数理论的确立却比微积分的出现还要晚许多,为此,美国数学史家克莱因论述到[^160]:\n数学史上这一系列事件的发生顺序是耐人寻味的,并不是按着先整数、分数,然后无理数、复数、代数数和微积分的顺序,数学家们是按着相反的顺序与它们打交道的。他们看上去是极不情愿地去处理那些本可以留在最后,并能很好地理解的数,他们非到万不得已才去进行逻辑化的工作。不管怎么说,大约在1890年左右,在埃及人和巴比伦人能使用整数、分数和无理数的六千年后,数学家们终于可以证明2+2\n= 4。看来,即使是最伟大的数学家也被迫考虑严密性。\n上文中所说的\"1890年左右\"是指皮亚诺于1889年所建立的算术公理体系,在这之前的1872年,康托和戴德金分别用不同的方法建立了实数理论,而在二百多年以前的十七世纪,牛顿和莱布尼茨分别从不同的角度建立了微积分。因此,克莱因说,数学发展的顺序是相反的,也就是说,不是按着现代数学教育所呈现的顺序。为什么会这样呢?\n事实上,合理定义无理数需要重新定义小数形式的有理数,而要证明分数与有限小数、无限循环小数等价需要极限理论。因此,只有当极限理论已经相当成熟以后才可能建立实数理论,只到1872年,康托用收敛有理数数列一般性地定义实数,解决了实数的运算问题;戴德金用有理数的分割定义实数,解决了实数的连续问题。\n在这个意义上,实数理论的最终确立是在微积分发明几百年以后是顺理成章的,这是在寻求微积分合理解释的过程中形成的,这就是我们曾经述说过的数学的第二次抽象。这样的抽象不是基于现实的、而是基于概念的。\n话题9 实数与自然数的共性和差异\n虽然可以通过小数定义有理数和无理数、进而定义实数,但是,无论是初中数学、还是高中数学,所定义的实数都只是名义上的,因为没有一般性地解决实数的运算问题,更没有通过实数的连续性认识实数的结构,因此没有把握实数的本质。\n如果用无限不循环小数定义无理数,那么就意味着,大多数的无理数都是不可表达的,因为这样的表达是没有尽头的,于是如克莱因所说[^161]:\"正如无穷大的数并非数一样,无理数也不是真正的数,而是隐藏在一种无穷迷雾后面的东西。\"因此,在现实生活中,人们只能通过有限小数近似认识无理数、计算无理数,就像上一个话题所讨论的古埃及和中国古代所做的那样。\n比如,要进行 √2和 √3的加法运算和乘法运算,那么只能如下进行,因为 √2\n=1.4142135 ...,√3 =1.7320508 ...,可以得到\n√2 + √3 = (1.4142135 ...) + (1.7320508 ...) = 3.1462643 ...\n√2 ×√3 = (1.4142135 ...) ×(1.7320508 ...) = 2.4494896 ...\n事实上,在日常生活和生产实践中,有了这样近似计算就足够了,正如美国天文学家纽克姆所说的那样[^162]:\"十位小数就足以使地球周界准确到一英寸以内,三十位小数便能使整个可见宇宙的四周准确到连最强大的显微镜都不能分辨的一个量。\"现代计算机的运算,除特殊指明外,无论是对有理数、还是对无理数,都是精确到小数点后8位。\n但是,基于现实背景的无理数的认识和基于实际意义的无理数的运算,无法拓展到一般性的实数的述说,这就像话题4所讨论的那样,为了数学的严谨性,自然数的确立必须借助算术公理体系。比如,我们能够判定\n√2 × √3 = √6的正确性吗?如果可以,那么是否对任意实数a和b,都可以得到\n\n这个结论?显然,这个结论是不正确的,因为会得到\n\n这样荒唐的结果。因此,我们还必须延续话题4的论证方法,在有理数的基础上形式化地定义无理数、定义无理数的运算。这样的定义需要借助极限运算,1872年,德国数学家康托在《数学年鉴》上发表的文章中[^163],详细讨论了无理数的理论,并且命名了实数。\n从有理数到实数。极限运算需要借助公理,虽然现行大学数学分析的教材给出几种不同的公理,并且证明了这几种公理的等价性,但是,最为简约易懂的公理是[^164]:单调有界的有理数列必然收敛。这个公理是符合直观的,比如,考虑形如\n\n的有理数,如果其中的n依次取1,2,......,那么就形成一个有理数列。可以证明,这个数列是逐项增大的,但无论怎样增大,每一项的值都不会大于3,因此是有界的。这样,根据上面所述公理,就证明了这个有理数列收敛,这个数列的极限就是自然对数的底,表示为e,大约为2.718281828459\n...,这个数对于现代数学非常重要。据说是在1727年,欧拉用自己名字的头一个字母e命名了这个数。如上一个话题所说,e不仅是一个无理数,并且是一个超越数。\n对于一般情况,如果用 {a~n~}\n表示一个单调有界的有理数列,那么根据上述公理,这个数列存在极限。如果用a表示这个极限,通常把收敛过程表示为\n\n的形式。显然,极限a可能是有理数、也可能不是有理数,如果不是有理数,那么称这个极限a为无理数。把有理数和无理数统称为实数,并且规定,如果两个有理数列收敛到同一个实数,那么就说这两个有理数列等价,这样,每一个实数都对应于一个单调有界的有理数列。\n后来,法国数学家柯西给出了一个数列收敛的充分必要条件,人们称之为柯西准则:\n一个数列{a~n~}收敛的充分必要条件是,对于任意给定的正整数k ,都有\n。\n直接用柯西准则判断一个数列的收敛也是非常困难的,因为很难对任意给定正整数k进行验证,但因为表述的是充分必要条件,所以可以用来定义收敛数列。人们称满足柯西准则的数列为柯西数列。康托称满足柯西准则的有理数列为基本序列,他用基本序列定义实数:每一个实数对应一个基本序列。基于这样定义的实数,可以通过极限把有理数的运算拓展到实数的运算。\n从有理数的运算到实数的运算。如果实数是通过基本序列定义的,那么接下来的工作,就是把有理数的运算拓展到实数的运算。受话题4的启示,只需要讨论加法运算和乘法运算。\n数学分析的知识告诉我们,如果两个数列极限存在,那么,这两个数列加法的极限等于这两个数列极限的加法、这两个数列乘法的极限等于这两个数列极限的乘法。基于这样的运算法则,对于实数a与b的加法和乘法,假设对应的两个基本数列分别是\n{a~n~} 和 {b~n~} ,那么,\n\n,\n。\n因为对于任何给定的下标n, 加法 a~n~ + b~n~ 和乘法 a~n~ × b~n~\n都是有理数的运算,因此上述两个式子右边括号中的运算是已知的,于是在形式上,我们把四则运算从有理数集合拓展到了实数集合。这样,我们就完成了实数的四则运算运算,事实上,也完成了以实数为系数的方程的运算。\n我们反复说,上面的论述是形式上的,因为论述的过程是用字母表示实数,无论这个实数是有限小数、还是无限小数,也就是说,这样的表达是理念层面的,不是操作层面的。通过存在性论证、而不是通过构造性论述,这是现代数学的基本特征。\n虽然初中阶段的数学教学没有要求理解实数,但无论如何,如上所述,初中数学教师从形式上认识并且理解实数是必要的。进一步,实数源于自然数、又是自然数的终极状态,因此,实数具有自然数的基本属性,同时又具有与自然数的本质差异。\n实数与自然数的共性是可以比较大小。自然数是对数量的抽象,数量的本质是多与少,抽象为自然数的本质就是大与小。通过话题4和这个话题的讨论可以知道,四则运算和极限运算都具有传递性,因此可以把自然数的大小关系拓展到有理数、进而拓展到实数。而其他的数、诸如复数和四元数,都不是通过具有传递性的运算获得的,因此就不具有这样的性质,或许可以说,不具有大小关系的数都不能算作真正的数。事实上,无论是复数、还是四元数,本质上都不是一个数。\n实数与自然数的差异是个数多少不同。个数的差异并不是因为实数包含自然数,因为无论是实数还是自然数的个数都是无穷多个,如问题3所述,现代数学采纳了德国数学家康托对于无穷的定义:\n我们说一个集合A中元素的个数无穷多个,当且仅当A存在一个真子集B,使得B中的元素能够与A中元素一一对应。\n因此,欧几里得几何五个公理中的最后一个公理\"整体大于部分\"不成立,因此我们说,个数的差异并不是因为实数包含自然数。而在于康托进一步定义的、无穷多个意义下的相等:\n我们说两个集合中元素的个数相等,如果这两个集合中的元素能够一一对应。\n基于这样的定义,康托证明了自然数的个数无穷多个,这是因为自然数可以与偶数一一对应,这就用实例反驳了传统的\"整体大于部分\"的公理。希尔伯特通过讲故事解释了其中的逻辑[^165]:如果一个旅店客房的数量是有限的,那么客满了就不可能再容纳新的房客住宿了;但是,如果这个旅店客房的数量是无限的,那么来了新的房客,只需要原有房客依次向后移动一个房间,新房客就可以入住了。\n康托还证明了:有理数的个数与自然数的个数一样多,甚至证明了:代数数的个数与自然数的个数一样多。无穷大小的变化是从实数的个数开始的,康托最初设想实数的个数也与自然数的个数一样多,但在1890年,康托最终证明,实数的个数要比自然数的个数多,后来,人们称这个证明方法为\"康托对角线法\",证明过程如下:\n假设区间(0,1)中的实数是可列的。\n把所有的实数都写成无限小数的形式,比如,把有理数1/2写成0.499...\n的形式,然后把这些实数排列如下:\n\n\n\n......\n\n......\n现在,我们构造一个新的小数\n\n规定在这个数的排列中,如果,则令;如果则令。\n显然是(0,1)中的一个实数,并且不同于上述排列中的任何一个数,这就与实数是可列个的假设矛盾,从而证明了命题。\n于是,康托就进一步对无穷的多少划分了级别,把自然数的个数称为可数多、或者、可列多,意味着这些数可以一个接一个数下去、或者、一个接一个排列出来;把实数集合中数的个数称为连续统,是因为那个时代戴德金刚刚证明了实数的连续性。这样,无论是可数多还是连续统,都是确切的对于无穷大小的度量,康托的结论表明连续统大于可数。\n实数与自然数的本质差异,可以归结为产生这两类数的运算法则的本质差异,也就是极限运算与四则运算的差异。凭借直观,我们可以理解:对于一个收敛的数列再多加上几个数,对于这个数列的排列并不会产生本质差异;但是,极限运算却能够使事情发生根本性变化,能够使某一集合中数的个数由可数多个升华到连续统多个。我们将会在适当的场合深入讨论这个问题。\n话题10 复数与代数基本定理\n在问题12我们讨论,为了脱离现实背景和实际意义的束缚,韦达不仅用字母表示方程中的未知数,并且用字母表示方程中的系数,比如,把一元二次方程写成\n\n的形式,其中x表示未知数,a、b、c表示系数,可以是任何实数。\n因为方程的根是由方程的系数确定的,这样,韦达就给出了用字母表示的求根公式,比如,把上述二元一次方程的两个根表示为\n\n和\n\n的形式。因为初中数学只考虑根是实数的情况,为此,需要假设\n,\n称实数的根为实根,称\n\n为一元二次方程的判别式。\n复数的必要性。我们知道,如果判别式\n\n小于0,那么二元一次方程的根为复数。在相当长的一段时间里,人们不能很好地理解复数,问题出在对于虚数的理解。依照通常的对乘法的理解:一个数自乘之后必然为正数,不管这个数本身是正数还是负数;因此,一个数自乘后变成了负数是不可思议的。古希腊学者丢番图很早就知道一元二次方程式有两个根,但方程的根出现虚数时,他宁可认为这个方程是不可解的。直到十六世纪,数学家依然认同丢番图的办法。\n虽然复数的问题是求一元二次方程的解所引发的,可是,迫使人们认真对待复数的缘由却是因为求一元三次方程的解。意大利数学家卡尔达诺在1545年出版的著作《重要的艺术》中讨论了求解三次方程的代数方法[^166],他的工作在韦达之前,当时还没有抽象出代数方程的一般表达式。卡尔达诺对一元三次方程进行了详细的讨论,给出了十三种解题的公式,现在人们称这些公式为卡尔达诺公式(也翻译为卡当公式)。但是,在求解公式中出现了让人十分尴尬的情况:即便三个根都是实根,在用公式求解的过程中也可能会出现复数。比如,对于方程16 +\nx^2^ + x^3^ = 24x(这是当时人们表示方程的方法),容易验证x =\n4是方程的一个根,于是这个方程就等价于 (x -4)(x^2^ + 5x -4) =\n0,检验其中的一元二次方程可以知道,其余两个根也都是实数,因此这个方程的三个根都应当是实根。可是,如果用卡尔达诺三次方程的求解公式,计算过程中会出现复数,那么,这样的方程到底是有解、还是无解呢?\n虚数这个名称是笛卡尔发明的,虽然笛卡尔并不接受虚根。在1637年出版的《几何》这本书中,笛卡尔凭借直觉得到一个非常重要的结论,这个结论等价于后面将要讨论的代数基本定理:一个方程的根与方程中未知数的次数一样多。笛卡尔把方程正数的根称为真根,把方程负数的根称为假根,之所以称为假根是因为这样的根比\"无\"更小,并且明确地表达[^167]:真根和假根都可能是实的或虚的。欧拉第一个使用符号i表示虚数,写在他1777年提交给圣彼得堡科学院的论文中,这篇论文直到1794年才得以发表,那是在欧拉逝世11年以后的事情。\n复数的代数表达。有了虚数的符号就可以定义复数了。大约到了十八世纪,人们最终认可了复数,并且把复数写成了下面的形式\n,\n其中a和b为实数,i为虚数单位。这样,一个复数表示为实部与虚部两个部分,用和的形式把这两个部分连接起来。必须注意的是,复数表达中的\"加法\"并不是通常四则运算中数与数的加法,而仅仅是一种表示形式而已,在下面\"复数的几何表示\"中将会看到,复数的表达更类似二维向量。人们通常用C表示复数集合。与四则运算和极限运算都不同,解方程的运算不具备传递性,因此通过解方程的得到的复数不存在大小关系,但依然可以定义复数的四则运算。\n复数的四则运算。借助实数的四则运算,人们定义复数的四则运算,复数的加减法为:\n,\n复数的乘法为:\n,\n在上面的运算中需要注意到 i^2^ = -1。特别称两个复数\n\n和\n,\n是共轭的,因为这样两个复数的乘积为实数,即:\n。\n据此,参见后面复数的几何表示,可以定义复数向量的长度。\n当分母不为零时,用分数形式定义复数的除法:\n,\n这样定义的关键,是把分式中的分母变为实数,是通过分子和分母同时乘以分母的共轭实现的。\n可以验证,复数集合C对于复数的四则运算是封闭的。容易验证,在上面的运算中,如果复数的虚部为0,那么得到的结果与实数运算的到的结果是一致的。因此,至少在形式上,可以认为实数运算是复数运算的特例。\n基于复数的素数。在话题6,我们定义了自然数的素数,讨论了算术基本定理。到了十八世纪,当人们认可复数以后,就开始在复数范围研究素数,这样的思考为数论的研究增添了活力,相继出现了解析数论、代数数论等新的研究领域,至今为止方兴未艾。高斯在1801年发表的文章《算术研究》中首先研究了复整数问题,定义了复素数:\n一个复整数称为复素数,如果这个复整数不能分解为除 ±1、±i\n以外复整数乘积的形式。\n这样,实数集合R中的素数在复数集合C中就不一定是复素数了,比如,在实数集合中5是一个素数,但在复数集合却可以表示为两个共轭复整数的乘积:5\n=\n(1+2i)(1-2i),因此5不是复素数。特别是,高斯证明了\"任何一个整数都可以唯一表示为若干个素数的乘积\"这个重要命题对复整数也成立,就更强化了研究复素数的必要性。进一步,高斯把乘积形式的命题由整数、复整数拓展到高次多项式,这就是代数基本定理。\n代数基本定理。1799年,年轻的高斯在他的博士论文中给出了代数基本定理的完整证明。借助代数基本定理,可以明确地表达一个高次多项式根与系数之间的关系,使人们能够清晰地认识高次多项式的基本结构。首先,高斯把一个n次多项式表示为\n\n的函数形式,其中系数可以是复数。\n显然,等式 f(x) =\n0对应于n次多项式的方程,因此函数的0解为方程的根。高斯定理说,至少存在一个复数是方程的根。利用高斯定理,可以得到:\n代数基本定理 复系数n次多项式,存在n个复数β~1~,...,β~n~,使得\n。\n代数基本定理表明,在复数范围内,一个n次多项式有n个根,这与前面谈到的笛卡尔的直觉是一致的。下面,用数学归纳法证明代数基本定理。\n显然,当n=1时结论成立。\n假设当n=k-1时结论成立,即对于任意的k-1次多项式g(x),都可以写成\n\n(*)\n的形式。考虑n=k的情况。由高斯定理,至少存在一个复数β使得f(β)=0,即\n,\n用f(x)减去上式,并对幂相同的项合并,可以得到\n。\n因为上式中的每一项中都含有因子(x-β),把这个共同的因子提出,于是每一项都要降一次幂,经过整理后可以得到\n,\n其中g(x)是一个k-1次多项式,由归纳假设可以表示成(*)式。这就完成了证明。\n由此可以看到,虽然复数与实数有着本质的差异,完全是人为创造出来的数学表达,但这个创造意义非凡。正因为有了复数,才使得所有的方程的求解成为可能,都具有了真实的数学意义;并且,如同问题12所讨论的那样,借助代数基本定理,可以把韦达定理拓展到任意n次方程,使得一般性地表达方程根与系数之间的关系成为可能。正如高斯在1811年的一封信中所谈到的那样[^168]:\n我们不应该忘记,(复变)函数与其他所有的数学构造一样,只是我们的创造物,因此当我们由之开始的定义不再有意义的时候,我们就不应当再问它是什么,而应当问,如何做出合适的假设,使它继续有意义。\n这段表述是高斯的经验之谈,是他涉猎数学多个领域、并且进行了深入研究之后的感悟。我想,这也应当成为数学教育工作者理解数学的基本出发点。\n复数的几何表示。事实上,只有给出了复数的几何表示之后,人们才真正感觉到了复数的存在,才开始心安理得地接受复数。\n早在1797年,出生挪威的丹麦测量学家韦塞尔就在丹麦皇家科学院宣读了一篇关于复数的论文,引入了虚轴的概念,把复数表达为平面向量[^169],就像实数对应于数轴那样。但是,直到100年后的1897年,韦塞尔的丹麦文的论文被翻译为法文后,复数几何表示的工作才引起数学界的广泛重视。\n{width=\"2.020138888888889in\"\n如图所示,把平面直角坐标系的横坐标定义为实轴,把纵坐标定义为虚轴,称这样的坐标系为复平面。借助平面直角坐标系表示向量的方法,把复数\n\n对应于复平面上的一个向量,向量顶点坐标为z(x,y)。为了定义的合理性,使得复数向量的长度与实数向量长度表达一致,如图所示,用\n\n表示z的共轭向量,是以x轴为对称轴的向量Z对称向量。这样,通过复数共轭的运算,可以定义复数向量长度的平方为:\n。\n有时也把复数向量的长度表示为绝对值的形式\n,\n称为复数z的模,这是瑞士数学家阿尔冈命名的,写在他1806年出版的著作《试论几何作图中虚量的表示法》之中。如问题14所述,1905年德国数学家甘斯在著作《向量分析导论》中用绝对值一般性地表示向量的长度,再后来,人们才把绝对值用于实数的几何表示。\n话题11 时间的表达与数学模型\n我们曾经在问题21强调,时间与空间是人类认识现实世界最重要的概念,时间与事物发生的过程有关,空间与事物存在的位置有关,因此时间与空间是最本质的概念,也是最难解释清楚的概念。我们在问题21曾经讨论了空间与空间的数学表达,这个话题将讨论时间与时间的数学表达。\n具有思维能力的人们能够发现并且思考:太阳升起落下、日复一日的变化;月亮阴晴圆缺、月复一月的变化;气候四季交替、年复一年的变化,于是可以感悟\"逝者如斯夫\"的过程的流逝,可以建立年、月、日的概念。可以,要表达年、月、日这样的概念,就必须借助数学的语言。\n在远古时代,仅凭我们生活的地球,是无法建立时间概念的,这是因为,过程流逝的判断需要参照物,如前所述,对于生活在地球上的人类,最好的参照物便是太阳和月亮,因此,刻画时间就必须构建描述地球与太阳、地球与月亮之间关系的数学模型,时间模型是人类迄今为止构建的最早构建的、也是最为重要的数学模型,我想,其效能可以与文字的创造、自然数的发明媲美。下面我们分析,古代的人们是如何构建时间模型的。\n构建刻画时间的数学模型。时间的刻画是基于周期的,更具体地说,构建表达年、月、日的时间模型的基本依据是,地球围绕太阳运转一周的时间、是为年,月亮围绕地球运转一周的时间、是为月,地球自转一周的时间、是为日,构建模型的关键是保证年、月、日之间的协调,实现协调的方法是考虑上述三个运转周期之间的比例。\n问题说起来简单,但是,构建这样的时间模型却是一件十分复杂的事情,原因就在于上述三个运转周期之间的比例都不是整数,无论那个周期都不能整除其他的周期。比如,地球围绕太阳运转一周的时间是地球自转一周时间的365倍多一点,也就是说,年是日的365倍多一点;月亮围绕地球运转一周的时间是地球自转一周时间的29倍多一点,也就是说,月是日的29倍多一点;地球围绕太阳运转一周相当于月亮围绕地球运转12周再加11日多一点,也就是说,年是月的12倍再加11日多一点;并且,这里所说的\"多一点\"是一个无法精确表达的数。\n在认识世界这个最基本的问题上,大自然就用这样复杂的结构来考验人类的智慧,可是,在那远古的时代,人们还不知道太阳、地球、月亮之间的运转关系,如何计算运转周期呢?\n几乎所有国家的历法,都规定一年十二个月,也就是说,人们所说的年复一年述说的是十二个月的轮回,其中月的确定依据月亮围绕地球的运转周期。但是,按照常理确定月是没有意义的,因为月亮只是地球的卫星,对地球上一年四季变化的影响很小。与地球一边自传一边围绕太阳旋转类似,月亮围绕地球旋转的同时也进行自转,因为月亮自转一周的时间恰好等于绕地球公转一周的时间,因此月亮总是一个面朝向地球。这种现象被称为\"同步自转\"或\"潮汐锁定\",在太阳系中,这种现象表现在太阳与水星之间,以及所有的行星与卫星之间。2019年1月3日,嫦娥四号在月亮的背面着陆,人类第一次观察到了月亮的背面。\n人们通常把朔日,也就是夜空无月的那一日作为一个月的开始。月亮本身不发光,月光是由于阳光的反射,每逢朔月,月亮正好运行到地球和太阳之间,与太阳同时出没,于是被阳光照亮的那一半背向地球,面向地球的是黑暗的一半,所以在地球上看不到月球,称之为朔月。过了朔日,黄昏后在西方天际可以看到弯弯的月亮,称之为新月;十五天后圆月在中天,称之为望月;过了望月,黄昏后的月亮逐渐移向东方,直到下一个朔月,周而复始。这样,人们就称在地球上看到的月亮运行周期为朔望月。可以观察得到,一个朔望月应当是30(29.53)日。但因为一个结束的朔日恰好又是新周期的开始,这样就必须以两个月为单位计算周期,共有59日,人们用大月30日、小月29日调整。既便如此,两个月还有0.06日的盈余,因此每过一段时间还要增加一个大月,才能保证月初必朔、月中必望。\n但真正的麻烦在于,基于月的历法无法判断一年四季,这是因为阴历一年12个月共354日,与地球公转一周365日相差11日多,三年将积34日。这就意味着,第一年的春分和第二年的春分要相差11天,三年之后相差一个月。因此,一年四季的确立不能依赖阴历,对于农耕民族,必须在阴历的基础上附加阳历予以补充,比如中国古代历法就是在农历的基础上加上二十四节气,如后面将要讨论的那样,二十四节气的制定依赖的是阳历,因此,我们现在所说的农历是阴阳合历。\n在古巴比伦,根据出土的乌尔第三王朝(公元前2010-前2003)的行政管理文件,在历法中规定25年加入10个闰月[^170];还规定了7日为周期的星期,分别用太阳、月亮和行星命名,这个规定一直影响到今天[^171]。中国古代也是通过闰月调整历法,使其与自然季节吻合,如《尚书·尧典》中说[^172]:\"以闰月定四时成岁\"。比较古巴比伦,中国古代采用的添加闰月的方法更加准确:19年加7个闰月,如《淮南子·天文训》中说:\"故十九岁而七闰\"。\n古埃及创造了天狼历:另一种阳历。最初,古埃及也使用阴历,但很快就发现使用阴历的局限性,于是限定阴历只使用于宗教仪式。因为某一种缘由,古埃及制定阳历不是参照太阳而是参照天狼星。在北半球看,天狼星是南部夜空中最明亮的星,在猎户星座附近,在猎人腰带三星的东南方向。中国古代也注意到天狼星,春秋战国时的屈原(约公元前340-前278)的《九歌·少司命》中有\"举长矢兮射天狼\"的诗句,更有宋代苏东坡的《江城子·密州出猎》中\"会挽雕弓如满月,西北望,射天狼\"的诗句。其中,天狼就是指天狼星;长矢和雕弓都是指弧矢星座,共有九颗,如《史记·天官书》中所记载的那样:\"弧九星,在狼东南,天之弓也。\"\n如前所述,古埃及文明的兴盛得益于尼罗河每年的泛滥,而在尼罗河泛滥之时,天狼星就要比太阳更早地出现在东方的天空,在黎明前的黑暗中显得更加耀眼。这样,天狼星也就得到了古埃及人们的崇拜,规定一年从天狼星的偕日升这一天开始,即透特月(Thot)的第一天(7月16日)开始。通过长时间的观察,古埃及人发现天狼星的偕日升周期为365日,误差1/4日,于是规定一年12个月,一个月30日,外加5日的假期,共365日,然后每4年加1日调整误差。可以看到,这样的历法规定非常合适,因为每个月的日数是一定的。其中一年12个月的规定大概也是参照了月亮的盈缺。显然,古埃及的历法不应当称为太阳历,而应当称为天狼历。据说,古埃及的这种天狼历的起始可以追溯到公前4226年左右[^173],距今已有六千多年,可见历史之久远。\n现代历法的确定。在埃及亚历山大城的希腊数学家、天文学家索西琴尼斯的帮助下,罗马帝国的缔造者儒略·凯撒把古埃及的天狼历引入罗马,于公元前46年的1月1日开始实施。规定回归年365又1/4日:4年中的前3年为平年365日,后1年为闰年366日;一年十二个月:单为大月31日,双为小月30日,人们称这个历法儒略历。君士坦丁时代罗马教会获得自由以后,于公元325年的尼策阿教会会议决定,基督教国家共同采用儒略历,把传说中的耶稣基督诞生之年定为纪年的开始,称之为公元(A.D.,即\"我主纪年\"的拉丁文Anno\nDomini的缩写),称纪年前为公元前(B.C.,即\"基督诞生前\"的英文Before\nChrist的缩写)。\n但是,更精确的回归年应当是365.2422日,儒略历与其相差11分14秒,128年相差1日。这样到了公元1582年,人们发现春分竟是在3月11日,与1258年前比相差10日,近乎每400年相差3日。于是,罗马教皇格里高利十三世召集学者开会,研究改革儒略历:把1582年10月4日后的一天定为1582年10月15日,中间跳过10天;同时规定:能被4除尽年的是闰年,但能被100除得尽而不能被400除尽的那一年不是闰年,人们称这个历法为格里历。与儒略历相比,格里历在400年中减少3个闰年,即400年中有97个闰年和303个平年,每年平均365.2425日,与365.2422日更加接近,这个方法可以保证到公元5000年前误差不超过1日。\n古代中国的阳历。中国传统使用的历法被称为农历,因为农历的表现形式是阴历,基于这个原因,人们普遍认为中国古代不很清楚阳历,甚至认为阳历是西方传教士带到中国来的。这是天大的误解,为此,我们需要专门讨论中国古代的阳历。\n中国使用的阴历又被称为农历,因为中国历来以农业为本。但是,正如我们上面讨论过的那样,仅仅凭借阴历是无法指导农业生产的,那么,为什么农历在中国能够使用的如此长久呢?这是因为,中国古代历法,真正指导农业生产的是基于阳历制定的二十四节气,这些节气在历代历法中被放置在非常突出的位置。事实上,中国古代很早就知道阳历一年的周期。\n远在夏商,人们测定阳历一个周期为366日,如《尚书·尧典》所说:\"期三百有六旬有六日,以闰月定四时成岁\",是说,一年有366日,这显然是阳历,因为阴历一年十二个月的天数只有354日。因此,中国古代是用阳历的周期来调整春分、夏至、秋分、冬至这四个节气。当时测算阳历周期的方法被称为土圭之法,也就是立杆测影。\n《周礼·夏官司马》说:\"土方氏掌土圭之法,以致日景\",可见周朝有专门掌管土圭的官员,被称为土方氏。土圭之法的操作方法大致是这样的,在一个平台的中央竖立一根杆子测量太阳的影子,因为一天中正午的影子最短,把这个长度记为这一天的日影。在一年中,夏至那一天的日影最短、冬至那一天的日影最长,这样可以通过日影的长度得到了夏至和冬至;冬至与冬至或者夏至与夏至间隔的天数就是阳历一年的周期;取夏至和冬至日影长度的平均,作为春分和秋分的日影长度。这样,就利用土圭之法确定了春分、夏至、秋分、冬至这四个最重要的节气。可以认为,利用土圭之法测日影,利用日影变化确定时间,这就是中国古代构建的认识时间的数学模型。\n后来,大概在商周就通过土圭之法测定岁的日数为365又1/4日,在《尚书·尧典》的注释中,孔安国用很大篇幅论证了这个事实[^174]。其中的道理,《后汉书·律历》说的明确[^175]:\"日发其端,周而为岁,然其景不复,四周千四百六十一日,而景复初,是则日行之终。以周除日,得三百六十五度四分度之一,为岁之日数。\"是说,观察冬至那一天的日影长度,一岁过去后,日影长度不能重合,四岁即1461日过去后日影长度重合,所以用4除1461得到岁的日数为365又1/4日。\n事实上,《周髀算经》述说了同样的结论[^176],著作开篇记载了周公与商高的对话,周公的问话是:\"古者包牺立周天历度。夫天不可阶而升,地不可将尺寸而度。请问数从安出。\"这里所说的包牺是指中华人文始祖伏羲,所说的\"周天历度\"是指群星围绕北极星旋转一周的时间(参见话题13),恰好是一岁的日数,如这部著作后面述说的那样[^177]:\"故曰,一岁三百六十五日四分日之一\"。\n基于周天立度,中国古代把由二十八星宿所构建的周天定为365又1/4度。也就是说,中国古代规定的圆周是365.25度而不是现在的360度,这个规定是为了描述星辰运转的方便,这与《汉书·律历志》的记载一致:东方七宿75度,北方七宿98又四分度之一,西方七宿80度,南方七宿112度,加起来正好365又四分度之一。\n尽管参照系不同,但中国古代关于阳历一年周期的结论与古埃及是一致的。正因为具有对太阳历的深刻理解,中国古代才可能建立相当准确的二十四节气。\n话题12 六十进制与中国古代纪日纪年\n关于产生六十进制记数法的原因众说纷纭,至今没有一个非常合理的解释[^178]。有学者认为,因为使用六十进制,美索不达米亚人对分数跟对整数一样能够运算自如,而不像古埃及人那样受着单位分数的束缚[^179]。无论如何,六十进制至少有一个好处,就是60这个数包含的因子比较多,便于对60以内的部分的表达,比如,1/2、1/3、1/4、1/5、1/6等等。不管原因如何,古巴比伦人确实使用了六十进制记数方法,在古巴比伦用楔形文字记载的记数系统中,对于数字\"六十\"给予了特殊符号。资料表明,以六十为单位的记数方法,至少可以追索到公元前3200年到公元前2900年的乌鲁克时代[^180]。\n现代时间系统普遍采用六十进制,比如,一小时六十分钟、一分钟六十秒。这样的计时方法,直接原因应当归功于古希腊学者托勒密,因为在他的巨著《天文学大成》中把圆周划分为360度,每度60分,每分60秒,沿用至今;间接原因大概还要追溯到古巴比伦,因为古巴比伦发明了黄道十二宫,这样的思想深刻地影响了古希腊。\n后来,人们发现确定时间更准确的参照物是恒星、而不是太阳。仰望星空,你会发现随着时间的推移整个星空发生旋转,大多数星辰在在这样的旋转中的相对位置是不变的,这些星辰便是恒星。特别是北极星,绝对位置也不变,这是人们辨别方位的最佳参照物,几乎所有古老文明都注意到了北极星。这样,如果在夜空中划出坐标,那么就可以根据某个恒星移动到某个坐标来确定时间。对于深远浩瀚的星空,地球是那么渺小,以至于星空中星辰之间的相对位置近乎于永恒,因此用这种方法来确定时间是相当精确的,这种方法一直延续至今。那么,古代的人们如何建立星空的坐标呢?\n一个办法就是把夜晚与白昼连接起来,连接点就是黄道。古代的人们普遍认为太阳是围绕地球旋转的,黄道就是指白天太阳在天空运行的轨迹。大约是在公元前5世纪左右,古巴比伦人发明了黄道十二宫,用夜空的十二个星座与黄道十二个区域对应,后来,这个发明逐渐传播到了古希腊、埃及、罗马和印度[^181]。广为人知,黄道十二宫的发明孕育出许多美妙的神话故事,也促进了占星术的发展,一直影响到今天。英语表示\"思考\"的单词consider\n就与星辰有关,这个词来自拉丁文considerare,是由表示\"与\"的介词cum与表示\"星辰\"的名词sidus复合而成,因此英语\"思考\"的直接意思是\"与星辰在一起\"。\n许多资料表明,古巴比伦人既通晓计算季节的十二进制记数法,也通晓计算数量的十进制记数法,或许,古巴比伦人创造六十进制记数法用到了10与12的最小公倍数,就像中国古代创造了天干地支的记时方法那样。\n六十进制与天干地支。无独有偶,中国古代也在天空中设定了坐标,这就是二十八个星宿,东南西北各七个,正如《史记·天官书》说:\"天则有列宿,地则有州域\"。中国古代强调的是坐北朝南,因此星宿的表示通常是南在上、北在下,大概到了宋元以后,人们才规范了北在上的地图制作原则[^182]。\n中国古代把黄道由西向东划分为十二等分,称之为十二次,并且用二十八星宿中最近的星宿与十二次对应[^183]。中国古代\"时\"的确认与十二次关系密切,甲骨文记载[^184],殷人已经把一天的时间明确分为四个时,分别称为:旦、午、昏、夜。几乎在同时、或者稍微晚一些时间,人们已经把一天的时间划分为十二时辰了,因为《诗经·小雅·大东》中有\"跂彼织女,终日七襄。虽则七襄,不成报章。\"这样的诗句,诗句中的织女是指织女星座,属于北方七宿,襄是指时辰,七襄是指七个时辰。因此,诗句的前半段说,织女星从升到落,在夜空中走过了七个时辰。这便意味着至少在西周,人们就已经把一天的时间划分为十二个时辰[^185]。\n在中国传统文化中,12这个数字非常重要,甚至影响到今天的每一个中国人,这便是与人的出生年份有关的十二生肖。十二生肖把十二种动物与十二地支联系到一起,这样的表示方法至少可以追溯到汉代,因为在东汉王充(27-约97)的著作《论衡》中就有与今日述说完全相同的记载。古代中国的十二个时辰也是用十二地支命名的,十二地支分别为:\n子、丑、寅、卯、辰、已、午、未、申、酉、戌、 亥,\n其中\"子时\"对应于现在时间23:00--1:00,其余顺推。到了汉代,为了皇宫守夜更替的需要,又把夜晚分为五更,其中\"三更\"半夜,对应于\"子时\"在23:00--1:00之间;\"五更\"黎明,对应于\"寅时\"在3:00--5:00之间,其余类推。到了宋代,人们进一步把每个时辰一分为二,分别称其为初和正,比如,子被分为初子、正子,分别称之为小时,这便是现在汉语中\"小时\"这个词的由来。于是到了宋代,一天的时间就被划分为二十四小时,延续至今。可以看到,时间的确定完全是人为的,确定的基础便是模型,模型的清晰表述需要数学,但不一定就是现代意义下的数学表达式。\n明确了\"时\"就明确了\"日\",那么如何纪录\"日\"呢?在中国古代是用干支纪日法,就是用天干与地支组合。天干共有十个:\n甲、乙、丙、丁、戊、己、庚、辛、壬、葵,\n与前面提到的十二地支组合,方法是这样的:天干的单数配地支的单数;天干的双数配地支的双数,组合数正好是10与12的最小公倍数2×5×6=60。这也就是六十甲子的由来。\n六十甲子与纪日纪年。如果从甲子开始到癸亥结束,六十天为一周,可以循环记录。在很早以前,中国古代就采用了甲子纪日的方法,史书《世本》说:\"容成作历,大桡作甲子,...二人皆黄帝之臣,盖自黄帝以来,始用甲子纪日,每六十日而甲子一周\",根据这个说法,可以认为甲子的记日方法从黄帝时代就开始了。但无论如何,甲子纪日方法至少可以确认到商代,因为殷墟甲骨的卜辞中已经明确有干支纪日的记载[^186];在《诗经·小雅·车攻》中也有\"吉日庚午,既差我马\"这样的诗句。资料表明,自鲁隐公三年(即公元前722年)二月的\"己已\"日至今,干支纪日从未间断,时至今日,已经超过了10万日。\n六十日而甲子一周的纪日方法实在是不方便,远不如年、月、日的纪日方法,因此,除了黄历上有所记载之外,如今的人们早已经忘却了这样的纪日方法。但无论如何,这样的纪年方法却沿用至今,一般认为干支纪年法兴自东汉[^187],六十甲子周而复始至今没有中断,至少到了春节的时候人们会说,今年是农历什么什么年,比如,2024年是农历甲辰龙年。\n话题13 勾股数与太阳的高度\n人们最初发现具有几何规律的图形,大概都与圆、正方形、矩形、以及直角三角形有关。比如,直角三角形三条边的边长之间存在一个恒定关系,也就是说,无论是什么形状的直角三角形,两个直角边边长的平方之和都等于斜边边长的平方,人们称这个恒定关系为勾股定理。非常不可思议的是,人们在很早很早以前就知道了这个关系,并且用具体的数字,比如(3,4,5),表达这样的关系,现在人们称这样的数组为勾股数。\n古巴比伦人很早就研究了勾股数,制作于公元前1900到公元前1600年间的\"普林顿322\"泥板列出了15组勾股数,其中包括(13500,12709,18541)这么复杂的数组,可以想象,即便是到了数学高度发达的今日,通过笔算得到这样的数组也是非常不容易的。更令人困惑的是,至今依然很难说清楚,古巴比伦人为什么要计算如此复杂的勾股数[^188],完全是为了知而知的学问吗?无论如何,古埃及和中国古代,人们研究勾股数的目的是清楚的,那就是为了确定直角。\n勾股数与金字塔。金字塔是人类创造的奇迹,大多数金字塔都是四棱锥体[^189],金字塔的建造说明古埃及人已经掌握了相当精确的几何学知识。以最大的胡夫(Khufu)金字塔为例,原高146.5米(现在138米),底边原长233米(现在227米),令人吃惊的是[^190]:这个金字塔四个底边长度的误差仅为1.6厘米,这是底边长度的1/14000;四个底边直角的误差均小于12分,是直角的1/270000。这是一个在今天都很难把握的精度,而胡夫金字塔却是兴建于公元前2760年,距今近5000年。其中,直角的确定与勾股数有关,或许也与勾股定理有关。\n古埃及人很早就发现了勾股数。在尼罗河三角洲发现的、大约为公元前2000年的卡呼恩纸草书上有这样一个题目[^191]:\n将一个面积为100的大正方形分为两个小正方形,一个边长为另一个边长的四分之三。\n答案为一组勾股数(6,8,10)。因为正方形的面积是边长的平方,于是这个问题可以与勾股定理联系起来。设两个小正方形的边长分别为a和b,大正方形的边长为c,古埃及人大概是这样计算的:\n如果b=1那么a=3/4,由勾股定理可以得到c=5/4。现在c=10,是5/4的8倍,这样就可以得到结论,a=3/4×8=6,b=1×8=8。\n正因为如此,很多数学史学家认为,古埃及人在修建金字塔时,是用(3,4,5)这组勾股数来确定直角[^192]。这个说法很可能是正确的,因为在下面的讨论中可以看到,中国古代就是用这组勾股数来确定直角的,并且借助这样的确定,构建了中国古代借助数学认识、理解和表达现实世界的方法。\n勾股数与周天历度。在话题11,我们曾经讨论了《周髀算经》开篇周公所说的周天历度,是指群星围绕北极星运转的周期,恰好为阳历的一年、即365又1/4天。分析开篇上下文的逻辑关系可以知道,正是为了解释如何得到周天历度,商高说出了最简单的一组勾股数[^193],这也是勾股定理这个称谓的由来。为了便于分析,我们把周公与商高的对话抄录如下\n周公问:古者包牺立周天历度。夫天不可阶而升,地不可将尺寸而度。请问数从安出。\n商高答:数之法出于圆方,圆出于方,方出于矩。矩出于九九八十一。故折矩,以为勾广三,股修四,径隅五。既方之,外半其一矩,环而共盘,得成三四五。\n可以用现在的语言翻译为\n周公问:古代伏羲制定周天历度。天如此之高不可阶梯、地如此之广不可度量,请问周天立度这个数是如何知道的呢?\n商高答:数出于天圆地方,这是自然之形。圆出于方,方出于直角,直角出于数的自乘。基于数的自乘可以得到:勾广三,股修四,径隅五。道理是:既方之,外半其一矩,环而共盘,得成三四五。\n商高的回答似乎是所答非所问,让人摸不到头绪。我想,为了更好地理解上面的对话,必须回归到那个时代,必须知道周公和商高讨论问题的背景。\n如话题11所讨论,中国古代测算一年四季的方法为土圭之法,也就是就是在平台中央竖立一根杆子,测量这个杆子日影的长度。杆子长八尺,称为表也称为髀,因此《周髀算经》是说:计算周朝那根八尺长杆子日影长度的学问。我们将会看到,称其为学问是名副其实的,因为其中蕴含了非常深奥的道理,既包括了直角三角形对应边成比例的数学知识、也包括天圆地方的宇宙观,还包括中华大地的最南段与北回归线恰巧重合的认知,甚至包含了中国这个称谓的由来[^194]。\n使用土圭之法,首先要保证那根八尺长的杆子垂直于平台,这就要用到勾股数:把杆子插入平台处设为O,以O为中心,在杆子上量出3个单位设为点A,在平台上量出4个单位设为点B,如果测得线段AB的长度为5个单位,那么根据勾股数的性质知道,三角形AOB是直角三角形,这就意味着,这根八尺长的杆子垂直于平台。或许,这就是商高回答周公那段话的本意,商高是通过勾股数述说如何使用土圭之法。中国古代文献的述说言简意赅,只有清晰问题的背景、理清论述的逻辑,才能明白述说所蕴含的意义。\n开篇之后,《周髀算经》进入正文,是为了回答周公之问:天那么高不可攀登,如何能计算高度,这里所说的高度是指太阳的高度。因此,《周髀算经》著作主要是论述如何用\"土圭之法\"测量太阳高度,在论述的过程中涉及到中国古代的宇宙观,也涉及到更为一般的勾股定理。\n如何理解日影。对于日影产生原因的认知,涉及到对宇宙的认识。今天的科学告诉我们,地球是圆的,太阳距离地球很远(太阳光行走到地球大约需要8分钟,光速每秒30万公里),这个距离比较只有6000多公里的地球半径是无穷大,因此可以认为罗巴切夫斯基几何成立,也就是说,可以认为太阳光平行地照射到地球上的每一处。这样,如下图所示,夏至那一天在北回归线上会立杆无影,在北回归线以北的地方树立杆子就会出现影子。\n\n图13.1 日射角与纬度之间的关系\n但是,中国古代认为天圆地方,这样的说法大概源于\"盖天说\"。盖天说是中国古代认识天地的一种方法,中国古代还有两种学说,即宣夜说和浑天说,但这两种学说都要比盖天说晚,都是汉以后的事情。《晋书·天文志上》和《隋书·天文志上》中有关的记载是相似的[^195]:\"(盖天说)本庖牺氏周天历度,其所传则周公受于殷商,周人志之\n......\n其言天似盖笠,地法覆槃,天地各中高外下。北极之下为天地之中,其地最高,而滂沲四{width=\"0.13541666666666666in\"\nheight=\"0.13541666666666666in\"},三光隐映,以为昼夜。\"从这段述说中可以知道,盖天说起源很早,可以追溯到伏羲,特别是文中说\"周公受于殷商,周人志之\"大概是可靠的,因此可以推断:周公时代对天地的认识主要是盖天说。盖天说的核心是天地同形,天像一个斗笠,地像一个扣着的盆,虽然地几乎是平的,但天地两者都是中间高、四周低。因为周天是围绕北极星运转的,所以天以北极星为最高,因为天地相似,所以地以北极星之下、即北极为最高。\n在天圆地方的认知下,中国古代认为太阳距离地球并不遥远,佐证就是后羿射日、夸父逐日这些神话故事,还有计算太阳高度这样的想法。此外,中国的独特地理环境也深刻地影响了当时的人们对于世界的认识,在商周时代,人们认为天下的最南端是番禺,因为番禺再往南就是浩瀚的大海。番禺恰好在北回归线附近,夏日立竿无影,如《吕氏春秋》所说[^196]:\"夏至日行近道,乃参与上。当枢之下无昼夜。白民之南,建木之下,日中无影,呼而无响,盖天地之中也。\"因为夏至正午太阳在头顶正上方、立杆无影,因此中国古代认为那里就是天地之中,番禺以北的地方均是立杆有影,于是认为立杆有影的地方就偏离了天地之中,离天地之中越远则影子越长。于是想象,这就像在一间大房间的中央悬挂一盏灯,在房间的地上树立杆子,灯下无影,离灯越远则影子越长。\n太阳并不遥远。根据这样的认识世界的方法,于是《周髀算经》借助陈子之口述说了下面的结论[^197]:夏至正午,在番禺立杆无影,在周都城咸阳立八尺之表测得影长为1.6尺,规定咸阳南下到番禺的距离为1万6千里;根据成比例的想法,两个大小不同的直角三角形,如果其中一个锐角的角度相同,那么,这两个直角三角形直角边边长之比成比例,即:咸阳直角三角形直角边之比等于天下直角三角形直角边之比,这样就可以计算太阳的高度。设太阳的高度为x,可以得到下面的比例关系\n,\n于是计算得到太阳的高度为8万里。\n那么,太阳的高度、即周的8万里折合现今的长度单位是多少呢?或者说,如何知道周1里是现在的多少米呢?我们分析这个问题。\n《周礼·地官·大司徒》中说\"景一寸地千里\",也如《周髀算经》说\"法曰:周髀长八尺,勾之损益寸千里\",这就是说,在同一经度,如果夏至正午南北两地日影长相差一寸,那么这两地距离相差千里。历代学者,特别是隋唐以后的学者普遍认为这个说法是错误的。我想,很可能这些学者的理解有误,利用现代初中数学的知识计算如下。8尺长的杆子,如果日影长度相差一寸、即0.1,那么两条直角边之比为0.1/8=0.0125,利用反正切函数可以得到日射角为0°43′,对应角度大约为0.716度。因为地球近似为圆,经线周长大约为4万公里,1度对应的长度大约为40000/360=111(公里),因此\"景一寸\"对应的距离近似为[^198]:111×\n0.716=79.5(公里)。\n这样,周代的\"千里\"大约等于现在的80公里,太阳高度80000里大约等于现在的6400公里,因此中国古代认为太阳并不那么遥远。根据这样的测算,过去了历史地理的书籍,普遍认为周代的1里等于现在的300米左右的认知大概是不对的。\n话题14 中国称谓的由来\n在话题11,我们讨论了中国古代如何利用土圭之法制定一年四季和二十四节气,涉及到中国古代如何用数学的眼光认识时间;在上一个话题,我们讨论了中国古代如何利土圭之法测量太阳的高度,涉及到中国古代发明的勾股数和勾股定理。在这个话题,我们将讨论中国称谓的由来,如果认定中国是说最中间的国,那么这个话题将会涉及周人的管理制度、对周天下疆域的认知、以及如何判断天下之中,更一般地说,这将涉及到中国古代如何用数学的眼光认识地理方位。\n中国称谓的物证。1965年,陕西省宝鸡县贾村塬出土了西周早期一位何姓贵族定制的祭器,因此称为何尊,尊的内部铸有122字的铭文,记述周成王五年四月,成王继承武王遗志,营建东都成周,事成之后成王在大殿对宗族小子的训话,其中说道[^199]:\n唯王初壅,宅于成周。......\n唯武王既克大邑商,则廷告于天,曰:余其宅兹中国,自兹乂民。\n于是就有了\"宅兹中国\"一词,这是至今发现的最早记载\"中国\"这个词的物证,这个词出自武王之口。武王死时其子成王年幼,托付文王四子、武王同母兄弟周公摄政七年,《尚书大传》记载周公摄政七年作了下面的事情:一年救乱,二年克殷,三年践奄,四年建侯卫,五年营成周,六年制礼作乐,七年致政成王。其中\"五年营成周\"与铭文的记载是一致的。\n从中可以看到,选择\"地中\"营都成周是武王之意,正如《左传》中说:\"昔武王克商,迁九鼎于洛邑。\"而武王选择\"地中\"的目的在铭文中已经说得很清楚了:可以告诉上天,我居住在中国,自此而治民。或许,包括武王在内的当时的人们普遍认为,能够获取\"地中\"而建都,那么统治天下就名正言顺。也如《吕氏春秋·慎势》所说:\"古之王者,择天下之中而立国,择国之中而立宫,择宫之中而立庙。\"这里所说的\"天下之中\"便是\"地中\"的意思,是指在周天下的正中间所立的国为中国,这也就是武王所说的中国。\n如何确定天下之中。在那个地理知识相当贫乏的年代,应当如何确定地中在哪里呢?下面一段文字给出了答案,《周礼·地官·大司徒》中记载:\n以土圭之法测土深,正日景,以求地中。日南则景短多暑,日北则景长多寒,日东则景夕多风,日西则景朝多阴。日至之景尺有五寸,谓之地中:天地之所合也,四时之所交也,风雨之所会也,阴阳之所和也。然则百物阜安,乃建王国焉,制其畿方千里耳封树之。\n在注释中,郑玄引用郑众的话说[^200]:\"土圭之长尺有五寸,以夏至之日立八尺之表,其景适与土圭等,谓之地中。今颍川阳城地为然。\"述说的是用土圭之法测定地中的过程,其中土圭是一个一尺五寸长的尺子。夏至正午立八尺之表,然后测这个表的影长,影长恰好等于土圭之长的地方便是地中。周认定这个地方是颍川阳城,也就是现在的河南省登封县告成镇,那里存有周公观景台等遗迹。下面,我们用现代知识分析登封告成的地理方位。\n回顾上一个话题中的图13.1,其中A表示北回归线上的点,夏至正午立杆无影,角b是北回归线与赤道平面的夹角、即北纬度数等于23°26′,称为回归角;B表示登封告成,夏至正午立杆有影,a=10°37′\n是日射角。因为太阳光平行,根据平行线内错角相等的性质,地心角AOB=a,因此,可以得到登封告成的北纬度数是a+b=10°37′+23°26′=34°03′,但登封告成的实际纬度是北纬34°23′,计算结果比实际数据大约要小20分,这个差异主要是北极星的微小移动引起的[^201]。\n也如图13.1所示,北极星的方向决定了赤道平面,回归角就是赤道平面与北回归线之间的夹角。历史资料表明,随着北极星的微小移动,这个夹角逐渐缩小,大约每年缩小0.46秒(1分为60秒)。周距今大约3000年,据此推算,这段时间北极星大约移动了0.46×3000=1380秒,折算后大约为23分,这样就大体上抵消了上面计算的差异。这样,可以计算得到3000年前的回归角大约为23°49′,这样的推理是否正确呢?我们用元代郭守敬的数据作为佐证,郭守敬在全国设立27个天文观测点[^202],南起南海(西沙群岛)、北至北海(贝加尔湖)、东起高丽(朝鲜半岛)、西至西凉州(甘肃威武),通过观测得到[^203]:黄赤道内外极度、即回归角为23°33′,这个数值恰好在3000年前的结果23°49′和现在的23°26′之间。\n通过上面的分析可以断言,无论是我们的论证,还是《周礼·地官·大司徒》的记载都是正确的,因此,周人判断地中的思路是这样的:通过土圭之法所说的\"尺有五寸\"计算日射角,通过日射角加回归角\"计算得到\"登封告成的纬度,因为计算得到的纬度与实际纬度\"相差无几\",因此,通过定量分析可以认为,郑玄所说\"地中是登封告成\"的论断是正确的。那么,现在涉及到最为关键的问题:为什么影长\"尺有五寸\"的地方就是地中呢?\n基于天圆地方的认识论,中国古代称\"地方\"的四个边为东方、西方、南方、北方这四个方面,因此,如果确定了南北方位的中线和东西方位的中线,那么这两条中线的交点就是地中,《周礼·地官·大司徒》中采用的就是这样的方法确立地中,后来南北朝祖暅发明的\"五表法\"测定地中的方法[^204],实际上也借用了这样的思想。\n南北方位的中。对前面引用的《周礼·地官·大司徒》中关于地中的论述,郑玄引用郑众的话进行说明之后,进一步解释[^205]:\n景尺有五寸者,南戴日下万五千里,地与星辰四游升降于三万里之中,是以半之得地之中也。畿方千里,取象于日一寸为正。\n这句话非常不好理解,以至于东汉蔡邕说[^206]:\"以八尺之仪,度知天地之象,古有其器,而无其书。\"或许是因为,历代学者的研究兴趣,大多数都集中在分析\"地与星辰四游\"的含义、或者、讨论\"景一寸地千里\"的说法是否正确,等等。\n我想,这句话是针对南北方位、即纬度述说的,根本含义是:夏至正午立8尺之表,在周天下的最南端番禺测得日影长为0尺,在最北端测得日影长为3尺,因此如图14.1所示,日影长1.5居0和3之中,可以确认为地中,也就是文中所说\"是以半之得地之中也\"的意思。\n\n图14.1 \"天圆地方\"假设下日射角的分析\n下面,分析我们上面的理解是否正确。依然利用今天的数学知识和地理知识,分析周公那个年代的地理方位、以及判断天下之中的理由;依然通过反正切函数得到日射角,然后用日射角加上回归角得到北纬度数,计算如下:\n最南端:比值0/8=0,日射角0°;北纬度数0°+ 23°26′= 23°26′\n最北端:比值3/8=0.375,日射角20°31′;北纬度数20°31′+ 23°26′= 43°57′\n这就是周公那个年代周天下的最南端和最北端。我们借助《山海经》分析,上述计算结果与当时人们对地理的认知是否吻合。\n最南端毋庸置疑。如果沿着登封告成的子午线、即经线\n,北回归线、即北纬23°26′\n在现今的广州附近,再南就是大海。如《山海经·南山经》最后部分《南次三经》所说[^207]:\"又东五百八十里,曰南禺之山。\"其中南禺山指广东的番山、禺山,在现在广州附近的番禺县。\n最北端需要分析。查看地图,如果沿着登封告成的子午线,北纬43°57′是在阴山以北。如《山海经·北山经》的《北次二经》所说[^208]:\"又北三百里,曰敦题之山。无草木,多金玉。是錞于北海。\"这里所说的北海是指贝加尔湖,苏武牧羊的地方,如《汉书·苏武传》说:\"乃放武北海上无人处。\"但学者普遍认为《北次二经》最早是在战国以后,而《北次三经》才是西周古简,因此参照的对象应当是《北次三经》。谭其骧认为[^209]:\"总括北山三经\n......\n北至内蒙阴山以北直抵北纬四十三度迤北一线,这大概是不会错的。\"这与计算得到的43°57′吻合。由此认为,北纬四十三度迤北一线就是周天下的最北端,夏至正午\"立表日影长3尺\"。甚至可以想象,当时的周人确实进行了实地测量。\n从图14.1中还可以看到一个有趣的现象,如果大地真是是平的、并且太阳距离大地不很遥远,那么用日影长1.5确定地中是不正确的,因为根据投影原理,影长0尺到1.5尺之间的距离不可能等于影长1.5尺到3尺之间的距离。但是,如果地球是圆的、并且太阳距离地球非常遥远,那么用日影1.5尺确定地中却是可以的。如此这般地歪打正着,说明中国古代先哲们的直观能力相当强,往往不需要确切的理论和周详的计算,就能把非常复杂的问题化简,应用的恰到好处。\n东西方位的中。\"尺有五寸\"这个指标,只能确定南北方位的中,不能确定东西方位的中。对于东西方位的确定,中国古代很早就知道,可以利用日出时间差异,如《周髀算经》记载[^210]:\"日在极东,东方日中,西方夜半。日在极西,西方日中,东方夜半。\"\n中国古代确定时间,主要是利用漏壶和刻漏这两种仪器,原理是一样,用水壶泄水或者接水。商周时代已经出现这样的仪器,并且有专人负责,为《周礼·夏官》所说的\"挈壶氏\"。考古发现,古埃及以及古巴比伦人在公元前15世纪就使用了漏壶,于是汉学家李约瑟推断[^211],漏壶是阿拉伯传入中国的。李约瑟的这个说法可能有些武断,因为制作漏壶的想法和工艺都非常简单,并不需要引入。\n在那个年代,调整漏壶或刻漏水流量与时间的关系不仅参照日影的变化,还参照夜晚星辰的方位。汉代学者桓谭做过管理刻漏的官员,他在《新论·离事》中说[^212]:\"余前为郎,典刻漏,燥湿寒温辄异度,故有昏明昼夜。昼日参以晷景,暮夜参以星宿,则得其正。\"刻漏的时间单位是\"刻\",把一天分为100刻。现代生活仍然使用刻来计算时间,一刻钟15分钟,一日96刻。中国古代\"刻\"的设定一直发生变化:西汉末年规定一日为120刻[^213],南北朝规定一日96刻[^214],虽然这样的设定都比一日100刻更加合理,但不知为什么,中国古代实施这两种规定的时间都很短暂。\n无论如何,商周的人们可以用漏壶规定当地的\"标准时间\"。《周礼·地官·大司徒》说\"日东则景夕,日西则景朝\"大概就是这个意思,如《周礼注疏》的解释[^215]:\"日东则景夕多风者,据中表之东表而言,亦于昼漏半中表景得正时,东表日已跌矣\n......\"。这样,就可以用时间度量距离,比如,可以做这样的推断:同一纬度上两地标准时间之差与两地之间距离成正比。这样,在同一纬度上,C地在A、B两地中间,如果C地的\"标准时间\"等于A、B两地\"标准时间\"的平均,那么C地就必然在A、B两地的中点。\n现在,我们依然用现代数学知识和地理知识,分析周人对于地理方位的认知是否合理。我们知道,登封告成在北纬34度、东经113度。通过计算可以得到,北纬34度纬线的周长为33170公里,因此经度1度对应的距离大约为\n33170/360=92(公里),按一天100刻计算,时差1刻对应的距离大约为\n33170/100=332(公里)。\n周天下的最东方是山东半岛。周人对山东半岛了如指掌,《山海经·东山经》有四个次经,除东二次经的南端涉及苏皖以外,其余三经首尾全在山东境内。山东半岛东端大约在北纬36度,与登封告成的纬度相差不大。就经度看,山东半岛东端在东经122度,与登封告成的经度相差122-113=9(度),两地间的距离大约为\n92×9=828(公里),两地日出时间相差828/332=2.3(刻)。这个时间差大约是现在的半个小时,可以认为,当时的人们对这样的时间差是能够分辨清楚的。\n周天下的最西方是指甘肃渭源。谭其骧在评论《西山经》时说[^216]:\"(渭源)再往西已经超出作者(指《山海经》的作者)的地理知识范围。\"这也是周人的认知范围。渭源是黄河最大的支流古渭河的发源地,是黄河上游古文明的中心之一。渭源的纬度是北纬35度左右,也与登封告成大致相当。渭源的经度在104度左右,与登封告成经度相差113-104=9(度),与山东半岛东端所差完全一样。因此,把登封告成认定为东西之中完全正确。\n据此可以推断,周天下的范围大体是:南起广东番禺、北至内蒙阴山,东起山东半岛、西至甘肃渭源,登封告成恰为其中。通过上面的分析可以看到,周人借助数学的眼光认识、理解和表达中国、即天下之中,思路是合理的,方法是可行的,结果是可信的。\n话题15 地球球形的认知与经纬线\n从地球的称谓可以知道,我们生活在球面上[^217]。可是,在那个天文地理的知识都相当贫乏的年代,古代的人们是如何知道地球是球体的呢?是如何创造出经纬线表达球体上的点呢?\n地球是一个球体。与中国古代天圆地方的认识不同,古希腊人很早就认为地球是一个球体,这大概与海洋贸易有关。因为岛屿之间贸易的需要,古希腊人擅长航海,或许,通过对海上渐渐远去最后消失不见的白帆的观察与沉思,古希腊人就会自然而然地认为地球是一个球体,海洋在这个球体的表面上。公元前三世纪,古希腊学者阿基米德写出至今依然是流体静力学经典的著作《论浮体》,其中命题2明确述说[^218]:\"处于静止状态的任何流体的表面都是其中心与地球中心相同的球体表面\"。这个命题不仅述说了地球是一个球体,并且述说了静态流体表面也是一个球面。\n不能不令人吃惊的是,比阿基米德更早的古希腊学者亚里士多德,是通过月蚀认知地球是球体,亚里士多德认为月蚀是因为地球遮挡了太阳光引起的,他把月亮当作镜子,于是月蚀就是地球在镜子上的影子,他在《论天》中写到[^219]:\n在月蚀时,它的外线总是弯曲的;既然月蚀是由于地球插入(太阳与月亮)其间,那么,它外线的那种形状就应是地球的表面所造成,所以,地球必定是圆球形。此外,通过对星体的观察,不仅表明地球是圆的,而且,也表明它的体积并不大。\n中国东汉时期开始认为地球是球体,因为在那个时期浑天说逐渐替代了盖天说,也就是说,由\"天圆地方\"的认识改变为\"天地同圆\"的认识,如浑天说的代表作张衡《浑仪注》说[^220]:\n浑天如鸡子。天体圆如弹丸,地如鸡子中黄,孤居于天内,天大而地小。天表里有水,天之包地,犹壳之裹黄。天地各乘气而立,载水而浮。周天三百六十五度又四分度之一,又中分之,则半一百八十二度八分度之五覆地上,半绕地下,故二十八宿半见半隐。其两端谓之南北极。北极乃天之中也,在正北,出地上三十六度。然则北极上规径七十二度,常见不隐。南极天地之中也,在正南,入地三十六度。南规七十二度常伏不见。两极相去一百八十二度强半。天转如车毂之运也,周旋无端,其形浑浑,故曰浑天。\n可见,与盖天说不同,浑天说认为天不是一个半球,而是一个圆球,地球在其中,就如鸡蛋黄在鸡蛋内部一样。浑天说并不认为\"天球\"就是宇宙的界限、而认为\"天球\"之外还有别的世界,即张衡所说的:\"过此而往者,未之或知也。未之或知者,宇宙之谓也。宇之表无极,宙之端无穷。\"\n\"浑天\"这个词最初见于西汉末扬雄的《法言·重黎》,其说:\"或问浑天。曰:落下闳营之,鲜于妄人度之,耿中丞象之。\"这里所说的\"浑天\"是指浑天仪,因为借助浑天仪可以得到更精确的观测,依据这样的观测可以制定更加精确的历法,于是浑天说就逐渐替代了盖天说,人们开始相信地球是球形的。到了唐代,天文学家一行等人通过天地测试彻底否定了盖天说。因为扬雄是与《天问》对照说出上面那段话,于是有些学者认为,可以把浑天说溯源到战国时期的屈原,因为《天问》说:\"圜则九重,孰营度之?\"中的\"圜\"就是天球的意思。\n地球赤道周长与经纬线。古希腊学者埃拉托色尼第一个计算了地球的赤道周长,埃拉托色尼曾任亚历山大城图书馆的馆长。\n亚历山大城位于尼罗河三角洲西侧,伸入地中海与法鲁斯岛相连,是现在埃及第二大城市。亚历山大城以航海灯塔闻名,高122米的灯塔是世界七大奇迹之一,建在法鲁斯岛上。但更具有传奇色彩的应当是建于公元前295年、毁于公元391年的亚历山大城图书馆[^221]。\n这所图书馆开了图书编目之先河,为了便于对收集到的书籍进行管理,这所图书馆开始对书籍进行编目,也正因为如此,西方的古典著作才开始有了书名[^222]。在近七百年的历程中,这所图书馆创立了许多影响至今的文化:收集了大量的珍贵文献,比如,《荷马史诗》、古希腊的三大悲剧的手稿、希伯来文及翻译成希腊文的《旧约全书》、欧几里得《几何原本》等等,各类纸莎草书多达50多万卷。这所图书馆也会聚了大批优秀学者,他们在这里做出了杰出的工作,比如,希罗菲鲁斯创造了人体解剖的方法、欧几里得创立了几何学、阿里斯托芬开创了词汇学、阿波罗尼奥斯研究了圆锥曲线、阿基米德提出了杠杆原理和浮力定律、梅内劳斯写出球面研究的第一部著作、托勒密写出巨著《天文学大全》。当然还有埃拉托色尼。\n埃拉托色尼于公元前234年任亚历山大图书馆的馆长,是这个图书馆第一位研究自然科学的馆长。埃拉托色尼开地理学之先河,被西方誉为地理学之父。有一天他在一本书中读到,每逢夏至的正午,位处尼罗河第一瀑布的塞伊尼(现在的阿斯旺)竖立起的木棒不会出现影子,太阳光能够直射到井里的水面上。夏至这一天,他在亚历山大也竖立起了木棒,却出现了大约7度的影子,于是埃拉托色尼设想,因为太阳距离地球非常遥远,太阳光应当平行地照在地球上,又因为地球是圆的,所以对于竖立在地球上的木棒,有的地方有影子、有的地方没有影子,如图所示。\n塞伊尼\n7^0^\n塞伊尼与亚历山大城的日影\n根据平行线内错角相等的原理,塞伊尼和亚历山大分别垂直向下,在地球地心处的夹角、即圆心角也应当是7度左右,除以圆周角可以得到\n7/360≈1/50,因此可以推算,地球赤道的周长大约为塞伊尼与亚历山大之间距离的50倍左右。于是埃拉托色尼派人测量了这两地之间的距离,大约为5000希腊里,大约折合现在的800公里,这样,埃拉托色尼就得到了地球的周长约为\n800×50 =\n40000(公里)。这个结论相当准确,因为现代测量表明,地球的赤道周长大约为40075公里。\n西方普遍认为,是亚里士多德第一个发明了确定地球上点位置的办法。亚里士多德发现越接近赤道越热、越靠近北极越冷,于是他构想把圆形的大地划分五个平行的气候带:广阔的赤道地区是热带,两个寒冷的极地是寒带,在热带和寒带之间是温带,并称这样划分的线为纬线[^223]。后来,古希腊学者托勒密在八卷本的《地理学》中提出,绘制地图不仅需要纬度也需要经度,为了把地球的位置平面化,他设计了扇形的经纬线,并绘制出著名的\"托勒密地图\",虽然这个地图始终没有被应用,但托勒密依然被西方称为地图学之父[^224]。\n在中国古代,用经线和纬线表示位置的方法至少可以上溯到周代,因为《周礼注疏》中说[^225]:\"以天下地理之图,周知九州之地域广轮之数\",对其中的\"广轮之数\"注为:马融云\"东西为广,南北为轮\"。后来,西汉学者戴德选编的《大戴礼记·易本命》中记载[^226]:\"凡地东西为纬,南北为经\",对这句话的注释提到马融注《周礼》所说。这就说明,在汉代称为经和纬的概念在周代就已经有了,就是周代所说的广和轮。\n到了晋代,用经纬表示地图的方法已经成熟,集中表现在裴秀的工作中。裴秀是一位学者,也是一位官员。公元267年,晋武帝任命裴秀为司空,大概相当于现在的副总理,裴秀在地图学方面的成就与他担当的这个职务有关。裴秀主持编绘的《禹贡地域图》共18篇,这是以疆域政区为主的历史地图集,是我国有案可查的第一部历史地图集。在为此图撰写的序中,裴秀提出制图的六条原则,记载在《晋书》卷三十五中[^227]。后来,这六条原则成为中国地图史学中的著名\"制图六体\"理论,其中论及到比例尺,也论及到用经纬(文中用的依然是广轮)构建的矩形网格坐标。由于裴秀对中国地图绘制的重要影响,李约瑟称他为[^228]:中国科学制图学之父。\n{width=\"2.959722222222222in\"\n裴秀\"制图六体\"示意图\n上图就是根据裴秀理论构想出来的宏观经纬坐标[^229]。可以看到,由于古代的人们对南极没有明确的概念,所以只能画出一个所有经线朝向北极的扇形地图。托勒密设计的扇形经纬线,大概也是如此。\n话题16 平行线公理与三种类型的几何\n初中数学开始渗透公理化的思想,如问题3所讨论的那样,教师要引导学生经历依据基本事实的论证过程,感悟数学的逻辑、体会数学的严谨性。对于初中阶段所要学习的欧几里得几何,平行线公理是最重要的基本事实,所有教材的表述是一致的:\n过已知直线外一点,存在且仅存在作一条直线与已知直线平行。\n也如问题3所说,这个公理是十六世纪,英国地质学家、数学家普莱费尔给出的,是对欧几里得几何第五公设的修改。后来,数学家发现,如果不改变欧几里得几何的其他公理和公设,只是修改这个公设,还可以得到其他不同类型的几何。比如,基于\n过已知直线外一点,可以作两条以上直线与已知直线平行。\n这样的修改,可以得到罗巴切夫斯基几何;基于\n过已知直线外一点,不存在直线与已知直线平行。\n这样的修改,可以得到黎曼几何。\n这样,基于三种形式的平行线公理,可以得到三种类型的几何。后来数学家终于明白,所谓的公理并不是不证自明的事实,更恰当的称谓应当是假设,所谓的公理体系是在不同假设的论证系统,或者称其为数学结构。虽然我们曾经讨论过罗巴切夫斯基几何和黎曼几何,但是,基于平行线公理对于初中数学的重要性,在这个话题,我们仍然进行总结性的讨论。\n我们将从两个方面讨论在三种假设下三种几何的差异:一个方面针对数学结论,是说,在不同的假设下会得到什么样的数学结论;另一个方面针对现实,是说,这三种类型几何分别描述了什么样的现实表达。希望这个话题的讨论,能够引发初中数学教师的思考,能够更好地理解和把握几何学的本质,认知数学公理化体系的本质,把这样的理解和把握落实于几何教学的过程中。\n不同的数学结论。欧几里得平面几何的所有命题都与平面的性质有关,如果改变了面的几何构造,那么欧几里得平面几何的许多命题都可能需要进行修正,比如,下面六个等价命题就是如此,这六个等价命题的欧几里得几何表达是:\n过直线外一点有且仅有一条平行线。\n直线段长度可以由勾股定理计算。\n三角形内角和为180度。\n任意多边形的外角和为360度。\n圆的周长为半径的2π倍。\n同弧上圆心角为圆周角的二倍。\n第一个命题是关于平行线公理的,这个公理的改变是引发平面几何体系改变的导火索,如前所述,三种公理(假设)可以导致三种几何;第二个命题涉及几何构造的本质,如何确定距离是刻画空间的关键;第三个命题是平面几何构造改变的直接结果,如同下面所讨论的那样,这个命题引发了数学家的深入研究;第四个命题是第三个命题的直接推论;第五个命题涉及圆的周长与直径长度的比,如同下面所讨论的那样,这个问题是本质的;第六个命题是第五个命题的直接推论。\n{width=\"1.9993055555555554in\"\n图16.1 黎曼几何:高斯曲率为正的曲面\n{width=\"2.2618055555555556in\"\n图16.2 罗巴切夫斯基几何:高斯曲率为负的曲面\n三角形内角和。三角形的内角和为180度似乎是一个常识,但这个命题与承载三角形的面的几何构造息息相关。如果承载三角形的面是曲面,分别如图16.1和图16.2所示的黎曼几何曲面和罗巴切夫斯基几何曲面,那么三角形的内角和就会分别大于和小于180度。\n高斯发现一个非常重要的事实,在曲面上,三角形内角和的大小不仅与这个曲面的弯曲程度有关,还与三角形在曲面上的面积有关。高斯用微分的方法给出了刻画曲面弯曲程度的度量方法,人们称为高斯曲率[^230]。基于这样的度量方法,高斯在1827年的论文中给出了计算三角形内角和的统一公式\n三角形内角和 =\n,\n其中 k(a) 表示高斯曲率,A表示曲面上三角形所围成的区域。\n如果高斯曲率等于0,那么就得到欧几里得几何的结果,三角形内角和为180度;如果高斯曲率为正,如图16.1所示,那么上述积分为正,三角形内角和大于180度;如果高斯曲率为负,如图16.2所示,那么上述积分为负,三角形内角和小于180度。后来人们称这样的、借助微分的几何研究为微分几何。1844年,法国数学家博内把上述高斯公式推广到一般闭曲线围成的单连通区域,法国数学家韦依于1942年、美籍华人数学家陈省身于1944年,进一步把这个工作推广到高维闭黎曼流形。\n圆的周长与直径的比。通过上面的讨论可以启发我们想象,圆的性质必然与承载圆的面的几何结构有关,我们借助球面分析这个问题。\n图16.3 平面上圆周长与球面上圆周长\n如图16.3所示,以球面上的一个点O为圆心,在球面上画一个圆[^231],用Q表示这个圆。在球面上,过点O做一条直线,与圆Q相交于A和B两点,是为球面上圆Q的直径,这就是以点A和B为端点的过点O的大圆的劣弧;定义半径为劣弧长度的一半,用R表示。此外,在圆Q所在平面上连接A和B两点,是为平面上圆Q的直径;定义半径为直径的一半,用r表示。用c表示平面上圆Q的周长,根据平面几何的知识\nc = 2πr。\n因为R > r,因此有 2πR > 2πr\n=c,这就说明,在球面上前面所说的第五个命题不成立。\n不同的现实表达。我们上一个话题已经知道,至少在地球的范围内,欧几里得几何还是适用的。下面,分析罗巴切夫斯基几何与黎曼几何所表达的现实。\n北极出地与罗巴切夫斯基几何。我们在话题15述说,东汉天文学家张衡发明浑仪、提出浑天说,但浑仪比较复杂,元代天文学家、数学家郭守敬经过慎密地研究,去掉了浑仪上黄道圈、子午圈等不必要的部件,加强了赤道的精度,人们称这样的浑仪为简仪。简仪是纯赤道式天象观察仪,其构造与现今天文望远镜使用的赤道装置是一样的,这样,虽然郭守敬没有发明天文望远镜,却被誉为是现代天文望远镜赤道装置的创始人[^232]。\n郭守敬非常清楚,为了精准确定赤道平面,就必须进行多点观测,不仅观测点要多,观测的范围也是越广越好。于是他给忽必烈奏折,陈述说[^233]:\n唐一行开元间令南宫说天下测景,书中见者凡十三处。今疆宇比唐尤大,若不远方测验,日月交食分数时刻不同,昼夜长短不同,日月星辰去天高下不同,即目测验人少,可先南北立表,取直测景。\n这里所说的\"一行\"是指唐代天文学家张遂。郭守敬的意思是说,唐代张遂在开元年间(724年)曾经进行过大规模的天文观测,设立了十三个观测点,当今疆域更大了,应当设立更多的观测点。忽必烈接受了郭守敬的建议,下令在全国建立了二十七个观测点[^234],这些观测点南起南海(西沙群岛)、北至北海(贝加尔湖),东起高丽(朝鲜半岛)、西至西凉州(甘肃威武)。\n这次大规模观测最重要的成果之一,就是测定了各个观测点的\"北极出地\"。北极出地是古代中国天文学的一个重要概念,是指北极星与地面的高度所形成的角度,即观测者所处地平线与观测者和北极星连线所形成夹角的角度。不可思议的是,北极出地与现在所说的北纬完全吻合。2008年左右,我曾经苦思冥想其中的道理,直到有一次在厦门开会的早晨,突然想到,是不是要用到罗巴切夫斯基几何进行论证,于是马上起来验证,问题迎刃而解。我同时意识到,中国古代先民凭借直觉,非常清晰地认识并且使用了罗巴切夫斯基几何。下面,我们来分析这个问题。\n图16.4 北极出地与纬度之间的关系\n如图16.4所示,用O表示地心、N表示北极星,赤道平面是以连线NO为法向量经过O的平面。北半球的观测点A的北纬度数,就是AO连线与赤道平面的夹角a。如果过点A做地球的切平面,那么点A的北极出地是连线NA与切平面的夹角a′。下面说明,北极出地恰好等于北纬度数。\n北极星距离地球400光年,也就是说,光以每秒行走30万公里的速度需要行走400年,而地球半径只有6千多公里,因此可以认为,北极星的距离相对于地球半径就是无穷远点,这正对应于直角的正切值,因此可以认为,NA与NO平行。如图所示,因为\na + b = 90° = a′ + b,所以a = a′,也就是说,北极出地与北纬度数相等。\n人们称这种认识现实世界的几何为罗巴切夫斯基几何,基本特征是,过直线外一点可以作无数多条平行线,比如,如上所述,从北极星出发,可以作无数多条到达地球的平行线。\n北极出地的概念应当与浑天说有关,可能出现在汉代,这要比罗巴切夫斯基几何的发明早许多。由此可以看到,与赤道平面的构想一样,中国古代先民往往不追求严格的论证,仅凭直觉就能把许多非常重要的结果应用得恰到好处,不能不令人叹为观止;同时,他们对结果合理性的判断凭借的是经验和想象,可以省略许多不必要的繁琐。但我们也应当看到,这样的认识问题的方法,无法构建知识之间的关联、也无法形成系统的理论,不仅利于进行深入研究、也不利于知识的继承与传播。\n飞行路线与黎曼几何。考虑球面上的两点间距离,比如,考虑北京与纽约之间的距离。北京大约位于北纬40度东经116度,纽约大约位于北纬40度西经74度,因为纬度基本相同,因此从北京沿着北纬40度线一直向东行可以到达纽约,这个行程大约为14411公里。但是,这个行程不是北京与纽约之间的最短行程,北京与纽约间的飞机航线不是沿着这个行程。\n球面上的最短距离要基于黎曼几何进行度量。根据黎曼几何,过球面上两点的直线是大圆,大圆的劣弧是两点间最短距离。可以这样思考,对于球面上的任意两点,都能像切西瓜那样,过这两个点把球切开,切出的轨迹是一个圆,于是可以得到两条连接两点的弧线,称较短的那条弧线为劣弧。因为切的角度不同得到的圆的周长也不同,得到劣弧的长度也不同。可以想象并且验证,经过球心的那个圆的周长最长,称这样的圆周为过两点的大圆,大圆的劣弧是球面上连接这两点的最短段,因此,黎曼几何定义大圆劣弧的长度为两点间距离。比如,北京与纽约大圆劣弧距离大约为11005公里,比沿纬度的行程大约缩短3306公里,飞机的航线沿大圆劣弧设计,需要经过北冰洋的上空。\n人们称这种认识现实世界的几何为黎曼几何,基本特征是,所有的直线、即大圆都相交因此没有平行线,比如,地球上所有的经线都要相交于两极。\n话题17 直角坐标系的提出\n在一些述说数学文化的小册子中,可以看到各种版本的笛卡尔发明直角坐标系的故事,有的说笛卡尔受到房屋顶棚角落蜘蛛网的启发,还有的说笛卡尔为了确定房间里苍蝇的位置,总是让人觉得杜撰的成分太浓。但最近评审义务教育数学教材也看到了类似表述,于是想借此机会,讨论一下笛卡尔发明直角坐标系的过程及其所想。无论如何,笛卡尔发明直角坐标系不是一蹴而就,这与他的哲学思想、以及他对数学的理解紧密相关,我们先讨论这两个问题。\n哲学思想与数学理解。笛卡尔在数学上做出了杰出的贡献,因为笛卡尔创立的解析几何引入了变量的思想,这样的思想最终成为牛顿和莱布尼茨发明微积分的思想的和数学的基础。但是,笛卡尔更为重要的贡献却是在哲学方面。\n文艺复兴发端于地中海沿岸的意大利,逐渐扩展到整个欧洲。人们重新认识古希腊文明,重新认识古希腊艺术所彰显的人文精神,在中世纪的宗教社会中恢复了人的地位和尊严。于是,人的主动性得到空前的发挥,新的思想、新的科学、新的技术如雨后春笋。\n论及文艺复兴时代产生的新思想,必然要涉及到两位杰出的哲学家,一位是英国哲学家培根,一位就是解析几何的创始人、法国哲学家笛卡尔。这两位学者倡导理性的精神和实证的方法,无论是对自然科学、还是对人文科学都产生了积极而深远的影响。\n培根探求科学研究的新方法,在无情批判传统的亚里士多德三段论的基础上,开创了系统的归纳逻辑的思维方法,他认为这样的方法可以用于发现真理,于是把自己的著作骄傲地命名为《新工具》。培根的名言是\"知识就是力量\",这是现代科学发出的第一声呐喊。笛卡尔的名言是\"我思故我在\",这是对人的理智的呼唤,给哲学也给数学带来了思维的和理性的尊严。笛卡尔也寻求建立真理的方法,强调直觉和演绎;笛卡尔信赖数学,他认为科学的本质就是数学,并且身体力行地研究了数学。笛卡尔的思想深刻地影响了17世纪的欧洲,影响到了牛顿和莱布尼茨。\n1637年,笛卡尔发表了名著《科学中正确运用理性和追求真理的方法论》,人们通常简称这部著作为《方法论》。在这部著作中,笛卡尔说出了他对于数学的看法,阐述了一个大胆的、对后世产生了重大影响的思想[^235]:\n我发现在逻辑方面,三段论式和大部分其他法则只能用来向别人说明已知的东西,......,并不能求知未知的东西。......\n至于古代人的几何和近代人的代数,都是只研究非常抽象、看来毫无用处的题材,此外,前者始终局限于考察图形,因而只有把想像力累得疲于奔命才能运用理解力;后者一味拿规则和数字来摆布人,弄得我们只觉得纷乱晦涩、头昏脑胀,得不到什么培养心灵的学问。就是因为这个缘故,我才想到要寻找另外一种方法,包含这三种学问的长处,而没有他们的短处。\n笛卡尔在《方法论》的附录《几何学》中实践了上述想法,他所要寻找的另外一种方法就是现在人们所说的解析几何。在笛卡尔工作的基础上、后代数学家发展了解析几何的研究方法,把传统欧几里得几何学(包括基于三段论的演绎推理)与代数学有机地结合起来了。解析几何的出现,使得变量得到了直观的理解和刻画,促进数学得到了根本性发展,正如恩格斯所说的那样[^236]:\n数学中的转折点是笛卡儿的变量,有了它,运动进入了数学,因而,辩证法进入了数学,因而微分和积分的运算也就立刻成为必要的了,它们也就立刻产生了。\n《方法论》的附录《几何学》共分三章。第一章的题目为\"仅使用直线和圆的作图问题\",讨论如何利用尺规作图把算术问题转为几何问题;第二章的题目为\"曲线的性质\",在这一章,笛卡尔批评了传统的尺规作图方法,认为研究复杂曲线应当引入度量,于是发明了坐标系和解析几何;第三章的题目为\"立体及超立体问题的作图\",讨论高次方程的根与几何作图的关系。\n今天,\"尺规作图\"仍然是初中几何的重要内容,但是,很少有人把尺规作图与代数方程的根联系起来,这就是笛卡尔的重大突破。下面,分析笛卡尔的解析几何与欧几里得几何的差别,感知笛卡尔发明解析几何的思维起点。问题是求二次方程的根,考虑下面的三个二次方程[^237]\n,,。\n笛卡尔分别讨论了这三个方程,分析如何通过尺规作图的方法给出方程的解,现在,我们只分析第一个二次方程。通过变形,得到第一个二次方程的等价形式\n,\n进一步可以得到\n。\n这样,借助勾股定理,可以尺规作图得到根号下所要求的线段的长度,进而得到线段的四则运算得到y所对应的线段。用类似的方法,可以得到其他两个二次方程的根所对应的线段。然后,笛卡尔又把问题推广到四次方程\n\n的形式,证明利用二次方程的结果,可以尺规作图得到\n\n所对应的线段。\n可以感知,传统的尺规作图只是为了得到基于线段长度的、也就是基于自然数四则运算的结果;而笛卡尔有意识地把几何作图与一般形式的代数方程结合,用线段长度解释和表达方程的解。特别需要说明的是,通过表达形式可以看到,笛卡尔的心灵、也就是他所说的直观,确实闪耀着理性的光芒,因为他已经利用几何与代数结合的方法,述说了现代数学\"数域扩张\"思想的雏形[^238]。\n直角坐标系的发明。但是,真正引发笛卡尔思考并且创立直角坐标系的缘由,是帕波斯问题,也就是\"3条或4条直线的轨迹\"问题。古希腊学者阿波罗尼奥斯在他著作《圆锥曲线论》第三卷的后半部分,专门讨论了这个问题,他把问题表述为:\n在平面上给定三条直线,令一动点到其中一条直线距离的平方、与到另外两条直线距离的积成正比,求这个动点的轨迹。\n如果给定四条直线,那么就把结论从\"到一条直线距离的平方\"改为\"到两条直线距离的乘积\"。阿波罗尼奥斯用几何的方法研究了这个问题,证明了这个动点的轨迹是圆锥曲线,他为自己能得到这个结论非常骄傲,在著作《圆锥曲线论》的序言中写道:\n第三卷包含许多 ......\n令人不可思议的和最完美的定理,其中绝大部分都是新的,而且当我们掌握这些时便知道,欧几里得未曾作出的三线和四线轨迹,只有它的偶然的部分才被不很愉快地解出,因为没有我们所发现的事实它们就不可能被圆满解出。\n几百年以后,亚历山大图书馆晚期学者帕波斯把这个问题推广到四条以上直线和任意给定角,后来人们称这样的问题为帕波斯问题。笛卡尔对帕波斯问题很感兴趣,在解决这个问题的过程中他萌发了建立坐标系的构想。\n{width=\"3.435416666666667in\"\n四条直线的帕波斯问题\n借助上面的图形,我们用现代语言把帕波斯问题描述如下[^239]:\n帕波斯问题。如图所示,有四条给定的直线AB,AD,EF和GH,求点C描出的轨迹,使得过点C的四条线段CB,CD,CF和CH与给定直线成给定角时,CB和CF的积等于CD和CH的积。\n由条件知道,点C的轨迹中有两个变量,如果称A和B之间的线段长度为x,B和C之间的线段长度为y,那么,利用条件建立x和y之间的关系就得到了一个曲线方程,这是一个椭圆曲线。为了把问题论述的更加清晰,笛卡尔建立了坐标系,借助坐标系得到曲线方程。虽然最初建立的坐标系,两个轴不是相互垂直的,但在《几何学》第二编后来的论述中,建立的大多数都是直角坐标系。\n欧几里得几何研究的是静态的图形,而笛卡尔创建几何的初衷,就是要用代数的方法表达动点的轨迹,可以看到,要实现代数方法与几何图形的有机结合,借助坐标系是明智之举。从这个意义上看,伴随数学发展的需要,数学家发明坐标系应当是一种必然。\n话题18 极坐标与球坐标\n通过平面直角坐标系可以知道,要在平面上表达一个点的位置和运动轨迹,需要用二个元素的数组表示点的位置、用两个变量表示这个点的运动轨迹,这也是人们把平面称为二维空间的缘由。以此类比,如果用三个元素的数组表示点的位置、用三个变量表示这个点的运动轨迹,这也是人们把空间称为三维空间的缘由。\nO\nA\nθ\n用极坐标表示点的位置\n在平面上,除了直角坐标系以外,如图所示,还可以利用一条射线构建坐标系。对于平面上的一个点A,连接这个点到射线端点得到线段OA,那么就可以用线段长度、即两点间距离\nρ=|OA|和线段OA与射线夹角 θ\n表示这个点的位置,这是二个元素的数组,称这样的表达方式为极坐标。在许多情况下,用极坐标刻画动点的运动轨迹是方便的。\n古代的极坐标:距离与方位。因为极坐标是利用距离与方位表达点的位置,对于日常生活而言,这是一种看得见、摸得着的方法,因此,极坐标是比直角坐标系更加自然、更为实用的方法。\n几乎所有古老民族都以北极星确定方位,如话题14所述,中国古代以北极星为北方,构建了四面八方的概念,四面是指东、南、西、北,八方是在四面上再加东北、东南、西南、西北,提出八个判断方位的参照系,构建角度的依据是观察北极星所形成的射线。\n然后要确定射线的原点,人们通常以政治中心或文化中心为原点,比如,话题14所示,中国古代称这样的原点为\"地中\"即\"天下之中\",其中的天下是指周天下,现在人们广泛使用的\"中国\"\"中原\"\"中华\"等称谓都与此有关。再比如,西方几乎所有民族的语言中都有\"条条道路通罗马\"这样的熟语,就是以罗马作为射线的原点,这与当年罗马帝国的极度扩张有关。确定了原点之后,就可以度量所在地与原点之间的距离,然后在原点的立场、借助北极星判断所在地的方位,用距离和方位表达所在地的位置,这就是远古时代人们使用的极坐标。可以看到,这样的极坐标设定的根据依然是罗巴切夫斯基几何,是说,北半球任何处观察北极星得到的射线都是平行的。\n极坐标与直角坐标系。对于数学,是牛顿第一个使用极坐标表达平面上点的位置,出现在牛顿的著作《流数法与无穷级数》之中,这部著作大约成书于1671年,出版于1736年。因为1691年伯努利在《教师学报》上发表了与极坐标有关的论文,人们通常认为是伯努利发明了极坐标。1729年,法国数学家赫尔曼进一步完善了极坐标,给出了[直角坐标](http://baike.sogou.com/lemma/ShowInnerLink.htm?lemmaId=68827653)与极坐标的变换公式。现在人们普遍使用的极坐标表达形式是欧拉在1748年出版的著作《无穷分析引论》中确立的。\n对于现代数学,如果要建立极坐标,那么就必须讨论极坐标与直角坐标系之间的关系,因为直角坐标系更为司空见惯。对于平面上设定的直角坐标系,让极坐标射线的原点与直角坐标系原点重合,方向与x轴的正方向重合。对于给定的点A,连接原点得到线段OA。如果点A的坐标为A(x,y),对应的极坐标是\n(ρ,θ),其中 ρ 为线段长,θ\n为线段与x轴的夹角,那么,可以用直角坐标系的坐标表示极坐标的坐标,表示形式为\n,;\n反之,也可以用极坐标的坐标表示直角坐标系的坐标,表示形式为\n,。\n下面,我们讨论用极坐标表示的几种常见曲线。\n用极坐标表示直线和圆。在直角坐标系中,如果一条直线经过原点,那么,连接原点O和直线上任意点\nA(x,y)\n的直线方程可以表示为y=ax,其中a为斜率。可以得到这条直线的极坐标表达\n,\n因为直线经过原点,只需要知道斜率,简洁明快。但是,如果直线不经过原点,那么用极坐标表达就比较困难了,有兴趣的读者可以自己尝试写出这样的表达。\n用极坐标表达与光滑的弧线有关的曲线非常便捷,比如,用极坐标表达圆的方程。一个圆心在直角坐标系原点的圆,如果半径为r,那么极坐标方程为\n,\n其中 ρ 表示圆上的点。\n与圆的表达有所关联,伯努利曾经用极坐标表达直角坐标系中的双纽线方程,如图所示,直角坐标系的表达与极坐标的表达分别为\n,。\n{width=\"3.5215277777777776in\"\n双纽线示意图\n球坐标与高维直角坐标系。可以用类比的方法,把二维直角坐标系拓展到三维直角坐标系。用交于一点O的三条相互垂直的直线构成的,类比数轴和二维直角坐标系,对每条直线标上方向和相同的长度单位,分别称为X轴、Y轴、Z轴。这样,空间中的任何一个点,可以用三个元素的数组(x,y,z)表示,称为三维直角坐标系,称点O为直角坐标系的原点。因为两条相交的直线确定一个平面,因此作为坐标的三条直线可以构成三个平面,分别称为XOY平面、XOZ平面、YOZ平面。然后数学家完全凭借想象,把这样的方法拓展到更一般的n维空间直角坐标系,其中一个点对应数组(x~1~,...,x~n~),称这样表达的空间为n维空间。\n可以看到,在构建几何空间的过程中,数学经历了两次抽象,第一次是基于现实的,得到了一维、二维和三维空间;第二次抽象是基于思辨的,得到非现实的n维空间。对于数的概念的形成也是如此,数学经历了两次抽象,第一是基于现实的,从数量中抽象出数,通过四则运算拓展到有理数、通过解方程得到无理数和复数、通过极限运算拓展到更一般的、具有连续性的实数和复空间;第二次抽象是基于思辨的,得到非现实的四元数、向量和矩阵。相应的运算也得到进一步的抽象。\n同样的方法,可以把二维极坐标拓展到三维球坐标。对于空间中直角坐标为(x,y,z)的点P,对应的极坐标有序数组为(ρ,θ,φ),其中\nρ\n为点P到原点O的距离,θ为有向线段OP与Z轴正向夹角。令OM为OP在XOY平面上的投影,φ为XOY平面上有向线段OM与x轴的夹角。借助三角函数的,极坐标到直角坐标系的变换可以表达为:\n,\n,\n。\n这样,固定其中一个参数时,可以得到不同的曲面:当\nρ为常数时,表示原点为球心的[球面](http://baike.so.com/doc/5911390-6124298.html);当\nθ\n为常数时,表示原点为顶点、z轴为中心轴的[圆锥](http://baike.so.com/doc/5409225-5647236.html)面;φ\n为常数时,表示过z轴的[平面](http://baike.so.com/doc/8986438-9315075.html)。类比极坐标和三维球坐标,人们又创建了更为一般的n维空间的球坐标,对于n维直角坐标系,这两个坐标之间的变换可以表示为:\n,\n......\n。\n这样,可以把n维直角坐标系表示的圆心在原点的n维球面\n\n用高维球坐标表示为\n\n的形式,其中 ρ\n表示球面上的点到原点的距离,夹角是任意的。可以看到,用类比的方法拓展坐标系的表达,无论是直角坐标系、还是极坐标系,都是非常自然、非常合理。\n话题19 欧几里得全等公理的局限性\n我们曾经讨论欧几里得几何公理体系的局限性,其中包括在问题1讨论的几何概念、即几何学研究对象的确立,也包括问题3简单分析了的第四、五公理表达的不严谨,还包括话题16讨论的平行线公理、即第五公设。在这个话题,我们将认真分析关于全等的第四个公理,并且讨论希尔伯特是如何修改的,或许,这样的讨论有助于初中数学教师更好地把握初中平面几何的本质。欧几里得《原本》的第四公理是这样表述的:\n4.彼此能重合的物体是全等的。\n现在问题的关键是,很难说清楚什么是重合。按照通常的理解,物体的重合必然会涉及到物体的运动,但是,欧几里得几何公理体系没有涉及物体的运动。即便如此,我们也可以想象,欧几里得在建立这个公理时,头脑中思考的一定是不改变物体形状的运动,也就是说,一定不是把盆里的水倒到碗里那样的运动,而是把一块石头从这里移动到那里的运动,也就是今天人们所说的刚体运动。\n如前所示,自从欧几里得几何诞生以后的两千多年的时间里,数学家们逐渐发现了许多问题,并且不间断地进行修正,最终的集大成者是德国数学家希尔伯特,希尔伯特构建了崭新的几何体系,并且努力体现公理体系基本特征,这就是独立性、相容性和完备性。希尔伯特所构建的几何公理体系,彻底摆脱了几何直观和物理属性的约束,实现了公理体系的的第二次抽象。\n与高斯一样,希尔伯特也是哥廷根大学的教授,比高斯整整晚100年。这个期间,在哥廷根工作的数学家包括雅可比、狄利克雷、黎曼,还包括希尔伯特同时代的克莱因和闵可夫斯基,从这样的现今大学数学系学生仍然是耳熟能详的数学家群体,人们可以体会到,哥廷根大学数学传统的深远。\n希尔伯特于1899年出版了著作《几何基础》的第一版,原本是1889年-1899年给学生授课的讲义,后来接受克莱因的建议,1899年以纪念高斯文集的形式出版。后来经多次修改,每一新版都更加清晰和完全,最后---版是1930年的第七版[^240]。可以看到,希尔伯特所构建的公理体系要比欧几里得公理体系庞杂得多,或许,这是为了修补两千多年来人们研究欧几里得公理体系的过程中所发现的所有漏洞,最终形成一个完备的逻辑体系。\n回顾问题1的讨论,希尔伯特用符号表达了点、直线、平面这些几何学最为基本的研究对象,然后,就用公理述说了这些研究对象的性质、以及这些研究对象之间的关系。正因为如此,《几何基础》这部著作共分七章,第一章题目就是\"五组公理\"。\n第一组公理为关联公理,述说了两点决定一条直线,三点决定一个平面的几何特性,并蕴含了点在直线上、直线在平面上的隶属关系。第二组公理为顺序公理,规定点在直线上的位置关系,比如,如果一条直线上三个不同的点,那么有且仅有一个点在其他两个点之间,顺序关系是数学研究对象之间最基本的关系[^241]。第三组公理为合同公理,是与欧几里得图形全等有关的一些公理,我们将会在下面详细讨论。第四组公理为平行公理,正如话题16讨论的那样,这组公理述说了欧几里得平面几何的本质。第五组为连续公理,引进了无穷集合的概念。下面,我们讨论与全等有关的公理、即五组公理中的第三组公理,表述如下。\n第三组公理:合同公理\n1.\n设A和B是一条直线a上的两个点,C是这条直线或另一条直线b上的一个点,而且给定了直线b上点C的一侧,则在直线\nb上点C\n的这一侧,恒有一个点D,使得线段AB与线段CD合同或者相等,用记号表示为:AB\n= CD。\n2. 若两条线段都与第三条线段合同,则它们彼此也合同.\n3. 设线段AB和BC在同一条直线 a上,线段DE和EF在同一条直线b上。如果 AB =\nDE且BC = EF,则AC = DF。\n4. 设给定了一个平面 α上的一个角 ∠(h,k),一个平面\nβ上的一条直线b,以及平面β上b 的一侧。设g是平面\nβ上的从点O起始的一条射线,则平面β上恰有一条从点O起始的射线s,使两个角\n∠(h,k) 与 ∠(g,s) 合同或相等,而且使 ∠(g,s) 的内部在平面\nβ上给定的一侧,用记号表示为:∠(h,k) = ∠(g,s)。每一个角与它自己合同。\n5. 若两个三角形ABC和 DEF满足下列合同式:AB = DE,AC = DF,∠BAC =\n∠EDF,则也有合同式 ∠ABC = ∠DEF。\n五个公理中,第1个公理是说相等的线段存在[^242],相等的线段可能是在同一条直线上,也可能是在另一条直线上;第2个公理述说的是欧几里得几何的第1个公理,即等量的等量相等;第3个公理是说线段的可加性,可以体会希尔伯特构思的巧妙;第4个公理是关于角度的相等;第5个公理是线段、角度相等关系的复合。\n可以看到,《义务教育数学课程标准(2011年版)》和《义务教育数学课程标准(2011年版)》把\"边角边\"作为基本事实,本质上是采用了希尔伯特《几何基础》合同公理中的第5个公理。这样表述,即克服了欧几里得几何图形全等表述的局限,也不用涉及图形运动等更为复杂的概念。\n话题20 公理体系的合理性\n初中阶段的数学教育,是感悟公理体系的开始,也是基于公理体系进行逻辑推理的发端,因此作为一名初中数学教师,很好理解公理体系是必要的。我们已经简要讨论了算术公理体系体系、欧几里得几何公理体系和希尔伯特几何公理体系,这些公理体系提供了数学研究的出发点,可是,应当如何判断公理体系的合理性呢?\n希尔伯特《几何基础》这部著作的第二章,讨论了他所构建的公理体系的合理性,这也是这部著作的重点。最初,希尔伯特认为,如果这个公理体系是相容的并且公理相互之间是独立的,那么,这个公理体系就是合理的,因此第二章设定的题目是:公理的相容性和互相独立性。后来,希尔伯特又加了一条限制,这就是完备性。\n所谓相容性就是指公理之间无矛盾,也就是说,不可能从公理体系所设定的几组公理出发,用逻辑推理的方法得到与设定的其他某一个公理矛盾的结果。更确切地说,不能从公理体系的公理出发,用逻辑推理的方法既证明某一个命题的正确性、又证明这个命题否命题的正确性。大多数数学家对公理体现的相容性都确信无疑,比如,希尔伯特的学生、德国数学家外尔就明确地说[^243]:\n关于真理,纯粹数学只承认一个条件,而且是它必须承受的条件,那就是相容性。\n可是,如何验证公理体系的相容性、或者更确切地说、一个公理体系能够证明自身的相容性吗?希尔伯特希望实现这样的证明,他把他所构建的几何公理体系的相容性转化为算术公理体系的相容性,并且把\"算术公理的无矛盾性\"作为1900年巴黎数学家大会上提出23个问题中的第2个问题。他认为这个命题是正确的,是可以证明的。\n独立性是指,五组公理中的任何一组公理都不是其他几组公理的逻辑推论。在第二章,希尔伯特借助代数的语言证明了他所给出的五组公理的独立性。\n关于完备性的思想,希尔伯特在著作的《导言》中就有所体现:\"为几何建立一个完备的、尽可能简单的公理系统,要根据这个系统推证最重要的几何定理。\"可以这样理解完备性,在某一个研究领域建立了公理体系,如果这个公理体系是完备的,那么对于任意一个基于这个公理体系概念的有意义的命题,用这个体系所提供的公理判断这个命题的真伪都是充分的。\n1925年,在纪念魏尔斯特拉斯的一个会议上,希尔伯特发表了著名的《论无限》的讲演,进一步强调完备性对于数学的重要[^244]:\n能被这样处理的那种根本问题的一个例子,是每个数学问题都是可解的这样一个论题。我们大家都相信真是如此。事实上处理一个数学问题的主要吸引力之一,是我们总听到我们心里在喊:这里有一个数学问题,去求它的解吧;你只要通过思考就能找到它;因为在数学里没有永远不可知的东西。我的证明论并不能提供解出每一个数学问题的一般方法,这样的方法是不存在的。然而这个证明(每一个数学问题都是可解的这个假定是一个一致性假定)完全在我们理论的范围内。\n可以看到,希尔伯特不仅对数学的效能充满信心,并且对他提出的纲领也是雄心勃勃。正如他所说的那样,正因为有了这样的信心,数学家们才孜孜不倦地寻求各种数学猜想的答案。但是,事实证明,希尔伯特的纲领是不可能实现的。下面,我们从逻辑分析和实例验证两个方面进行述说。\n逻辑分析:公理体系的完备性与相容性。首先分析完备性。1931年,美籍奥地利数学家哥德尔发表了一篇划时代的论文[^245],使得整个数学界为之震惊。那篇论文否定了包括算术公理体系在内的公理体系的完备性,文章的开始部分写得非常深刻,转载如下:\n在较精确的意义上说,数学的发展已经导致它大范围的形式化,以至于证明竟然可以依照少数几条机械规则实现。目前,最丰富的形式系统,一个是怀海德和罗素的《数学原理》的系统,另一个是策梅罗-弗兰克尔(ZF)的公理集合论系统。这两个系统足够广博,现在数学中使用的所有证明方法都可以在系统中形式化,即都可以从几条公理和推理规则演绎出来。因此,似乎可以合理地推测,这些公理和推理规则对于判定所有在系统中能够描述的数学问题是充分的。下面将要指出的是,事情并非如此!在上述两个系统中,存在着相对简单的初等数论问题,不能在该系统中基于公理而判定。\n如文中所说,怀海德和罗素的《数学原理》的系统和策梅罗-弗兰克尔的Z-F集合论公理系统,是现代数学的基石,但是,存在相对简单的算术命题,在这两个公理体系不能判断正确与否,这样,哥德尔就论证了公理体系的完备性是不可能的,人们称这个结论为\"哥德尔第一不完全性定理\"。\n哥德尔的论证方法大体是这样的,把公理体系中的每一个概念指派一个正整数,于是每个命题都可以通过算术指派一个数,现在,人们称这样的数为\"哥德尔数\"。比如,指派1对应于自然数1,指派2对应于等号,于是命题\"1=1\"就对应于整数组\"1,2,1\";基于最小素数2,3,5,指派这个命题的\"哥德尔数\"就是\n2^1^·3^2^·5^1^ =\n90。因为是基于最小素数的,这样的指派是唯一的,这就构成了公理体系与算术之间的一个映射。\n利用这些算术术语,哥德尔构造了一个语句G,这个语句指派的哥德尔数是n,而这个语句G的表述是:n在这个系统中不可证。也就是说,构造了一个\"我是不可证明的\"这样的语句。对于这个语句的真伪判断,下面两个命题中只有一个成立:\nG是真的,但在这个系统中不可证;\nG是假的,但在这个系统中可证。\n因为数学的逻辑判断只能用来\"求真\"、不能用来\"证伪\",因此上述第二个命题不能成为数学命题,而第一个命题恰恰就是哥德尔得到的结论。这样,哥德尔的结论就宣判了,至少对于现今为止人们所使用的、形式化公理体系的完备性不成立。\n后来,哥德尔又给出了关于相容性的结论,是说,如果一个公理系统是相容的,那么就不能证明它自身的相容性。人们称这个结论为\"哥德尔第二不完全性定理\"。\n哥德尔的证明思路大体是这样的,用\"consis\"表示系统相容的算术语句,用\"⊆\"表示蕴含的技术符号,对于语句X,Y,Y⊆X,读作\"如果X,则Y\"。显然,如果X,Y,Y⊆X为真,那么Y也为真;同样,在一个公理系统中,如果X,Y,Y⊆X可以证明,那么Y也可以证明。如果仍然用G表示命题:n在这个系统中不可证,那么根据\"哥德尔第一不完全性定理\",关系G⊆consis为真。这样,如果语句\nconsis\n是可以证明的,那么G就是可以证明的,这恰是上面曾经论述到的第二个命题,对于数学逻辑判断不成立,基于反证法,否命题语句consis\n是不可以证明的。这样就得到结论。\n现在,考虑这个命题的逆否命题:如果一个公理系统可以证明自身的相容性,那么这个公理系统就是不相容的。这样,就彻底否定了希尔伯特\"算术公理的无矛盾性\"的猜想,因此,希尔伯特试图通过《几何基础》给出的几组公理,论证这个公理体系的相容性也是不可能的。\n实例分析:公理体系的完备性和相容性。我们讨论一个具体的例子,更加直观地说明策梅罗-弗兰克尔的Z-F集合论公理系统是不完备的,也就是说,存在一个非常具体的、非常明晰的数学命题,无法通过集合论公理系统判断这个命题的真伪。这个例子就是大名鼎鼎的希尔伯特第一问题。\n希尔伯特第一问题。上个世纪最引人注目的数学事件,在莫过于希尔伯特在第二次国际数学家大会上所作的报告,时间是1900年8月8日星期三的上午,地点是巴黎大学的一个报告厅,年仅38岁的希尔伯特用德语发表了他的演讲,听众最多250人[^246]。希尔伯特的报告提出了二十三个问题,这些问题深刻地影响了整个二十世纪世界数学的发展。第一个问题是连续统的问题。\n如话题9所述,康托定义了集合之后,希望度量集合的大小、即集合中元素的个数,称这样的个数为基数,用希伯来文的第一个字母\n\n表示,发音为\"阿列夫\"。因为包含自然数的所有集合元素的个数都是无穷多,于是康托借助一一对应的方法定义了无穷多,并且证明,有理数集合\nQ的基数与自然数集合N的基数一样大,实数集合R的基数要大于自然数集合N的基数。于是康托设想,无穷大概也能像自然数那样从小到大进行排队,其中自然数集合的基数最小,称为\"阿列夫0\"、即可数多个,然后为\"阿列夫1\"\"阿列夫2\",表示为\n,,,......\n形式。可以看到,这完全是自然数的类比。\n现在的问题是,如何理解实数集合的势。如果用C表示实数集合的势,因为康托已经证明了实数集合的势大于自然数集合的势,于是在1884年发表了他的猜想\nC =\n。\n因为在1872年,德国数学家戴德金构造性地证明了实数的连续性,于是数学家们就称实数集合的势C为连续统。包括希尔伯特在内的那个时代的许多数学家都认为,在自然数集合的势与实数集合的势之间不会有其他的无穷多,于是他们称康托的这个猜想为连续统假设。对于现代数学,连续统假设的重要性是不言而喻的,因此,希尔伯特把连续统假设作为二十三个问题中的第一个问题提出。\n哥德尔曾经深入研究过连续统的问题,1947年在《美国数学月刊》上发表论文的题目就是[^247]:什么是康托的连续统问题?在这篇论文中,哥德尔猜想[^248]:连续统问题在Z-F系统中是不可解的。直到1963年,美国数学家科恩用\"力迫法\"法证明,连续统假设与Z-F集合论公理体系独立,也就是说,作为一个命题,基于Z-F集合论公理体系无法判断连续统假设正确与否。为此,科恩获得1966年度菲尔兹奖。从此,连续统假设成为现代数学中一个既不能证明、又不能推翻的经典。数学与科学一样,只要有一个反例,那么就意味着结论不成立,因此,连续统假设的例子说明了公理体系完备性的论断是不正确的。这也进一步说明,数学是人创造出来的一种语言,可以用来认识、理解和表达现实世界,但数学的结论并不意味着事实本身,更不意味着就是客观的存在。\n话题21 距离和基于距离定义的几何体系\n希尔伯特构建的几何公理体系完全是形式的,研究对象是高度抽象的,如果没有欧几里得几何作为铺垫,任何人都想象不出希尔伯特定义的点、直线、平面的形态。这样,仔细分析哥德尔的两个不完全定理的论证思路可以发现,问题的要害在于公理体系的封闭性,也就是说,公理体系从概念提出、命题发想、命题表达,到命题验证,完全是自给自足。这也就是希尔伯特所说的公理体系的独立性,是哥德尔的论述没有论及的。\n事实上,除了用名义定义的方法构建不触及内涵的基本概念之外,还有一个解决问题的思路,就是借助数学外部的概念构建几何学最基本概念。或许,这样的思路是摆脱哥德尔不完全定理束缚的最好方案。那么,应当如何确定呢?我想,几何学最基本的概念是距离,因此,可以寻找合适的度量距离的工具,就像庞加莱曾经说过的那样[^249]:\n如果距离、方向、直线这种直觉,简言之,空间的这种直接的直觉不存在,那么我们关于它所具有的信念从何而来呢?如果这只不过是一种幻觉,那么这种幻觉为什么如此牢固呢?考察一下这些问题是恰当的。我们说过,不存在关于大小的直接的直觉,我们只能达到这数量和我们的测量工具的关系。因此,如果没有测量空间的工具,我们便不能构造空间。\n因此,数学可以借鉴现实的或物理的概念,通过度量形成距离的概念。纵观社会发展的历史,人类学会精准距离度量经历了几千年时间,在中国经历了寸、尺的过程,在欧洲经历了脚、米的过程。后来人们发现,确定构建距离概念最可靠的方法,就是利用\"距离\n=\n时间×速度\"这个模型,因此需要先确定时间和速度。在1967年的第13届国际度量衡大会上,人们利用原子钟的原理对\"秒\"给出了严格的定义:铯133辐射\n9,192,631,770个周期的时间间隔,在1983年的国际计量大会上,通过了距离的定义:光在真空中1/299792458秒经过的距离。\n这样,我们就获得了距离的概念,使得时间和空间,由康德所说的获取知识的先验直觉变为了现实工具。有了这样的度量,就可以在几何体系中,不加说明地使用\"距离\"这样术语,就像我们在数学中曾经使用的\"对应\"\"多少\"\"大小\"\"前后\"这样的概念一样。事实上,因为数学的研究是抽象的、形式的,因此不需要进行真正的度量,只是借助这样的概念作为数学表达的语言。\n我们还需要建立一个基本原则,这个原则也不是基于数学的,而是基于思维判断的,这就是,只有站在高维空间才能判断低维空间的几何特征。是说,只有在二维空间才能判断一条线是直的还是弯的,只有在三维空间才能判断一个面是平的还是曲的。因此,几何概念建立的原则是:\n在线上定义点,建立点与点的关系;\n在面上定义直线,建立点与线、线与线的关系;\n在体上定义平面,建立线与面、面与面的关系。\n借助上述原则和距离的概念,可以定义所有的几何学的研究对象。比如,如下所示,在面(并不要求平面)上定义所有与线有关的定义[^250]。\n直线段:面上任意两个不同点,可以有无数条线连接这两个点,称其中距离最短的连线为直线段,称这两个点为直线段的端点,称两点间的最短距离为直线段的长度。\n射线:从直线段的一个端点出发,在面上按一个方向无限延长形成线,如果这条线上的任意两点间都构成直线段,称这条线为面上的射线。\n直线:从直线段的两个端点出发,在面上向两个方向无限延长形成线,如果这条线上的任意两点间都构成直线段,称这条线为面上的直线。\n夹角:对于两条具有公共端点但不重合的直线段,分别在两个直线段上截取到公共端点同样长\nr\n的两个点,称连接这个两点的连线为的弧,如果这个连线上的点到端点的距离都等于\nr,称弧的长度为弧长,称弧长与 r 之比为面上的角[^251],比值越大角度越大。\n三角形:面上不重合的三条直线段的端点两两重合,称所形成的图形为三角形。\n点到直线距离:不在直线上的一个点与直线上的点形成直线段,称最短的直线段为这个点到直线的垂线,称垂线的长度为点到直线的距离,称垂线在直线上的点为垂足。\n两条直线平行:面上的两条直线,如果一条直线的所有点到另一条直线的距离都相等,称这两条直线平行。\n两条直线垂直:面上的两条直线,如果一条直线的所有点到另一条直线的垂足都为同一点,称这两条直线垂直。\n现实几何。用同样的方法,可以在三维空间的体上定义面,这样,基于三维空间可以构建一个新的基于定义的几何体系,包括研究对象的定义、也包括研究对象关系之间的定义。\n可以看到,我们给出的定义,既避免了欧几里得述说不清内涵和外延的定义、也避免了希尔伯特完全脱离直觉、彻底形式化的定义。我们构建的几何源于人们对现实世界空间形式的认识,借助了现实世界中距离的概念。我们在定义研究对象和研究对象之间关系的同时,也定义了传统意义的公理,因此,这样的几何不需要任何公理体系。因为这样的几何学是对现实世界的一种回归,我们姑且称这样的几何学为现实几何[^252]。\n话题22尺规作图的最大范围\n《义务教育数学课程标准(2011年版)》强调了尺规作图,《义务教育数学课程标准(2022年版)》进一步把尺规作图的部分内容下放到小学。如此设计的缘由,如问题16所述,这是为了让学生在适当的年龄动手操作,通过图形的构造过程、感悟几何的抽象过程,培养想象力和几何直观。\n古希腊学者重视几何学,不仅仅是因为几何学的研究看得见摸得着,更重要的是,他们充分认可几何学演绎推理的论证形式。因此,当他们解释不清楚无理数的时候,就尝试用几何作图的方法解释。可能与此有关,欧几里得《原本》五个公设中的前三个公设都与几何作图有关,这些公设给出了无刻度直尺和圆规作图的限制,后世学者称这样的作图方法为\"尺轨作图\"。\n尺规作图的最大范围。利用尺轨作图,可以从单位线段出发进行线段的加、减、乘、除,如果把四则运算作图的结果看作单位线段的扩充,那么,这样的扩充类似于把自然数集扩充到有理数集。通过尺规作图,还可以得到对应于根号2的线段,因此,自然而然会提出这样的问题:通过尺规作图能够扩充到多大范围呢?能够得到对应于任何实数的线段吗?我们讨论这个问题。\n用代数方法分析尺规作图的功能,关键是分析无刻度直尺和圆规的作图功能。我们从有理数出发进行讨论,用\nδ 表示单位线段,用aδ 表示对应于有理数a的线段。\n因为用无刻度直尺作图只能得到直线,因此在平面直角坐标系中能够得到\n\n的形式,其中A,B,C均为有理数;因为用圆规只能得到圆,因此在平面直角坐标系中可以得到\n\n的形式。解上面两个联立方程,可以得到圆与直线的交点x的坐标,即得到二次方程\n\n的解。由二次函数求根公式,解具有\n\n的形式。又因为在联立方程中y与x的地位是对称的,坐标y也只能是这样的形式。这样,能够得到下面形式的集合:\n,\n其中R为有理数集合。\n可以看到,上面的集合包含了所有的有理数,也包含了与有理数的平方根有关的无理数。进一步,从集合W~1~\n出发得到的新的集合,依然具有同样的形式,变化的只是用W~1~替代有理数集合R。这样,经过k步操作后,可以得到集合的形式是\n。\n借助数学归纳法可以证明,通过k步操作得到的W~k~\n是有理系数2^k^次方程的根,这就是用尺规作图可以得到的最大的范围。\n因此,虽然古希腊学者用尺规作图的方法解释了√2这样的无理数,认为几何学比代数学更加符合逻辑、用几何学解释无理数更加合理,但在事实上,古希腊学者并没有走得很远,用尺规作图解释代数运算的能力相当有限。无论如何,通过上面的讨论可以看到,我们不仅可以借助几何作图来讨论代数运算的问题,也可以反过来,借助代数运算来讨论几何图形的问题。后来,人们称用代数的方法讨论几何的研究为代数几何,至今为止,这个研究领域方兴未艾。\n三等分角的问题。这是一个非常著名的不可作图问题,问题是,用尺规作图的方法三等分任意给定角。在这个问题中,任意给定角是关键,因为对于特殊的角,比如平角和直角,很容易找到三等分角的方法的。同时我们也知道,为了否定\"任意\"的命题,只需要找到\"一个\"特殊的情况,也就是说,针对现在的问题,只需要找到一个的特殊角,论证用尺规作图的方法不能三等分这个角。\n阿基米德三等分角的作图。在数学发展的历史上,曾经有不少学者设想各种方法解决这个问题,但这些方法都超出了尺规作图的限制,比如,下面的例子是在阿基米德的著作中发现的[^253]。\n{width=\"2.8381944444444445in\"\n三等分任意角的作图\n如图所示,对于任意给定的角α,角的顶点为O,过角的一个边作直线w。以O为圆心、任意长r为半径在直线w的上方画一个半圆,半圆与角的另一边交于点A。在直尺上标出两点B和C,使得线段BC的长度等于r。然后,让直尺以点A为轴心、点B保持在半圆上滑动,当点C恰好落在直线w上时停止,连接AC,这时B在半圆上。令∠ACO=β,下面证明\nβ=α/3。\n因为α=β+∠CAO,只需证明∠CAO=2β。因为OA=OB,则∠CAO=∠OBA,只需证明∠OBA\n=2β。又因为∠OBA\n=β+∠BOC,只需证明β=∠BOC。由作图方法可以知道BC=r=BO,因为等腰三角形的两个底角相等,所以结论成立。\n阿基米德的构思相当巧妙,如果操作精细,确实能够作出一个角的三等分角。但是,按尺规作图的两个限制,这样的作图方法是不被允许的,主要原因是作图过程中\"过分\"地使用了直尺,因为尺规作图限制直尺只有联结两点作直线段的功能,没有\"以点A为轴心、点B保持在半圆上滑动\"的功能。下面,我们寻找一个特殊的角,说明这个角是不能三等分的。\n三等分角作图的不可能。我们选定的特殊角为60度,论证用尺规作图方法不能三等分这个角,也就是说,如果记\nθ=60,那么用尺规作图方法不能得到 θ/3。\n由三角函数的定义,在一个斜边长为单位线段的直角三角形中,如果有一个角为\nθ/3,那么这个三角形的一个直角边的长度为 x=cos(θ/3),另一个直角边的长度为\ny=sin(θ/3)。这样,作\nθ/3角的问题就等价于作出直角边分别为x和y的直角三角形。下面论证,用尺规作图的方法不可能作出这样的直角三角形。由三角函数的公式知道\n。\n(1)\n因为当 θ=60时cosθ=1/2,代入上式可以得到\n。\n(2)\n这样,我们就把作特殊直角三角形的问题转化为求特殊三次方程根的问题。\n根据话题10所述代数基本定理,任意一个三次方程都可以化为乘积的形式:\n\n其中x~1~,x~2~和x~3~\n为三次方程的三个根。这样,就可以得到三次方程的韦达定理\n;\n;\n。\n由二次方程的求根公式知道,如果有一个根的形式为 x~1~=\np+q√h,其中p和q为有理数,那么必然还有一个根的形式为 x~2~= p-q√h,因此\nx~1~+ x~2~= 2p。这样,可以得到x~3~=\n-a-2p,因此第三个根必为有理数[^254]。因为在上面的假设中,x~1~和x~2~\n都是用尺规作图得到的,属于W所示集合。这就说明,如果一个有理系数三次方程的根可以通过作图得到,那么至少有一个根为有理数。反过来,我们可以得到用尺规作图求解有理系数三次方程的基本定理:\n基本定理\n如果一个有理数系数三次方程没有有理根,那么这个三次方程的根是不可作图的。\n现在,我们论证(2)所示三次方程不存在有理根。令y=2x,方程可以化简为\n。\n(3)\n用反证法证明如下。\n如果三次方程(3)存在有理根,设这个根为y=m/n,其中n和m为互素整数。把这个有理根代入(3)式,可以得到\n\n这意味着n^3^和m有公因子,因为n和m互素,只能有m=±1。由(3)式还可以得到\n\n这意味着m^3^和n^2^有公因子,因为n和m互素,只能有n=±1。\n于是,如果三次方程(3)存在有理根,那么这个有理根只能为1或者-1。但是,把1或者-1代入,三次方程均不成立,这就说明方程(3)不存在有理根。\n这也就说明 (2)\n所示三次方程不存在有理根,根据基本定理,用尺轨作图的方法不能得到这个三次方程的根,因此,用尺规作图的方法三等分60度角是不可能的。这就说明,在一般的情况下,三等分角作图是不可能的。\n话题23 数学表达:与时间无关的比例模型\n我们把数学核心素养浓缩为\"三会\",其中包括\"会用数学的语言表达现实世界\",这里所说的表达,不仅表达自然界的那些具有规律性的东西,也包括表达人的对于自然界的感觉。在接下来的三个话题中,我们将讨论如何用数学的语言表达现实世界:前两个话题,讨论如何用数学的语言表达自然界的那些具有规律性的东西,包括与时间无关的、相对静态的规律,也包括与时间有关的、相对动态的规律;第三个话题,我们将尝试用数学的语言表达人对美的感觉,主要讨论对称的美。为了突出数学的表达,前两个话题讨论最简单的乘法模型、即作为乘法模型特例的比例模型。\n比例模型。至少在形式上,乘法运算包含三个量:两个乘数和一个乘积,如果要讨论数量关系,构建基于乘法运算的数学模型(称为乘法模型),那么,主要体现乘积与其中一个乘数之间的关系。在这个意义上,把两个乘数分为被乘数和乘数是合适的,因为乘法模型主要体现乘积与被乘数之间的关系,乘数则往往是作为乘法模型中的系数或参数[^255],这样就形成了比例关系。因此,也可以把这样的乘法模型称为比例模型。\n在这个话题,我们讨论静态的、与时间无关的比例模型。如果用 X 和 Y\n表示两个变量,用 ρ\n表示这两个变量之间的比例系数,那么,比例模型就可以表示为\nY = ρX\n的形式。在一般情况下,要求比例系数 ρ\n为正数,因此也称这样的表达式为正比例模型。比如路程模型,如果把速度看作比例系数,那么路程和时间就构成了正比例模型。通过下面的几个例子可以看到,物理学中的许多模型都是正比例模型,这些模型不仅与我们的现实生活息息相关,并且深刻地揭示了自然界中一些最为核心的关系。\n弹性力学中的胡克定律。胡克定律述说的是弹簧秤的故事,如果在弹簧的一端悬挂重物,那么这个定律构建了重物的重量与弹簧长度之间的关系。如果用F表示弹簧所受的力,x为弹簧的位移,k为弹簧的弹性系数,那么,可以把胡克定律表示为\nF = k·x\n的形式,其中的弹性系数是一个正数,与弹簧的质地有关。\n这个模型说明,弹簧的位移与弹簧受力大小成正比例关系,受力越大则位移越大。如果把问题回归到单纯数学,那么上述表达式在平面直角坐标系的图像是一条直线,弹性系数k为直线的斜率,因此,人们也称这样的关系为线性关系,称这样的模型为线性模型。这个定律是英国物理学家胡克发现的,因此被称为胡克定律。\n牛顿力学第二定律。牛顿用数学的语言给出了力的定义,这个定义就是大名鼎鼎的牛顿力学的第二定律、又称牛顿动量定律,写成\nF = m·a\n的形式,其中F表示力,m表示物体的质量,a表示物体的加速度。这个定律接续牛顿力学的第一定律,第一定律说,如果物体没有受到外力的作用,那么这个物体保持静止状态或者匀速直线运动。这也就意味着,物体受力必然要改变运动状态(包括静止状态),而要改变静止状态必然要获得加速度,因此力的产生只与加速度有关。如果一个物体所在惯性系确定,那么在理想状态下,这个物体的加速度就是一个常数,与物体的质量和形状无关。因此,这个表达式也构建了一个比例模型,要改变物体的运动状态,物体质量越大需要施加的力也越大。这个结论与我们日常生活的经验是一致的。\n这个定律之所以重要,是因为在牛顿提出这个定律之前,虽然人们早就感知到了力的存在,甚至会使用力、会制造动力,却始终说不清楚力到底是什么。显然,牛顿采纳了伽利略的建议,不讨论力是什么,而是用数学的语言述说力的表现。\n理想气体状态方程和绝对零度。这个方程研究与气体有关的四个变量之间的关系,这四个变量是:气体的体积(V)、气体的压强(P)、气体微粒的数量(N~A~)和气体的温度(T)。这个研究经历了一个相当漫长的过程,我们简要回顾这个发展过程,在这样的过程中进一步感知,现实世界是如何彰显大道至简,人们又是如何用数学的语言恰到好处地表达了大道至简。\n英国化学家波义耳发现[^256],气体的体积与气体的压强存在反比例关系:体积越大则压强越小。16年后,法国物理学家马略特独立得到了这个结果,并且通过实验发现:这个关系成立是需要条件的,这个条件就是保持气体的温度不变。后来,人们把这个反比例关系称为玻义耳-马略特定律。\n法国物理学家查理进一步研究了气体体积与气体温度之间的关系,发现了一条重要的定律:一定质量的气体,在压强不变的条件下,温度每升高或降低1℃,增加或减少的体积是一个常数。法国化学家盖·吕萨克进一步深入研究了这个问题,给出了后来被人们称作查理-盖·吕萨克定律的表达式:如果用V~0~\n表示气体在0℃ 时体积,用1/s表示常数,则查理-盖·吕萨克定律具有\nV~t~ = V~0~ (1 + t/s) = V~0~ (t + s)/s\n的形式,其中V~t~表示t℃ 时气体的体积。这样,对于任意温度T~1~ 和\nT~2~,均有V~1~/T~1~ =\nV~2~/T~2~。如果用直角坐标系予以表达,因为成比例等价于斜率相等,可以得到如图所示直线方程。\n\n气体体积与气体温度的线性关系\n如图所示,当气体温度t逐渐下降到\n-s时,气体体积V会下降到0。因为气体的体积总是大于零的,因此\n-s是一个可望不可及的温度,于是人们称这个常数为绝对零度,这是一个可以无限接近、但永远达不到极限。显然,如果能精确地测量气体体积和气体温度,那么根据图中的直线,可以得到s的具体数值。通过实验,盖·吕萨克得到s\n= 266.66,后来,人们通过计算得到更精确的绝对零度数值为摄氏\n-273.15度[^257]。\n爱因斯坦质能变换公式。如果要问:什么是宇宙中最本质的问题,那么,这个问题或许就是物质的存在方式、或者更直白地说、物质是什么。人们始终也说不清楚物质到底是什么,因为探究物质的最基本形态,至今为止已经发现六十一种不可再分割的基本粒子,物质竟然会由如此多元的基本形态构成是难以想象的,无论是科学的角度、还是从哲学的角度,都是无法接受的。\n即便如此,人们普遍认为物质具有两个基本属性,一个是\"能量\"、一个是\"质量\",爱因斯坦质能变换公式是在狭义相对论的基础上,讲述了能量与质量之间的故事,表示为\nE = m·c^2^\n的形式,其中 E 表示物体的能量,m 表示物体的质量,c\n表示光速。因为光速是绝对的、与发光物体所在惯性系的速度无关,于是这个公式就形成了正比例模型,\nc^2^ 为模型的系数。\n因为系数 c^2^\n非常大,这个模型明确地告诉我们,任何物质中都蕴含着大量的能量。比如,通过这个公式可以计算得到:一克物质中蕴含着\n9×10^13^ 焦耳的能量,这些能量足以把 22\n吨的水从零度加热到沸腾。这样,质能变换公式也为制造原子弹奠定了理论基础,因为这个原因,老年的爱因斯坦竭力反对核战争[^258]。反过来,通过上面的表达式也可以得到这样的结论,如果一个物体保持不变,那么当这个物体所在的惯性系的速度逐渐提高时,这个物体的能量-动量也就会逐渐增大,因此这个物体质量就会相应地逐渐变小、进而会导致时间变慢。这或许就是,在接近光速的飞行器中时间会变慢的道理,当然,这样的结论还只是一种想象,还需要实践的验证。\n爱因斯坦引力场方程。如果要问:什么是宇宙认知最本质的问题,那么,这个问题或许就是如何理解时间和空间。爱因斯坦引力场方程讲述的就是物质与时空之间的故事,是至今为止最生动的、也是最难解的方程,是广义相对论的核心。特别需要说明的是,这个方程的雏形也是一个正比例模型。\n爱因斯坦在《关于广义相对论的原理》一文中谈到[^259],根据马赫原理中\"物质的分布及其运动决定时空结构\"的假设,可以得到\"时空状态完全取决于物体的质量\"的结论。根据上述爱因斯坦质能变换公式,可以把能量-动量和质量看作是同一种东西。用张量描述能量-动量,爱因斯坦就得到了广义相对论的核心表达式\nG~uv~ = ρT~uv~,\n在上面的表达式中, G~uv~\n表示时空结构的张量形式,被称为爱因斯坦张量,T~uv~\n是表示能量-动量的张量,ρ\n是比例常数[^260]。这真是大道至简,这个简单的比例模型讲述了宇宙与认知的最本质的故事,这就是\"时空结构\"与\"能量\"之间具有正比关系。\n话题24 数学表达:与时间有关的比例模型\n比例模型也可以用来描述随着时间的变化而变化的数量关系,也就是说,上个话题中的X和Y是随时间变化而变化的量。进一步,如果这两个变量是同质的(比如,某小学校学生的身高、某地区年度GDP、某企业投资回报等等),那么,还可以形成一种比例意义下的递推关系,称为与时间有关的比例模型:如果不考虑随机因素的影响,那么称这样的模型为动力系统,如果考虑随机因素的影响,那么称这样的模型为时间序列。\n动力系统模型。我们用 n = 0,1,2,... 表示时刻,用 a~n~ 表示时刻 n\n时的数量,用 b 表示一个常量,那么最简单的动力系统模型可以表示为:\na~n~ = ρa~n-1~ + b\n的形式,其中的 ρ\n依然表示系数或者参数。可以看到,动力系统模型具有这样的功能:如果实践证明,可以由过去推断现在,那么就推理,可以由现在推断将来。\n在推断的过程中,系数 ρ 非常重要,分析如下。不失一般性,令常数项 b =\n0,并假定初始值 a~0~ 为正。这样,表达式可以化简为\na~n~ = ρa~n-1~\n的形式。当时刻 n 逐项变化时,可以得到 a~1~ = ρa~0~,a~2~ = ρa~1~ =\nρ^2^a~0~,...,这样,就得到了一个基于初始值 a~0~ 的一般表达式:\na~n~ = ρ^n^a~0~,\n称为基本关系式。这个表达式充分表达了数量依次递推的关系,于是,人们称这样的关系式为动力系统。当系数\nρ 不同时,动力系统会表现不同的性状:\n当 ρ< 0 时,动力系统会出现振荡:当 n 为奇数时,数值为负;当 n\n为偶数时,数值为正;\n当 ρ = 0 时,从 n = 1 开始,动力系统的值恒为 0,\n当 0 <ρ< 1 时,因为数列 {ρ^n^ } 随着 n 增大单调下降趋于\n0,动力系统单调衰减;\n当 ρ = 1 时,动力系统始终停留在初始值上,不增不减保持平衡;\n当 ρ> 1 时,因为数列 {ρ^n^ } 随着 n\n增大单调上升趋于无穷大,动力系统单调增长。\n上面的分析充分地说明,对于与时间有关的比例模型,模型中系数格外重要,系数取值的不同往往会决定模型的变化趋势。\n动力系统的平衡点。正因为系数的重要性,因此对于简单动力系统,人们关注如何得到系统的稳定状态非常重要。稳定状态是指,对所有的\nn,基本关系式的解都是一个常值,表示为:a~n~ =\na。这样,简单动力系统就形成了一个恒等式:a = ρa + b,通常称这样的常值 a\n为简单动力系统的平衡点,可以得到平衡点为:a = b/(1-ρ)。显然,当 ρ =\n1 且 b ≠ 0\n时,动力系统的平衡点不存在。下面,我们通过一个现实的例子,分析平衡点的重要性和计算方法。\n投资额度确定。策划某一个项目,预测这个项目的年回报率是\n120%,如果假定每年的经营成本和计划收益是100万元,那么为了保证这个项目能够稳定经营,一开始投资多少合适呢?基于简单动力系统模型,可以把资金运转的过程表示为\na~n~ = 1.2a~n-1~ - 100,\n即模型中的系数 ρ=1.2,常数 b=-100,可以得到这个动力系统的平衡点为\na = -100/(1-1.2) = 100/0.2 = 500。\n因此,一开始投资 a~0~ = 500(万元)比较合适。\n基于这个初始值容易验证,对于每一个年份,资金运转过程的解都为 500\n万元,因此资金运转始终处于一个稳定的状态;因为每年的收益都是100万元,因此符合回报率120%的设想。显然,这样的投资是为了获得经营收益,与那些为了获得资本收益的风险投资存在本质差异。\n自回归模型。现在考虑随机因素影响。在许多实际问题中,数据是按照规定的时间获取的,但是每次获取的数据事先无法确定,因此是随机的;但是,数据还是相对稳定的,因此说是受随机因素影响。比如,每一天股票的收盘价,每个年度的国内生产总值(GDP)或者国民生产总值(GNP)等等,如果把这些数据按照时间顺序排列,在\nt 时间得到的数据设为 x~t~,那么就可以得到一个数据序列\nx~1~,...,x~T~,\n其中 T 表示一个时间段。\n在一般的情况下,这样的数据之间是有关联的,比如,现实数据会受到前一时间、或者、前若干时间的影响,因此,可以写成下面的形式\n,\n其中 ε~t~ 表示时间 t\n的随机误差的影响。人们称这样模型为自回归模型。下面,我们分析其中最为简单的形式,即随机游走模型。\n随机游走模型。令 p=1,β~0~=0,β~1~=1,可以得到最简单形式的自回归模型\n,\n其中时间 t = 1,...,T,随机误差之间是相互独立的。\n{width=\"2.767361111111111in\"\n随机游走示意图\n考虑这样的情境,如图所示,在平面上画出一些方格子,行列间距相等,间距相当一个人的步幅。设想有一个醉汉随机行走在这个平面上,每一步恰好走在一个交叉点上,那么上面的表达式就可以描述这个人行走的轨迹,比如,从\nA 点走到\nB点。人们诙谐地称这样的表达为醉汉的随机游走模型。随机的游走是指完全无目的、无意识的行走。\n英国统计学家皮尔逊在研究市场价格变化的过程中发现,在独立性假设下,价格序列的变化规律与随机游走模型十分相似[^261],于是人们开始重视对于随机游走模型的研究。后来,人们把随机游走模型应用到现实生活的许多领域,比如,在经济学中研究价格规律,在金融学中构建股价模型,在物理学中模拟粒子行为,在生物学中探讨动物活动,在心理学中解释决策可能,等等;在现今社会,人们又把随机游走模型应用于大数据分析和信息技术开发,比如,在线上收集社交网络中的随机数据,在机器学习中模拟人的决策等等。\n此外,数学家还从纯数学的角度,研究随机游走模型的行走规律。如果称图表达的随机游走模型是二维的,那么很容易把这样的模式拓展到一般的\nd-维游走。在1921年,匈牙利籍美国数学家、数学教育家波利亚证明,对于一维和二维的随机游走模型,无论从哪一个点出发,只要行走的步数足够多,那么将会以概率\n1\n返回出发点;对于三维以上随机游走模型,返回出发点的概率将小于1,维数越高返回出发点的概率越小[^262]。\n下面,我们分析随机游走模型的一些统计学性质。首先考虑随机影响的作用,如果令\nx~0~=0,那么对于 t≧1 可以得到\n,\n这是随机误差加法形式的直接表达,称这样的模型为误差序列。如果假定每一个随机误差都服从均值为\n0,方差为 σ^2^\n的正态分布,那么称这样的误差序列是高斯白噪声[^263]。通过上面的表达式,可以得到随机变量的均值和方差分别为\n\n和\n。\n这样,方差就是时间的增函数,人们称这样的随机游走模型是非平稳的[^264]。非平稳模型会失去许多好的统计性质,但是,随机变量差所构成的随机变量却具有很好的统计性质。令\n,\n其中 s>t,容易得到这个差的方差为\n。\n如果对于另外两个时刻\nq>p,类似构建两个相应随机变量的差,如果这两个时间间隔不相交,即满足\nq<t 或者 s<p,那么两个时间段差的随机事件相互独立,即可以表示为\n,\n并且都服从正态分布。\n可以看到,时间间隔不相交的两个时间段差的随机事件相互独立,意味着增量之间相互独立,借助这个性质可以把随机游走模型从离散形式拓展到连续形式,这就是大名鼎鼎的布朗运动,是苏格兰植物学家布朗于1827年提出的。人们通常称表示独立增量的数学模型为维纳模型或维纳过程、或者、直接称为布朗运动模型,这里所说的维纳是[控制论](http://baike.baidu.com/view/62820.htm)创始人。有兴趣的读者,可以在概率论或者数理统计的书中找到相应的论述。\n话题25 数学表达:人的关于对称美的感觉\n在前两个话题,我们讨论了如何用数学的语言表达自然界的和社会中的那些具有规律性的事物,在这个话题,我们将讨论如何用数学的语言表达人们的感觉,比如,人的对现实世界美的感觉,主要讨论关于对称美的表达。主要讨论三个问题,一是什么是人的关于美的感觉,二是人为什么会感觉到对称是一种美,三是如何用数学的语言表达这样的感觉。\n人的关于美的感觉。美是人对事物的一种感觉[^265],虽然人对于美的感觉存在差异,甚至一个人对美的感觉也可能会随着心情的改变而改变,但在大多数情况下,人们对美的感觉是具有共性的。比如,春天盛开的鲜花、夏日晴朗的夜空,都会使人心旷神怡;敦煌的壁画千年不朽,李白的诗歌传唱至今。毋庸置疑,人对于美的感觉的共性源于事物原本属性,正如恩格斯所说的那样[^266]:\n我们的主观的思维和客观的世界服从于同样的规律,因而两者在自己的结果中不能相互矛盾,而必须彼此一致,这个事实绝对地统治着我们的整个理论思维,它是我们的理论思维的不自觉的和无条件的前提。\n如果人对美的感觉是具有共性的,那么美就是可以学习的,美的学习属于艺术修养。学会审美非常重要,美可以陶冶人的道德情操,增加生活的乐趣;美可以改善人的思维品质,提高行为的素养。不仅如此,美还能激发人的创作力,许多科学家、包括数学家潜心研究学问的动力不仅仅是为了探究真理,也来自对美的追求,如数学家庞加莱所说[^267]:\n科学家之所以研究自然,不是因为这样做很有用。他们研究自然是因为能从中得到乐趣,而他们能够得到乐趣是因为它美。如果自然不美,它就不值得去探求,生命也不值得存在\n......\n我指的是本质上的美,它根源于自然各部分和谐的秩序,并且纯理智能够领悟它。\n关于科学家研究的动机与美的追求之间的关系,作为科学家的爱因斯坦说的更为生动,他在普朗克六十岁生日的庆祝会上说[^268]:\n首先我同意叔本华所说的,把人们引向艺术和科学的最强烈的动机之一,是要逃避日常生活中令人厌恶的粗俗和使人绝望的沉闷,是要摆脱人们自己反复无常的欲望的桎梏。......\n除了这种消极的动机之外,还有一种积极的动机。人们总是想以最适当的方式来画一幅简化的和易领悟的世界图像;于是他们就试图用他的这种世界体系来代替经验的世界,并来征服它。这就是画家、诗人、思辨哲学家和自然科学家所做的,他们都按自己的方式去做。\n无论数学家庞加莱所说的\"自然各部分和谐的秩序\"、还是科学家爱因斯坦所说的\"一幅简化的和易领悟的世界图像\",都涉及到自然界的规律或者事物的共性。凡是具有规律或者共性的东西,必然会存在某种支配规律或者达成共性的客观的本质属性,对于美而言,客观的本质属性就是审美的对象,引发人们从各个角度观察与追求。\n审美是一种判断,判断需要建立判断准则,对于美,判断准则就是审美标准,其中蕴含着文化、甚至蕴含着文明。虽然随着时代的变迁,人们审美的标准会有所变化,但美本身却又是相对稳定的,如同马克思在《政治经济学·导言》中所说[^269]:\n困难不在于理解希腊艺术和史诗同一定社会发展形式结合在一起。困难的是,它们何以仍然能够给我们以艺术享受,而且从某些方面来说还是一种规范的和高不可及的范本。\n这就意味着,伟大的艺术品是永恒的,彰显着永恒的美。据此可以断言,必然存在着某种美的客观本质属性,支撑着这样的永恒的美,并且这样的客观本质属性能够深刻地影响人们的审美审美标准,就像恩格斯所说的那样\"彼此一致\"。在这个话题,我们以对称美为例分析这个问题。\n自然界的对称美。在地球上,有一类非常普遍的奇特现象,这就是对称。比如,下图的左边是植物大丽花、右边是动物蝴蝶,都表现出了对称之美。画面使人赏心悦目,美的共性表现于结构的对称、也表现于色彩的对称。虽然探究成因非常困难,但追溯事物的源头,我们可以认为,自然界普遍存在的对称性是物质的和生命的基本单元性状的拓展,这就是固体物质的晶体对称结构和生物体的基因双螺旋结构。我们尝试分析这个问题。\n{width=\"2.0875in\"\n{width=\"2.8944444444444444in\"\n大丽花和蝴蝶的对称美\n晶体的对称性。自然界中的固态物质,微观结构大体可以分为三种类型,分别是晶体、非晶体和准晶体,其中绝大多数是晶体。晶体是自然界凝结形成的物体,外部形式表现为几何多面体,称为晶格,在[三维空间](https://baike.baidu.com/item/%E4%B8%89%E7%BB%B4%E7%A9%BA%E9%97%B4)中的排列具有周期性,相隔一定的距离会重复出现,比如下图是氯化钠的晶体结构。所有晶体都是对称的,按照几何形态的对称特征晶体分为晶系,一共有七类,按照对称程度的高低分为三个晶族:对称程度最高的称为[等轴晶系](https://baike.baidu.com/item/%E7%AB%8B%E6%96%B9%E6%99%B6%E7%B3%BB),包括[钻石](https://baike.baidu.com/item/%E9%92%BB%E7%9F%B3/1062)、黄金等;对称程度中等的称为六方、四方、三方晶系,分别包括冰、[锡](https://baike.baidu.com/item/%E9%94%A1/1196)、[石墨](https://baike.baidu.com/item/%E7%9F%B3%E5%A2%A8/170036)等;对称程度最低的称为斜方、单斜、三斜晶系,分别包括[碘](https://baike.baidu.com/item/%E7%A2%98/457545)、[蔗糖](https://baike.baidu.com/item/%E8%94%97%E7%B3%96)、[硼酸](https://baike.baidu.com/item/%E7%A1%BC%E9%85%B8)等。或许,这样的基本构造的对称性就是大自然的物体都展现出对称美的源头。\n{width=\"2.298611111111111in\"\n氯化钠的晶体结构:黑色为氯离子、红色为钠离子\n基因的对称性。上个世纪,生物学有两个最重要的成果,一个成果是发现了基因的双螺旋结构,另一个成果是成功测序人类DNA。下图是基因双螺旋结构的示意,1953年,两位初出茅庐的美国科学家沃森和英国科学家克里克发现了这个结构,开启了分子生物学时代。\n复制是地球上生物繁衍的基本路径。生物体能够得到延续和发展,最基本环节是生殖和发育,无论是生殖还是发育,本质上都是DNA的复制,微小到依赖寄主的支原体,高大到深山里的参天大树,再到低等动物、直至人类这样的高等动物,都是如此。而生物体能够得到进化,是因为DNA发生了突变,突变后的结果依然得到复制,是否能繁衍依赖大自然的选择,适者生存。\n{width=\"2.1118055555555557in\"\n基因的双螺旋结构\n从上图中可以看到,基因双螺旋结构就是对称的,这样的对称结构通过复制得以拓展,或许,这就是大自然的生物都展现出对称美的源头。\n数学语言的表达。因为对称给人以平衡、典雅、和谐、安定的感觉,于是人们逐渐把对称的感知演化为美的享受。进一步,人们借助数学的语言表述对称美的概念,创造数学的公式刻画对称美的规律,正如外尔所说的那样[^270]:\"对称,狭义地定义它也好,宽泛地定义它也罢,千百年来它都是人们试图借以理解并创造秩序、美和完美的一种概念。\"下面,我们尝试用数学的语言表述对称的概念、分析对称的美。关于图形的对称,初中数学涉及中心对称和轴对称两种情况。\n如前面的图所示,大丽花基本呈现中心对称,这是因为以大丽花的花心为中心,适当移动一个角度,那么花上的任意点到中心的距离保持不变,任意一个局部都可以得到同样的图形,数学语言表达这样的特性为旋转变换,通过旋转变化得到的图形呈现中心对称;蝴蝶的对称是通过反射变换得到的,反射变换得到的图形呈现轴对称,比如蝴蝶身体的中心线是对称轴,在蝴蝶画面的左边任取一点作对称轴的垂线、延长相同的距离可以得到颜色花纹类似的点。可以看到,无论是旋转变换还是反射变换,图形上任意两点间的距离都保持不变,因此,对称就是物体在某种变换下保持不变的一种性质。\n对于对称的度量。数学的本质在于度量,那么,应当如何度量对称呢?这就需要制定一个指标,利用这个指标刻画图形的对称程度。凭借直观我们可以认为,正八边形比正方形更对称、正方形比正三角形更对称、正三角形比等腰三角形更对称、等腰三角形比一般三角形更对称。这样,要刻画一个平面图形A的对称程度,用S(A)表示保持图形形状不变变换的全体形成的集合,称这样的集合为对称集,用|S(A)|表示对称集合元素的个数,|S(A)|越大则图形越对称。那么,对于一般的三角形,只有静止才可能保持形状不变,只有一种情况,因此|S(A)|=1,也就是人们所说的不对称;对于等边三角形,既是中心对称又是轴对称,各有三种情况,因此|S(A)|=6;对于圆,绕圆心旋转任意角度都保持形状不变,因此|S(A)|=∞,说明圆是平面上最对称的图形。\n基于变换的表达。但是,复杂情况下的对称,用上面的直观加操作的方法就会力不从心,比如,计算前面图中所示氯化钠晶体结构对称集合元素的个数。因此,需要创造出一种更为一般的、更为便捷的数学表达,这就是群论。数学家在研究高次方程解的过程中发现了解的对称性,如问题12所讨论的那样,法国数学家伽罗华和挪威数学家阿贝尔相继提出了群的概念,用以研究方程求根公式存在的充分必要条件,比如,与方程解有关的变换是置换解的下标,于是人们称这样的群称为置换群。\n这样,如果把几何图形的变换转化为数字位置的交换,就可以大大化简对称问题的表达与分析,用群的语言予以表述,比如用群的语言表述氯化钠晶体结构的对称性。正因为对称问题的研究极为重要,因此现代群论已经成为代数学的一个重要分支,分别是人们认识、理解和表示现实世界对称性的重要思想、有效工具和精确语言。\n话题26 海量数据、大维数据、大数据\n现今社会,大数据这个概念已经被广泛使用,如问题30所述,现在人们所说的\"数据\"是指信息的数字化,这里所说的\"大\"是指现今世界信息的庞大而杂乱。大数据这个词起始于2010年左右,至今为止也只有10多年的时间,但这个概念得到如此传播,可见那些各种各样的、有用没用的信息对人们生活影响之深。\n海量数据。在最初的阶段,人们称大量的数据为海量数据。第二次世界大战后,随着经济的腾飞,科学技术得到强有力的发展,特别是到了上个世纪末、这个世纪初,由于各种检测技术和计算机技术的飞速发展,几乎对于任何事物,人们都可以在较短的时间内获取大量的数据。\n比如生物学,世纪之交,人类第一次破译人体基因密码用了十多年的时间,得到了人体基因三十亿个碱基对的排列,而时隔二十多年的今天,完成这个工作只需几天的时间;再比如天文学,美国2000年启动名为\"斯隆\"的数字巡天(SDSS:Sloan\nDigital Sky\nSurvey)项目,设立在新墨西哥州阿帕奇山顶上的天文台有一个口径约为2.5米的望远镜,设立后的短短几周内收集到的数据竟然比天文学历史上收集到数据的总和还要多;在今天,包括所谓天眼在内的网络数据更是如此,有用没用的数据以爆炸的方式增长。于是,人们称这样的数据为海量数据,一是说数据如海潮般不断涌现,二是说数据如海水般无穷无尽。这样的背景,对信息科学、计算科学、以及统计学提出了挑战:如何在短时间处理海量数据、获取数据提供的信息、形成数据蕴含的知识。\n大维数据。统计学的核心是处理数据,为了研究变量之间的关系,向量形式的数据非常重要。这样的研究起源于英国科学家高尔顿的工作,为了研究子女的身高与双亲身高之间的关系,1885年,高尔顿征得205对夫妻与他们938个成年子女的身高,经过对数据的认真分析,高尔顿发现虽然有父母高儿女也高、父母矮儿女也矮的趋势,但有一个值得深入思考的现象,这就是,父母越高则子女高过父母的可能性要小于父母身高偏低则子女高过父母的可能性。于是高尔顿猜想,这应当是大自然的一个普遍规律,子代平均身高向父辈平均身高回归。后来,高尔顿的学生、现代统计学的奠基人皮尔逊用数学的语言表达了这个定律,证明了定律的合理性,并且发展了高尔顿提出的相关和回归的概念,这些概念已经成为现代统计学的基本概念[^271]。对于这样的研究,数据必须是成组出现的,也就是说,双亲和他们子女的数据必须以一个向量的形式出现。传统向量数据的维数很少超过五十维的,并且向量数据的个数要远远超过向量的维数,在这种情况下,统计学创造了一套精密的数据分析的理论与方法。\n但是,基因数据的出现,使得数据骤然上升到万维以上,这样就出来了大维数据的问题。后来,随着人们对随机现象决策提出了精度的要求,需要把各种信息统筹考虑,比如,需要统一研究水文、气象、地质等数据;再比如,精准医疗方案的提出、精准扶贫方案的提出等等,都极大地扩充了数据的维数。对于这样的数据,向量数据的个数往往会小于、甚至远远小于向量的维数,于是,人们称这样的数据为大维数据。显然,传统的统计学的理论和方法不再适用于大维数据的分析,因此,不仅仅是对统计学,也对信息科学和计算科学提出了挑战。\n大数据。这个世纪,与信息有关的事物发生了根本性的变化,主要是网络信息的出现,包括网络平台发布的信息、电商的广告信息、监测网点提供的信息,还包括企业管理、医疗机构、政府服务发布的信息,更包括个人计算机和手机上传的信息。于是,我们在问题30所讨论的数字化的问题就变得越来越重要,甚至许多国家的政府直接干预数字化的进程;出现了文本数据、图像数据、音像数据等,各式各样的数据层出不穷,这样的数据不仅量大、并且维数高,是海量数据时代不可比拟的。这样,人们干脆不加任何形容地称这样的数据为大数据(Big\nData)。\n2008年9月发刊的《自然(Nature)》杂志上,同时刊登了近10篇讨论大数据的文章,引起人们对于大数据的广泛关注。2011年2月发刊的《科学(Science)》杂志,以\nDealing with data\n为封面,刊登一系列文章探讨如何处理大数据的问题;同年的12月,该杂志又刊登了一系列文章讨论如何刻画数据之间的关联。\n2012年,美国政府启动了\"大数据研究和发展计划\"项目,该计划涉及国家科学基金、国家卫生研究院、能源部、国防部、国防部高级研究计划局、地质勘探局六个联邦政府部门,旨在提高从大数字数据中提取知识的能力,\n加快科学与工程发现的步伐,,加强美国安全和实现教学变革。同年在中国,由国家自然科学基金委员会和中国科学院联合发布《未来10年中国学科发展战略·数学》,提出在统计学与海量数据分析方面,优先发展由网络复杂结构所产生的高维、海量数据驱动的统计分析与建模方法。于是,大数据这个新的词汇开始在全世界流行起来,逐渐被人们理解,正在影响着人们传统的思维模式,正在改变着人们的处事原则和处事方法。\n下面,我们通过对网络数据的分析,感悟大数据的基本特征,直观认识大数据的特征提取与传统数学的差异。由数据产生的方式不难想象,网络数据有以下三个重要特征:\n数据价值稀疏。无论是主动产生的网络数据,比如博客、微信等,还是自动产生的网络数据,比如手机轨迹、视频监控等,都会产生庞大的数据集。可以想象,这样的背景必然造成数据混杂冗余,使得数据价值密度低,呈现出稀疏特性。调查报告显示,当今社会每天产生\n25亿 GB 以上数据,但只有不到 0.5%\n的数据具有分析价值。事实上,凭借生活经验我们也能理解这样的特色,每天不断地删除手机上的信息就充分地说明了这一点。\n分析这种非结构化文本的第一步,是将数据表示为超高维结构化向量,这样的向量是极其稀疏的、也就是说、这样的向量大部分维数上的数字都是0;这也就是意味着,由这样的向量形成的表示数据之间关联的相关矩阵,虽然维数非常大,但大部分元素为0,只有很少的指标包含对预测或分类有价值的信息。于是,人们称在这样的数据中提取信息为数据挖掘。\n数据结构复杂。数据结构的复杂性主要来自三个方面。首先是因为网络结构复杂,网络结构刻画了社交网络中的个体之间的联系,不仅个体各种各样、并且联系方式五花八门,难用简单模型进行表示;其次是因为网络数据类型复杂,既包含结构化数据(诸如年龄、性别等),也包含非结构化数据(诸如文本,图片等),即便是进行数字化处理,也很难用传统的矩阵予以表达;最后是因为网络数据关系复杂,既有别于传统数据中的时间序列,也有别于自然距离刻画的空间相关,很难用统一的形式表述数据之间的关联。因此,有学者认为[^272]:大数据就是\"海量数据 +\n复杂结构\"。这样,就需要重新理解互联网时代人和人,人和物、物和物之间的相依关系,并且进行相应的数学表达与度量。\n数据多源动态。各种物联网络结构和社交网络结构,打通了不同的信息平台,连接了不同的数据资源,形成了网络数据的多源性特征,虽然大部分数据是非主动自动生成的,但瞬间主动生成的源头不明的数据会形成数据漩涡。网络数据的动态性主要体现在:以数据流的方式涌现,比如网络购物;以轨迹移动的方式显现,比如GPS定位提供的轨迹数据;以网络结构的变化的方式呈现,比如新朋友的随机加入和老朋友的随机离开,导致网络结构随着时间而改变。对于这些类型的数据,不可能把所有的数据都收集以后再进行整理和分析,而需要实时进行。这样,就进一步说明问题28讨论的分步式计算的重要性,当然,还涉及到与之配套的数据的分仓储存。\n以上特征不仅对经典统计学提出了挑战,也对数学的计算科学和动态模型的构建提出了挑战。可以想象,这些挑战涉及到信息安全,更涉及到基于高科技的、特别是与信息科学和人工智能有关的的经济发展,因此,这样的挑战更是发展的机遇。\n话题27 信息的数学度量\n我们在问题30讨论了信息数字化的方法与格式,在上一个话题讨论了各种信息所转化的数据的形式和特征,这个话题讲讨论信息的数学度量。\n我们首先讨论:什么是信息,这涉及到信息的本质特征。随着信息技术的飞速发展,人们获取、管理和分析信息的能力不断提高,信息技术的应用越来越广泛,人们纷纷从本专业的角度、利用本专业的话语定义信息,以至于不同行业之间很难达成共识。为此,我们需要追溯创立者最初的关于信息的思考和表达,感悟其中所蕴含的信息的本质特征。\n1928年,美国数学家哈特莱发表了关于信息表达的第一篇文章,提出信息定量化的初步设想[^273];1948年,维纳写出专著研究能够适应接受和加工信息统计性质的控制系统[^274];同年,[香农](https://baike.baidu.com/item/%E9%A6%99%E5%86%9C/1146248)发表的论文《通信的一个数学理论》奠定了信息论的基础[^275]。\n他们一致认为,信息源发出的信息是随机的。或者更确切地说,信息源发出的信息本身是确定的,但对于信息的接受者,在未收到信息之前,不能确定信息源发出的信息是什么,因此是随机的。基于这样的特征,人们研究通信系统的目的,就是要使接收者在接收到信息后,尽可能多地排除信息的不确定性,尽可能准确地还原信息源发出的信息。这就是人们研究信息的本意,为了使这样的研究成为可能,首先需要解决的问题是,如何用数学的语言刻画信息。\n比特:二选一所需信息。显然,最简单的、也是最基本的信息形式,是在两个可能结果中随机选择一个结果的记录,其中随机是指选择两个结果的概率相等,正如维纳所说的那样[^276]:\"单位信息量就是对具有相等概率的二中择一的事物作单一选择时所传递出去的信息\"。比如,抛掷一枚质地均匀的硬币,对于选择正面或者背面作记录,如果选择正面记为1选择背面记为0,那么一次选择就是1或者0。称这时所需要的信息量为1比特[^277],表示为Log~2~2=1。\n可以思考这样的问题:如果在1到64的自然数中设定一个数,那么,一个人能够选择到这个数需要的信息量最少是多少呢?这是一个连续的二中择一的问题,可以设计这样的连续提问,问题一:这个数是小于等于32、还是大于32,前者记为0、后者记为1,需要1比特的信息量;如此这般依次折半问询,那么只需要问询六次就可以知道所设定的数,对应的记录可以表示为\n,\n其中 a~k~ = 0或者1,k = 1,...,6。所需信息量为6比特,表示为Log~2~m =\n6,其中m = 2^6^。这就是哈特莱最初的表达。\n信息熵:以概率为权的加权平均。后来,维纳和香农等数学家借用统计力学的表达方式,用概率熵刻画信息量。比如,如果用n表示所有可能结果的个数,用P~k~表示第k个信息出现的概率,那么可以把信息量表示为\n\n的形式,称这样的表达为信息熵。\n仍然考虑\"在1到64的整数中设定一个数\"的问题,上述表达式中的n = 2^6^ =\n64,因为所有的概率都相等,即p~k~ = 1/64,因此可以把信息熵表示为\n\n的形式,通过计算可以得到信息量为 6\n比特。后来,人们用自然对数替代了以2为底的对数,并且把随机变量的取值由离散拓展到连续的情况,进而把信息熵求和的形式拓展到积分的形式。\n在信息熵的基础上,人们又构建了一种基于熵的距离,称为相对熵或者K-L距离[^278],用以度量获取信息与原始信息之间的差异,离散型和连续型分别表达为\n\n和\n\n的形式,其中P和Q表示概率分布,f(x) 和 q(x) 表示对应的密度函数。\n显然,对于任何概率分布,K-L距离均不为负;当P = Q或 f =\ng时K-L距离为0;因此,K-L距离越小说明两个概率分布越接近。通过计算可以知道,K-L距离不满足对称性和三角不等式,即便如此,人们依然称这样的表达为距离,用以度量信息之间的差异,特别是,作为判断两种信息接受方法好坏的工具。作为说明,分析下面的例子。\n假如一个信息源随机发出0和1两种字符,发出的概率分布为H,有两种信息处理方法得到的概率分布分别为P与Q。如果具体的概率分布如下:\nH(0) = H(1) = 1/2;\nP(0) = 1/4,P(1) = 3/4;\nQ(0) = 1/8,Q(1) = 7/8;\n那么,凭借直观感觉可以认为,对应于概率分布P的信号处理方法要优于对应于概率分布Q的。现在,分别计算二者与信号源H的K-L距离,可以得到:\n\n和\n。\n因为对数函数是单调增函数,因此d(H,Q) >\nd(H,P)。这样,就从量化的角度得到了与直观感觉一致的结论,这也说明利用相对熵的度量是有意义的。\n人们在日常生活和社会生活中,往往需要对随机发生的事情进行决策,通常称为随机决策;毋庸置疑,随机决策最可靠的依据是数学度量、或者说、概率估计。比如,下雨可能性的度量、即下雨概率的报道,已经成为天气预报的常识;道琼斯指数、日经指数、上证指数等,是针对纽约股市、东京股市、上海股市股价变化的度量,这样的度量已经成为人们抛售或者购买股票的基本依据,甚至成为预测国家经济状况的参考。再比如,基于国民生产总值的递增率,已经成为人们衡量经济发展的重要指标;度量食品支出占个人消费支出总额比重的恩格尔系数,已经成为衡量生活水平的指数[^279]。国家政策的制定也是如此,比如,我国2018年颁布的\"蓝天计划\"所设定的指标[^280],已经成为各省和直辖市治理雾霾的基本标准。\n正因为如此,如问题26说讨论的那样,《义务教育数学课程标准(2022年版)》把百分数移到\"统计与概率\"领域,并且通过具体的例子讨论了简单的随机决策问题,让学生从小感悟,在日常生活和社会生活中,大量的问题需要做出随机决策,而不都是传统数学所表述的确切性和绝对性。\n话题28随机指标的数学表达\n比上一个话题讨论的信息的度量更进一步,人们还对现实生活中众多随机现象发生的程度,用数学的语言、或者更确切地说、用基于概率的公式进行度量,并且称这样的度量为随机指标。我们先讨论一个具体问题,从中感悟随机指标的意义,然后再讨论随机指标产生与发展的过程。\n生物多样性指标。工业化的高速发展使得人类的物质生活水平得到了极大提高,但是,也让我们感知到这样的发展带来的副作用,这就是对自然资源的过渡开发、对生态环境的无情破坏。因此,后工业时代的显著特征就是:寻求新型能源、保护生态环境。\n保护生态环境的一个重要指标就是生物多样性,为此,人们需要构建描述生物多样性的数学模型,基于这样的数学模型量化定义生物多样性指标。在一般情况下,某个生物物种的出现是随机的、或者、发现是随机的,因此,用以描述生物多样性的数学模型应当是一个随机模型,也就是说,得到的结论不是必然成立、而是或然成立。我们讨论两个最重要的生物多样性指数,一个是香农-维纳多样性指数,另一个辛普森多样性指数。\n香农-维纳多样性指数。从名称就可以知道,这个多样性指数涉及到两位著名的美国数学家,其中香农是信息论的创始人,维纳是[控制论](http://baike.baidu.com/view/62820.htm)的创始人。这两位数学家所创建的这两个学科在现代数学、甚至在现代科学都占有重要的的地位,并且,伴随着大数据分析、人工智能日新月异的发展,这两个学科更是推陈出新、生机勃勃。\n假设一个群落有n个物种,其中第k个物种存在的概率为p~k~,即表示在群落中随机取一个个体,这个个体属于第k个物种的概率,香农-维纳多样性指数表示为\n\n的形式。可以看到,这个表达与上一个话题讨论的信息熵的表达是一致的,只是把以2为底的对数改为自然对数。因为概率取值于0和1之间,上式中的对数值均不为正,因此式子前面的负号是为了保证香农-维纳多样性指数的非负性。基于表达式可以认为,香农-维纳多样性指数是一个权为概率的加权平均,是最简形式的随机模型。\n下面,我们分析香农-维纳多样性指数的合理性。凭借直觉可以认为,生物多样性指数应当随着群落中物种个数的增加而变大;如果物种个数确定,那么这些物种的个数相对均衡时达到最大。通过简单计算可以发现,香农-维纳多样性指数恰到好处地刻画了这样的直觉:当n\n=\n1时、即群落物种个数最小时H取最小值0;随着群落物种个数n的增加,H值也逐渐增加;如果群落物种个数n确定,那么这n个物种的个体数量以相同概率存在时、即p~1~\n= ... = p~n~ 时H取最大值。\n但在一般情况下,我们不可能知道群落物种的概率,需要通过抽样的方法进行估计,因此生物学者进行野外调查只能采用抽象的方法。如果在一个群落抽取了M个样本,发现其中有n个种群,第k个种群数量为M~k~,k\n= 1,...,n,那么,香农-维纳多样性指数估计可以表示为[^281]\n\n的形式,在上面的表达式中,仍然采用问题25所述说的规定,用大写字母表示随机变量,用小写字母表示随机变量的取值。\n下面通过具体的数值计算,直观分析香农-维纳多样性指数。思考这样的问题,有三个群落分别表示为A、B、C,每个群落都有两个种群,分别表示为甲和乙,对应概率分别为p~1~和p~2~,尝试用香农-维纳多样性指数对这三个群落生物多样性进行度量。\n首先,我们要进行随机抽样,假设在这三个群落都随机获得100个个体,这些样本组成如下:\n群落A,甲50、乙50;群落B,甲80、乙20;群落C,甲100、乙0。\n依据直觉,可以认为群落A的生物多样性最好,群落B次之,群落C最差。那么,用香农-维纳多样性指数的计算结果如何呢?其次,进行三个群落的概率估计,分别为:\n群落A:p~1~ = 50/100 = 0.5,p~2~ = 50/100 = 0.5;\n群落B:p~1~ = 80/100 = 0.8,p~2~ = 20/100 = 0.2;\n群落C:p~1~ = 100/100 = 1,p~2~ = 0/100 = 0。\n把三组估计值代入香农-维纳多样性指数,因为\nln0.5 = -0.69,ln0.8 = -0.22,ln0.2 = -1.61,\n最后得到香农-维纳多样性指数分别为:\nH~A~ = (-0.5) ln0.5 + (-0.5) ln0.5 = 0.69;\nH~B~ = (-0.8) ln0.8 + (-0.2) ln0.2 = 0.50;\nH~C~ = 0。\n可以看到,如果群落中种群数量越趋于均衡,香农-维纳多样性指数越大,种群数量差异越大,香农-维纳多样性指数越小,这与我们的直觉是一致的。\n香农-维纳多样性指数源于香农信息熵。熵是一个物理学概念,是对体系混乱程度的度量,1850年,德国物理学家[克劳修斯](http://www.baike.com/wiki/%E9%B2%81%E9%81%93%E5%A4%AB%C2%B7%E5%85%8B%E5%8A%B3%E4%BF%AE%E6%96%AF)最早提出熵的概念,是以参数形式提出的,这就是热力学第二定律引出的反映自发过程不可逆性的物质状态参量。1948年,[香农](http://www.baike.com/wiki/%E5%85%8B%E5%8A%B3%E5%BE%B7%C2%B7%E8%89%BE%E5%B0%94%E4%BC%8D%E5%BE%B7%C2%B7%E9%A6%99%E5%86%9C)将这个概念引入信息论[^282],在最初形式中对数是以2为底的,相应计量单位被称为比特。后来,熵这个概念逐渐在信息论、[控制论](http://www.baike.com/wiki/%E6%8E%A7%E5%88%B6%E8%AE%BA)、[概率论](http://www.baike.com/wiki/%E6%A6%82%E7%8E%87%E8%AE%BA)、[数论](http://www.baike.com/wiki/%E6%95%B0%E8%AE%BA)、[天体物理](http://www.baike.com/wiki/%E5%A4%A9%E4%BD%93%E7%89%A9%E7%90%86)、[生命科学](http://www.baike.com/wiki/%E7%94%9F%E5%91%BD%E7%A7%91%E5%AD%A6)等领域都得到了重要应用。\n辛普森多样性指数。是英国统计学家辛普森提出的[^283],一类表达形式更为简单的生物多样性指数,对应的模型也是随机模型。顺便提及,辛普森以著名的辛普森悖论闻名统计学界[^284]。\n辛普森多样性指数与香农-维纳多样性指数使用数学语言描述的事物背景基本一致,假设一个群落有n个物种,第k个物种存在的概率为p~k~,辛普森多样性指数表示为\n\n的形式。因为,当k = 1时S取最小值 0,当p~1~ = ... = p~n~\n时,S取最大值,这与香农-维纳多样性指数是一致的。同样的道理,在一般情况,需要使用辛普森多样性指数的估计,可以写成\n\n的形式。下面,我们利用同样的数据,计算辛普森多样性指数,并且与香农-维纳多样性指数的计算结果进行比较。计算如下\nS~A~ = 1 -- [0.5^2^ + 0.5^2^] = 0.50;\nS~B~ = 1 - 0.8^2^ - 0.2^2^ = 0.32;\nS~C~ = 1 -- 1 = 0。\n可以看到,两个多样性指数得到的多样性排序是一致的,但可以看到,辛普森多样性指数的计算更加简洁。辛普森多样性指数中计算估计值平方的方法,在统计学中是具有一般性的,这样的方法与数学分析中的台劳展开有关,因为在统计学中,最通常使用的估计是最大似然估计,如果把这个估计在真值处进行台劳展开,那么第一项为0,第二项恰好是平方项。\n话题29 数学的抽象结构与模式\n世纪之交,随着计算机技术和信息技术的发展,人们对数学的认识发生了质的变化,甚至,数学家还创造了两个新的名词、构建了两个新的概念,用于表征他们所认识的发生了质变的数学形态。一个概念是抽象结构,用以表征数学的研究对象,一个概念是数学模式,用以表征数学的研究结果。在这个话题,我们简要讨论这两个概念的内涵及其对数学影响,特别关注对数学教育产生的影响。\n抽象结构。在《普通高中数学课程标准(2017年版)》和《义务教育数学课程标准(2022年版)》中,都提到了抽象结构这个概念,缘由是这样的。\n高中课程标准的修订始于2014年,那个时候我作为数学天元基金的评审专家,参与国家自然科学基金委员会撰写中国数学未来发展报告的工作,在阅读有关材料时第一次接触到抽象结构这个概念[^285]。虽然这个概念原本是为了表述数学研究的基础与未来发展,但根据我的理解,还是尝试把这个概念用于我国基础教育阶段的数学教育,于是,就出现在《普通高中数学课程标准(2017年版)》的课程性质中,表述为:\n数学是研究数量关系和空间形式的一门科学。数学源于对现实世界的抽象,基于抽象结构,通过符号运算、逻辑推理、模型构建等,理解和表达现实世界事物的本质、关系和规律。\n但因为没有想的很清楚,于是整个课程标准、包括课程标准的解读,都没有对抽象结构这个概念做出任何解释。直到2020年左右再次修订义务教育数学课程标准,才对抽象结构这个概念有了较为深入的理解,借助\"互联网\n+\"的表达形式,把抽象结构这个概念具体表述为\"研究对象\n+\"的形式,其中\"+\"的内容可以是研究对象的性质或者关系。于是在《义务教育数学课程标准(2022年版)》的课程理念述说五个问题,第二个问题的题目就是\"设计体现结构化特征的课程内容\",在课程内容组织中强调\"重点是对内容进行结构化整合\"。\n为了体现\"研究对象\n+\"的课程结构,课程标准特别强调了数的认识和运算的一致性,比如,小学数学\"数与代数\"领域,把传统的六个主题浓缩为\"数与运算\"\"数量关系\"两个主题,提出\"数的概念本质上的一致性\"\"数的运算本质上的一致性\"的要求;在\"图形与几何\"领域,把\"图形的认识\"与\"图形的测量\"的内容合并为\"图形的认识与测量\"一个主题[^286]。\n需要进一步强调的是,这样的表达与大学数学的结构化是一致的。比如,如果用集合表示所要研究对象的全体,那么:\n\"集合 + 运算律\"形成了环、群、域等基于不同运算律的抽象代数;\n\"集合 +\n测度\"形成了实变函数、泛函分析、概率论等基于不同测度的数学分析的分支;\n\"集合 +\n距离\"形成了欧式空间、巴拿赫空间、希尔伯特空间等基于不同距离的几何空间;\n\"集合 +\n平行线公理\"形成了欧几里得几何、罗巴契夫斯基几何、黎曼几何等基于不同平行线公理的几何形态。\n可以看到,对于数学的研究,这样的基于抽象结构的认识是非常本质的,因为数学研究对象本身的存在性并不重要,重要的在于研究对象的性质、以及研究对象之间的关系与运算,正如我们在问题1中所讨论的那样。\n数学模式。数学模式是上个世纪末逐渐形成的一个新概念,这个概念的出现伴随着计算机技术的迅猛发展,伴随着海量数据分析的需要。以至于有许多学者认为,数学就是一门关于模式的科学[^287]。美国数学教育家斯蒂恩曾经专门著文论述模式的科学,文中是这样述说[^288]:\n数学通常被定义为关于空间与数量的科学,就像扎根于几何与算术那样。虽然现代数学的广泛性已经远远超出了这个定义,但直到近年来由于计算机与数学的协同发展,一个更加灵活的定义才逐渐明晰起来。\n数学是模式的科学。数学家寻求数量、空间、科学、计算机、以及想象中的模式。数学理论则解释了模式之间的关系,函数和映射、算子和同态把一类模式转化为另一类模式,产生了近来的一些数学结构。数学的应用就是用这些模式来解释和预测适合于这些模式的自然现象。模式又提出其他模式,产生模式的模式。数学以这样的方法遵循着自己的逻辑:起始于科学的模式,完成于那些累加起来的、由初始模式推导出来的所有模式。\n......\n因为计算机,我们可以比以往更加肯定数学发现类似于科学发现。它开始在数据中寻求模式:数据或许是数、但更经常是几何或者代数结构。这样的推广引发抽象,导致思维的模式。理论则作为模式的模式,其重要性取决于一个领域的模式与其他领域模式的关联度。具有最大解释能力的精巧的模式成为最深刻的结果,构成全部子学科的基础。\n基于上面的论述,数学模式与抽象结构关联密切,正如这个话题一开始所述说的那样:抽象结构用以表征数学的研究对象,数学模式,用以表征数学的研究结果。二者相容,才形成了数学。在上面的表述中,有一个说法应当引起我们的思考,这就是最后一段起始所述:因为计算机,我们可以比以往更加肯定数学发现类似于科学发现。\n在本质上,数学与科学一样,研究的问题最初都是源于现实、形成的概念最初都是出自经验、得到的结论最初都是基于想象,差别只在于验证结论的方式不同,科学是通过现实验证、包括观察也包括实验,数学是通过思辨验证、依赖的是演绎推理。但是,数学发展到一定阶段,自然而然地要进行基于逻辑的、而不是基于现实的第二次抽象,比如,通过自然数和三维空间进一步抽象出实数和高维空间的概念、通过数的运算法则进一步抽象出矩阵与四元数的运算法则、等等,甚至可以抽象出完全没有背景的集合概念,以及基于这些研究对象想象出来的结论。因此,上文中所说的数学发现是指基于第二次抽象发现的研究对象和数学结论。这句话的总体意思是,随着计算机技术的发展,这样的数学发现也将会转化于基于数据的发现,这里所说的数据主要是指几何结构或者代数结构。\n回顾话题26的讨论可以知道,上文对于大数据的理解是不确切的,因为在本质上,大数据不具备结构性,大数据更像我们观察到的现实世界本身,杂乱无章、随机飘摇,而所谓的结构完全是人抽象的结果。因此,更确定地表达应当是,现代计算机所表现出来的越来越强大的功能,以及与此关联的包括人工智能、机器学习在内的信息科学飞速发展,引发数学发生了本质性的变化,使得数学的发现更加类似科学的发现。\n统计学、计算科学、甚至包括一部分数学,正在、并且加速改变传统的研究流程,使得:研究的对象不再是那些抽象了的东西,而是现实世界中的那些实实在在的数据;研究的目的不再是在公理体系中发现某些必然存在的结论,而是通过数据提炼信息,发现事物的性质、事物与事物之间的关联;研究的前提不再是那些想象出来的假设,而是产生数据的现实背景、以及其中蕴含的规律;验证结论的方法也不再是基于演绎推理的思辨,而是参照那些基于同样背景和规律产生的数据。\n这因为如此,我们可以采纳斯蒂恩的建议:数学的研究应当更加关注模式。数学模式类似于数学模型、但又不完全等同于数学模型,相同之处在于:二者都是基于数学语言的一般化的东西,都可以作为认识、理解、表达问题的思想和方法;不同之处在于:数学模式针对的是数学内部,可以作为认识、理解、表达数学问题的思想和方法,数学模型针对的是数学外部,可以作为认识、理解、表达现实问题的思想和方法。因此,一个好的数学模式可以适用于一批数学模型,或者更确切地说,可以作为构建一批数学模型的数学语言。比如初中数学中的方程和函数,都可以构成数学模式,但基于数学模式的数学教学,不仅仅要重视知识和技能,更要重视各种背景下的应用,从中感悟数学语言的一般性,理解数学语言所承载的数学思想。在下面一个话题,也是最后一个话题,我们讨论数学模型,在讨论的过程中将会更加深入地分析什么是数学模式。\n话题30 数学模型是用数学的语言讲述现实世界的故事\n数学模型与数学应用是有区别的。数学应用的范围相当宽泛,可以泛指用数学的概念、原理和方法解决现实世界的所有事情,既可以包括日常购买的斤斤计较,也可以包括人造卫星的轨道设计。虽然数学模型属于数学应用的范畴,但更侧重于用数学的概念、原理和方法描述现实世界中的那些规律性的东西。更加通俗地说,数学模型就是用数学的语言讲述现实世界的故事,其中所说的数学语言主要是指上一个话题所讨论的数学模式。\n作为数学语言的数学模式,大体上可以分为两类:一类是基于文字表达的,包括数学定义和命题,这类模式可以用来指导如何构建、理解数学的概念和定理;一类是基于算式表达的,包括一些函数和方程,这类模式可以用来启迪如何提出、解决数学问题。因为数学模式是构建数学模型的本原,所以有时也把数学模式直接称为数学模型,比如线性模型、广义线性模型等等。\n数学模型的两个出发点。既然数学模型是用数学的语言讲述现实世界的故事,那么构建数学模型就需要从数学和现实这两个出发点开始,基于这两个出发点,规划研究路径、构建描述用语、验证研究结果、解释结果含义,最终得到与现实世界相容的、可以描述现实世界规律的结论。\n这样,数学模型的研究就不完全属于数学的范畴,大多数应用性很强的数学模型的命名,都依赖于所描述的学科背景或现实背景。比如,在生物学中:种群增长模型,基因复制模型等等;在医药学中:专家诊断模型,疾病靶向模型等等;在气象学中:大气环流模型,中长期预报模型等等;在地质学中:板块构造模型,地下水模型等等;在经济学中:股票衍生模型,组合投资模型等等;在管理学中:投入产出模型,人力资源模型等等;在社会学中:人口发展模型,信息传播模型等等。在物理学、化学这些传统的自然科学领域,各类数学模型更是百花齐放。\n因此,数学模型的教学,应当尽可能地让学生经历构建数学模型的全过程,至少要经历这样三个步骤,一是经历基于现实的抽象过程,理解现实问题的关键所在、包括变量以及变量之间的数量关系,建立构建数学模型的基本准则,让学生体会如何用数学的\"眼光\"观察现实世界;二是基于基本准则,选取或者创造合适的数学语言表达变量以及变量之间的数量关系,形成数学模型,让学生体会如何用数学的\"思维\"思考现实世界;三是计算数学模型得到结果,尝试用结果解释现实问题,在这样的过程中判断数学模型的合理性、学会修正数学模型,让学生体会如何用数学的\"语言\"表达现实世界。当然,还要在这样的教学过程中增强学生学习数学的兴趣和学好数学自信心。\n数学模型的验证与价值。正因为数学模型的出发点不仅仅是数学,因此,验证数学模型正确与否的方法也不仅仅是数学的论证,判断数学模型的价值取向也不在于数学表达的难易程度。事实上,与科学结论的验证类似,数学模型正确与否的验证更侧重于对现实问题的解释,数学模型的价值更体现于描述现实世界的作用。一个最现实的说明就是,那些获得诺贝尔经济学奖的数学模型,关注的并不是模型的数学价值,而是模型的应用价值。下面,分别通过自然科学中和社会生活中的例子进行说明。\n自然界中的数学模型。我想,第一个真正的数学模型应当是伽利略的自由落体模型。伽利略不仅对物理学的发展做出了杰出的贡献,更重要的是,伽利略创造了全新的物理学的研究方法,正是因为这样的改变,现代意义的科学诞生了。关于这一点,爱因斯坦说的非常明确[^289]:\n纯粹的逻辑思维不能给我们任何关于经验世界的知识;一切关于实在的知识,都是从经验开始,又终结于经验。用纯粹逻辑方法得到的所有命题,对于实在来说是完全空洞的。由于伽利略看到了这一点,尤其是由于他向科学界谆谆不倦地教导这一点,他才成为近代物理学之父,事实上,也成为整个近代科学之父。\n下面,我们通过人们对引力的认识和研究,分析爱因斯坦为什么说伽利略是近代科学之父。在伽利略之前,人们思考的问题是:为什么会有引力。比如,亚里士多德在《物理学》中探讨引力的缘由[^290]:\n一切感觉到的物体都或重或轻,并且,如果是重物体,自然就移向中心,如果是轻物体,自然就移向上面。......\n但是,它们被何物所运动现在还不清楚。\n亚里士多德所说的\"中心\"是指\"地心\"。亚里士多德的研究引力的方法,就是爱因斯坦所说的\"用纯粹逻辑方法得到的所有命题,对于实在来说是完全空洞的。\"那么,伽利略是如何研究的呢?在划时代的著作《关于两门新科学的对话》之中[^291],伽利略借助萨尔维亚蒂之口说[^292]:\n看来现在不是研究自然运动加速度原因的合适时候,对这个问题不同的哲学家表达了各式各样的意见,有些人解释为向心的吸引力,另一些人解释为物体非常小的部分之间的斥力,而还有些人归诸于周围介质的某些压力,这些介质随后包围落体而驱赶它从一个位置到另一个位置。现在,所有这些和其他的离奇的想法都应当受到考察,但是实在不值得(为这种事情)花费时间。\n伽利略这里所说的\"自然运动加速度\"是指地球引力所产生的加速度,也就是我们现在所说的自由落体加速度、或者、引力加速度。伽利略说的非常正确,不应当产生引力加速度的\"原因\",因为即便是到了科学技术发展到相当程度的今天,我们依然说不清楚引力到底是什么,更说不清楚为什么会有引力,虽然早在16世纪开普勒就计算了太阳系内受太阳行星的椭圆轨道,17世纪牛顿万有引力定律就告诉我们宇宙中引力无处不在,二十世纪初叶的1916年爱因斯坦广义相对论描绘了引力场空间的弯曲,100年后的2015年美国两所大学的科学家观察到了引力波的存在。\n伽利略根本上改变了引力的研究方向和路径:研究和证实加速度的性质、加速度与物体运动规律之间的关系,而不探究加速度产生的原因。这就是说,科学研究应当关注自然现象性质和规律,而不应当关注人类自身的逻辑思考。可以如下,大体描述伽利略所创立的现代科学的研究路径:通过现象分析建立假说,借助数学语言表达假说,通过观测或者实验验证假说。可以看到,伽利略对数学语言情有独钟,他曾经感叹地说[^293],宇宙这本书是用数学语言写的。\n遵循自己创建的研究路径,伽利略开始了自由落体模型的构建。伽利略假设了一个基本事实:物体下落的速度随下落的时间的增加而增加。也就是说,在没有干扰的情况下,物体下落的速度越来越快,后来人们称这样的速度为重力加速度。虽然假设源于观察产生的直觉,但如同下面将要讨论的那样,伽利略最终通过实验验证了这个假设。现在,人们称这个加速度为重力加速度,与物体所在引力场有关,在地球上大约为9.8米/秒^2^,在月亮上大约是地球的1/6。\n伽利略想象了一个理想情境:物体的下落速度与物体的形状和质量无关。可以想象,这样的情境只能在真空中实现。这样,伽利略通过假设和想象,建立了关于自由落体的假说,在真空情况下,自由落体下落的距离与时间的平方成正比,思维过程大体是这样的。\n如果把加速度设为g,那么根据假设的基本事实,自由落体下落1秒时速度为g,下落2秒时速度为2g,...,下落t秒时的速度为tg。可以推算,下落t秒后,这段路程的平均速度为\n。\n因为路程 = 速度×时间,就可以得到自由落体路程模型为\n。\n这只是一种基于直观的思考,事实上,伽利略的论证要复杂得多,他是利用三角形的面积来表示自由落体下落的距离,论证了上述表达式的合理性。分析伽利略的论证可以知道,其中蕴含了微积分思想的萌芽,由此可以认为,在那个时代产生微积分是一种必然[^294]。\n然后,为了验证模型的正确性,伽利略开始设计实验。虽然在许多科普书中,讲到伽利略是在比萨斜塔安排了他的试验,但是这样的述说虽然故事性很强但不可信,因为自由落体的速度太快,在那个没有钟表的时代[^295],不可能精确记录数据。事实上,伽利略的试验是在斜面上进行的。\n验证的关键是,验证物体下落的距离是否与时间的平方成正比。为此,伽利略在《关于两门新科学的对话》中的定理3证明了这样的结论:同样的高度、同样的重物沿垂直下落和斜面下落,下落的时间之比等于垂直长度和斜面长度之比。这就说明,可以利用斜面进行自由落体的试验。然后,伽利略用一块12码长的木板,在中间划出1英寸宽的光滑的沟槽,让一个光滑的黄铜球沿着沟槽滚下。他试验了不同的斜度,又试验了不同长度的木板,一百多次的试验结果均显示:黄铜球下落的距离与下落时间的平方之比近似成正比例关系。在试验过程中,为了解决时间的度量,伽利略通过管子流到杯中的水流量进行度量,可以这样度量的理由是:物体下落时间与杯中水的重量成正比例关系。这样,伽利略自由落体实验的结论是用\"秤\"称出来的[^296]。\n通过伽利略的研究路径可以看到,构建数学模型的前提是简化现实问题的背景,剥离那些不必要的细节,抽象出现实背景中的核心要素;建立数学模型需要思考因果关系、有逻辑地想象核心要素之间的关联,选择恰当的数学语言表达这样的关联;验证数学模型的基本依据是现实,可以是现象的观测、也可以实验的结果[^297]。\n社会生活的数学模型。英国经济学家凯恩斯是[现代西方经济学](http://baike.baidu.com/view/2671107.htm)最具影响力的经济学家,凯恩斯创立的宏观经济学、奥地利心理学家[弗洛伊德](http://baike.baidu.com/view/2215.htm)所创的精神分析法与[爱因斯坦](http://baike.baidu.com/view/2218.htm)创造的相对论并称二十世纪人类知识界的三大革命。\n凯恩斯的宏观经济学强调政府对于市场经济的干预,他用数学的语言表达了他的思考。如果用Y表示国民收入、用C表示国民消费、用I表示国民投资,那么可以把三者之间的关系表示为\nY = C + I\nC = a~0~ + aY\n的形式。现在,人们称这个模型为凯恩斯静态模型。\n这个数学模型的数学形式非常简单,第一个等式就是义务教育数学课程标准中所说的加法模型,第二个等式是加法模型与乘法模型的混合,都是小学生也可以接受的数学表达。但是,这个数学模型讲述的现实社会生活中的故事是生动的,这些故事深刻地影响着国家经济政策的制定。讲述并且发展了这个数学模型的经济学家们形成了凯恩斯学派,其中有若干个学者获得了诺贝尔经济学奖。下面,我们来分析这个模型及其拓展。\n第一个等式表示的是:收入=消费+投资,因此需要假定,国民收入不是用来消费就是用来投资,所说投资包括银行储蓄、也购买证劵或者股票。可以看到,与自然界的数学模型一样,社会生活中的数学模型也需要进行必要的假设。\n第二个等式是最简形式的线性模型,其中a~0~ 和 a\n是模型的系数。与自然界的数学模型一样,社会生活的数学模型中的系数也具有非常明显的现实意义,在上述模型中,系数a~0~\n表示国民的基本消费,诸如房租、水电、交通费等等;系数a表示国民的\"边际消费倾向\",可以用来表示基本消费以外消费的程度,系数a越大则消费倾向越大,如果不存在透支消费的情况,那么总有[^298]:a≦1。\n在较短时间段内,可以假定a~0~ = 0,得到a = ΔC/ΔY(其中三角符号 Δ\n是人们经常会使用的数学符号,用以表示时间间隔内数量的差),这样,系数a又表示了时间间隔内消费与收入的比,人们又称系数\na为\"乘数系数\",第二等式为\"乘数效应\"方程。简单求解,容易得到\n,\n其中a是一个小于1的正数,a越接近1则国民收入Y越大,因为这个增长关系不是线性的而是成倍数的,因此人们称a为乘数。为了说明这一点,我们分别考虑两种情况。\n固定乘数、变化投资。如果固定基本消费系数:a~0~ = 10、乘数:a =\n4/5。那么:当投资I = 5时,收入Y = 75;当投资I = 10时,收入Y =\n100。这个结果表明:投资增加5,收入增加100 -- 75 =\n25,即收入增长是投资增加量的5倍。\n固定投资、变化乘数。如果固定基本消费系数:a~0~ = 10、投资:I =\n10。那么:当乘数a = 3/5时,收入Y = 50;当乘数a = 4/5时,收入Y =\n100。计算结果表明:乘数增加1/5,收入增加100 -- 50 = 50,是投资的5倍。\n正是因为存在乘数效应,于是凯恩斯静态模型成为许多国家制定经济政策的基本依据,这也就是人们通常所说的\"消费拉动经济\"的基本依据,这个政策更全面的表达应当是:促进国民消费,拉动经济发展,增加国民收入。这样,经济学家就构建了宏观经济学中\"乘法原理\"的基本框架,并且把这个数学模型拓展到国民经济管理的诸多方面[^299]。\n为了进一步扩大诺贝尔奖的影响,1968年瑞典银行在庆祝建行300周年之际,捐出大额资金给诺贝尔基金会,参照诺贝尔物理、化学、生理或医学、文学、和平这五个奖项,从1969年开始设立诺贝尔经济学奖,用以奖励那些对世界经济发展做出突出贡献的研究。至今为止的评选结果表明,数学模型在现代经济学的研究中至关重要。\n1970年度诺贝尔经济学奖授予美国经济学家萨缪尔森,以表彰他对数量经济学做出的巨大贡献。萨缪尔森被誉为凯恩斯经济学理论的集大成者,与凯恩斯一样,萨缪尔森也强调政府引导市场经济的重要性。在凯恩斯静态模型的基础上,萨缪尔森在1939年的一篇文章中,提出了著名的乘数-加速模型[^300]:\nY~t~ = g~t~ + C~t~ + I~t~\nC~t~ = a~0~ + aY~t-1~\nI~t~ = b(C~t~ - C~t-1~)\n与凯恩斯静态模型对应,上式中的Y~t~、C~t~ 和 I~t~\n分别表示t时间段国民收入、国民消费和国民投资,g~t~\n表示t时间段政府支出。通过这样的变化,萨缪尔森就把经典的凯恩斯模型与时间联系起来了,称这样的模型为凯恩斯动态模型。\n上述第二个等式仍然称为乘数效应方程,称系数\na为\"乘数系数\",但现在需要假设:t时间段的消费只与\nt-1时间段的收入有关。生活经验告诉我们,这个假设相当苛刻,述说的是一种现挣钱现花费的生活状态。我们再次看到,与自然界的数学模型一样,为了得到表达清晰的生活中的数学模型,人们也不得不做出一些非常苛刻的假设。\n上述第三个等式也是一个线性模型,称为\"加速效应\"方程,称其中的系数b为\"加速系数\",这个方程表明投资是消费增长的线性函数,系数b是线性函数的斜率。这个方程进一步说明消费的增长能够促进国民收入的增长。\n如果政府的支出是一个常数g~t~ = I~0~ ,那么解上面的方程组可以得到\n,\n这是一个非齐次、二阶差分方程。对于时间变量连续的情况,这个模型可以用二阶微分方程描述,方程的解取决于特征方程:\n。\n在1939年的那篇文章中,萨缪尔森给出了一些数值计算的结果,特别指出,当方程没有实根时,方程有阻尼震荡解,他认为这个结果可以说明经济增长的周期现象。\n可以想象,如果在数学模型的教学过程中,能够恰到好处地向学生展示数学模型的现实魅力,不仅可以让学生更好地了解数学的实际应用,还会激发学生使用数学的语言表达现实世界的激情。比如,讲述凯恩斯静态模型和萨缪尔森动态模型的故事。\n数学模型的数学贡献。因为数学模型构建了数学与现实世界的桥梁,因此,数学模型对数学发展的贡献是不可估量的,因为数学家会凭借直觉,在数学模型的构建过程中汲取\"创造数学\"的灵感,促进数学自身的发展。甚至可以认为,数学模型的构建与应用,是现代数学得以健康发展的重要的源泉,正如美国数学家、计算机的创始人冯·诺伊曼的所表述的那样[^301]:\n数学思想来源于经验,我想这一点是比较接近真理的。真理实在太复杂,对之只能说接近,别的都不能说。......\n数学思想一旦被构思出来,这门学科就开始经历它本身所特有的生命。事实上,认为数学是一门创造性的、受审美因素支配的学科,比认为数学是一门别的、特别是经验的学科要更确切一些。......\n换句话说,在距离经验本源很远很远的地方,或者在多次\"抽象的\"近亲繁殖之后,一门数学学科就有退化的危险。\n在上述论述中,关于\"数学经过多次抽象之后可能出现近亲繁殖、可能带来退化的危险\"的警告是值得充分重视的,很显然,避免数学退化最简单的办法就是注重数学与现实世界的联系,而联系的最重要的途径就是数学模型。\n合理的思维过程具有理性加工的功能,而现实世界的那些东西一旦经过理性的加工,或者说,现实世界的那些东西一旦经过数学的描述,不仅具有了一般性并且具有了真实性[^302]。而数学模型就是这种理性加工的范例,数学对于解释现实世界是无能为力的,但是,利用数学能够更好地描述现实世界。正因为如此,数学模型的价值取向往往不是数学本身,而是数学模型在描述现实世界中所起到的作用;数学模型的教学需要引导学生从数学的角度思考,更需要引导他们从现实问题的角度思考,只有这样,才能激发学生的学习兴趣,提升他们的应用意识和创新意识。\n[^1]: 参见问题5的讨论可以知道,这两个代数基本事实来源于欧几里得《几何原本》五个公理中的前三个公理。\n[^2]: 参见问题14的讨论。\n[^3]: 参见《形式逻辑》,金岳霖著,北京:人民出版社,2005年(1979版),41-42;也参见《形式逻辑原理》,诸葛殷同等著,北京:社会科学文献出版社,2007年,41。\n[^4]: 参见《欧几里得几何原本》,兰纪正 朱恩宽译,梁宗巨 张毓新\n徐伯谦校订,西安:陕西科学技术出版社,1990年,1;文中的序号是原著的。\n[^5]: 参见《古今数学思想·第4册》,克莱因著,北京大学数学系数学史翻译组译,上海:上海科技出版社,1981年,78。\n[^6]: 参见中译本《几何基础》,希尔伯特著,江泽涵\n朱鼎勋译,北京:科学出版社,1995年(第二版)。\n[^7]: 参见《希尔伯特--数学世界的亚历山大》,瑞德著,袁向东\n李文林译,上海科学技术出版社,2011年,90。\n[^8]: 再比如集合定义,最初康托试图给出揭示内涵的集合定义,但引发了包括罗素理发师悖论在内的诸多悖论,于是现在人们普遍认同的ZF集合公理系统采用的集合定义也是标明符号的,参见\nCohen, Paul J. and Reuben, Hersh, Non-Cantorian Set Theory,\nScientific American, 1967, 104-116。\n[^9]: 几乎所有形式逻辑的教科书中,都不讨论这种形式的定义,似乎这样的定义是不屑一顾的。但是,对于数学的研究、特别是对于数学教育,却不能不重视这种形式的定义。\n[^10]: 参见\"试论人的基于本能的认知\",史宁中,《东北师范大学学报(哲学社会科学版)》,2020年(05)。\n[^11]: 按照生物学的分类,主要级别依次为:界、门、纲、目、科、属、种。\n[^12]: 《义务教育数学课程标准(2022年版)》已经把方程的内容移到初中,方程的定义也有了改变。\n[^13]: 参见《亚里士多德全集·Ⅰ》范畴篇17^a^,苗力田主编,北京:中国人民大学出版社,1990年,52。\n[^14]: 比如,参见《形式逻辑·第四版》,华东师范大学哲学系逻辑性研究室编,上海:华东师范大学出版社,2009年,52。中国形式逻辑界之所以形成这样的认识,很可能是受金岳霖的影响,金岳霖的著作《形式逻辑》没有给出命题的概念,直接用\"判断\"替代\"命题判断\",把推理定义为:推理就是根据一个或一些判断得出另一个判断的思维过程。参见《形式逻辑》,金岳霖著,北京:人民出版社,2005年(1979版),138。\n[^15]: 参见《逻辑哲学论》,维特根斯坦著,贺绍甲译,北京:商务印书馆,2019年,32-47。\n[^16]: 参见《语言、真理与逻辑》,艾耶尔著,尹大贻译,上海:上海译文出版社,2006年,2。\n[^17]: 王力认为,陈述句\"这个三角形是白的\"中的\"是\"不是系词,因为\"白的\"不是名词,这个陈述句也不能成为系词结构,见《汉语史稿》,王力著,北京:中华书局,2004年,402。王力的这个说法很大程度受到了前苏联学者的影响。\n[^18]: 参见《二十世纪哲学》第5章和第9章,艾耶尔著,李步楼 俞宣孟\n苑利均等译,上海:上海译文出版社,2015年。\n[^19]: 参见H.G.Liddell and R.Scott, A Greek-English Lexicon, Oxford: The\nClarendon Press, 1992。\n[^20]: 参见http://www-history.mcs.st-andrews.ac.uk/history/Mathematicians/Euclid.html。\n[^21]: 参见《欧几里得·几何原本》,兰纪正\n朱恩宽译,西安:陕西科学技术出版社,1990年。\n[^22]: 更详细的讨论参见话题16。\n[^23]: 这个性质在欧几里得几何体系中似乎是显然的,但要证明这个结论却是非常困难。在希尔伯特的23个问题中,第4个问题就是:证明两点间直线距离最短。1973年,前苏联数学家波格列洛夫声称在距离对称的条件下他解决了这个问题。\n[^24]: 更详细的讨论参见话题19。\n[^25]: 更为详细的讨论参见《数学基本思想18讲》第二部分,史宁中著,北京:北京师范大学出版社,2016。\n[^26]: 分别参见《义务教育数学课程标准(2022年版)》21页和24页,中华人民共和国教育部制定,北京:北京师范大学出版社,2022年。\n[^27]: 这段表述可以参见《先秦名学史》,胡适著,合肥:安徽教育出版社,1999年(原著1922年),118-120;《中国哲学简史》,冯友兰著,北京:北京大学出版社,1996年(原著1948年),105-107;《形式逻辑》,金岳霖著,北京:人民出版社,2005年(原著1979年),347-350;《墨子选注》,李渔叔著,台北:中正书局,1977年,230-231。\n[^28]: 这是一种完全是为了知而知的论述,在中国古代的典籍中是非常难得的。\n[^29]: 参见《马克思恩格斯全集·二十卷》,中共中央马克思恩格斯列宁斯大林著作编译局译,北京:人民出版社,1971年,610。\n[^30]: 小学数学抽象经历了从感性具体到感性一般、从感性一般到理性具体的思维过程。\n[^31]: 在《义务教育数学课程标准(2022年版)》中,尝试用\"意识\"\"观念\"\"能力\"等词语表述数学核心素养的层次,对应于数学教师耳熟能详的表述数学知识层次的\"了解\"\"理解\"\"掌握\"这样的词语。意识是指基于经验的感悟,观念是指基于概念的理解,能力是指基于实践的掌握。\n[^32]: 中国百余年教材史表明,分数与小数的教材编写顺序是反反复复的。参见\"我国小学数学教材分数和小数内容编写比较研究及对未来教材编写的启示\",徐思迪\n史宁中,《课程·教材·教法》,2023年(2)。\n[^33]: 单分数是指分子是1的分数、即分数单位,只有2/3例外。\n[^34]: 参见《世界数学通史·上》,梁宗巨著,沈阳:辽宁教育出版社,2001年,584。\n[^35]: 参见《十三经注疏·春秋左传正义》,[周]左丘明傳,[晋]杜预注,[唐]孔颖达正义,北京:北京大学出版社,2000年,60。\n[^36]: 参见《世界数学通史·上》,梁宗巨著,沈阳:辽宁教育出版社,2001年,437。\n[^37]: 古埃及偏重研究天狼星,参见《数学基本思想18讲》,史宁中著,北京:北京师范大学出版社,2016年,224。\n[^38]: 参见《元史·列传·郭守敬》,北京:中华书局,1976年,3851。\n[^39]: 参见\"分数概念表述和分数除法运算的比较研究及其对教学的启示\",赵莉\n王春英 史宁中,《数学教育学报》,2021 (3),47。\n[^40]: 《九章算术》是中国最重要的数学著作之一,最晚成书于东汉早期,作者不详。这本书以246个实际问题为背景,内容涉及方程组、分数四则运算、负数加减运算、面积体积计算等。刘徽、李淳风等人的校注使得这部书得以完整,北宋(1084年)刊刻为教科书,或许是世界最早的印刷本数学书。刘徽(约225-295)是魏晋伟大数学家,山东临淄人;李淳风(602-\n670)是唐代杰出天文学家和数学家,陕西岐山人。\n[^41]: 参见\"十进小数发展简史\",李迪,《数学通报》,1964(10)。\n[^42]: 《孙子算经》大约成书在四、五世纪,作者生平和编写年不详。传本的《孙子算经》共三卷。卷下第31题为后世\"[鸡兔同笼](https://baike.baidu.com/item/%E9%B8%A1%E5%85%94%E5%90%8C%E7%AC%BC/5907332?fromModule=lemma_inlink)\"问题,卷下第26题被秦九韶推广为\"物不知数\"问题,西方数学史称为\"中国剩余定理\"。\n[^43]: 也参见《义务教育数学课程标准(2022年版)》例22,北京:北京师范大学出版社,2022年。\n[^44]: 参见《世界数学通史·下》,梁宗巨 王青建\n孙宏安著,沈阳:辽宁教育出版社,2001年,446。\n[^45]: 相传作者是管夷吾(前730-前645),又名敬仲,字仲,安徽颖上人,春秋时期齐国著名政治家,曾任齐国上卿(丞相)。\n[^46]: 参见《 欧几里得·几何原本》,兰纪正\n朱恩宽译,西安:陕西科学技术出版社,1990年。\n[^47]: 参见《几何基础》,希尔伯特著,江泽涵\n朱鼎勋译,北京:北京大学出版社, 2009年,16。\n[^48]: 参见《中国科学技术史》第三卷第19章,李约瑟著,梅容照等译,北京:科学出版社,2018年,73。\n[^49]: 参见《数学基本思想18讲》,史宁中著,北京:北京师范大学出版社,2016年,50-51。\n[^50]: 大约在公元628年,印度数学家婆罗摩笈多(Brahmagupta,598-660)给出负数的乘除运算,参见《婆罗门历算书》。\n[^51]: 参见《周髀算经/九章算术》第七十六页,上海:上海古籍出版社,1990年。\n[^52]: 传统初中数学教材,是通过数轴解释负数,但一定要注意到,只能用这种方法直观描述负数,而不能用这种方法定义负数,因为无法精确度量距离,详细讨论参见问题14。\n[^53]: 参见《笛卡尔几何》,袁向东译,北京:北京大学出版社,2008年,50-57。\n[^54]: 如问题14将要讨论的那样,人们用绝对值表示数量的多少。\n[^55]: 参见《基本概念与运算法则--小学数学教学中的核心问题》问题12,史宁中,北京:高等教育出版社,2013年。\n[^56]: 参见《古今数学思想·Ⅰ》,克莱因著,上海:上海科学技术版社,1979年,212。\n[^57]: 参见《数学:确定性的丧失》,克莱因著,李宏魁译,长沙:湖南科学技术出版社,1997年,119。\n[^58]: 小学数学教材介绍的方程都是数字系数的,因此仍然停留在算术层次。\n[^59]: 在我国,代数一词始于清代数学家李善兰(1811-1882,原名李心兰,浙江海宁人)与英国人伟烈亚力(Alexande\nWylie,1815-1887)合作翻译的著作《代数积拾级》,译自英国数学家摩根(De\nMorgan,1806-1871)的著作\"Elements of\nAlgebra\",其中英语代数algebra一词直接源于中世纪拉丁文algebra,而拉丁文又译自阿拉伯文al-jebr,见诸阿拉伯数学家花拉子米(al-Khwarizmi,约783-850)关于代数学的著作,这个词的阿拉伯文原意是:破碎部分的重组。这些内容可以参见1933年版的《牛津英语大辞典》第一卷217页。\n[^60]: 参见《马克思恩格斯选集·第四卷》,北京:人民出版社,1995年,365。\n[^61]: 中文函数这个词也是出自李善兰和伟烈亚力合作翻译的著作《代数积拾级》,表达的数学意义是:凡此变数中函彼变数者,则此为彼之函数。除了代数和函数这两个数学名词之外,在翻译过程中还创造了许多普遍被接受的数学名词,诸如:微分、积分、级数、指数、多项式、抛物线、双曲线、渐近线、切线、法线等等。\n[^62]: 牛顿对于发表自己的研究成果非常谨慎,去世后留下大约五千页的未发表的手稿,经过近三百年的整理,剑桥大学出版社从1967年起分八卷陆续出版,其中第一卷有一篇(pp\n400-448)牛顿写于1666年的关于\"流数\"的论文手稿。\n[^63]: 参见 Dieter\nRuthing,函数概念的一些定义,袁向东译,吕以辇校,《数学译林》,1986(3),263。\n[^64]: 角度的实数定义是通过弧度制实现的,这是高中数学的重要内容。\n[^65]: 2022年版义教数学课标\"教学建议\"强调\"整体设计,分步实施\",参见《义务教育数学课程标准(2022年版)》,中华人民共和国教育部制定,北京:北京师范大学出版社,2022年,86。\n[^66]: 还可以在这样的过程中述说函数定义的变化过程,引导学生感悟函数概念的重要性,理解函数概念的本质。\n[^67]: Cajori,F.,A history of mathematical notations,New York:Dover\nPublicationgs,INC.,1993,123-124,133。国内著作参见《数学符号史》,徐品方\n张红著,北京:科学出版社,2006年,269。\n[^68]: 参见 Richard Dedekind, Theory of numbers,Chicago:The open court\npublishing\ncompany,1901,5。中译本参见《实数探原》,朱言均译注,长沙:商务印书馆,1940年。后来,这个基本原则被称为戴德金连续性公理,参见《几何学基础》第2章第5节,科士青著,苏步青译,北京:商务印书馆,1954年。\n[^69]: 原文为:预先任意给定几个素数,则有比它们更多的素数。参见《\n欧几里得几何原本》,兰纪正\n朱恩宽译,西安:陕西科学技术出版社,1990年,315。\n[^70]: 这个结论是毕达哥拉斯学派发现的,参见《数学:确定性的丧失》,克莱因著,李宏魁译,长沙:湖南科学技术出版社,1997年,100。\n[^71]: 表述中涉及的矛盾律和排中律将在话题2中进行讨论。\n[^72]: 参见《什么是数学》,柯朗 罗宾著,左平\n张饴慈译,上海:复旦大学出版社,2007年,101。\n[^73]: 参见\"试论教育的本源\",史宁中,《教育研究》,2009年(8)。\n[^74]: 参见《马克思恩格斯全集·第23卷》,北京:人民出版社,1972年,202。\n[^75]: 在本质上,是因为如果一个角确定了,那么对以这个角的顶点为圆心的圆,无论这个圆大小如何,这个角所对应的弧长与半径的比是一个常数。参见《数形结合与数学模型--高中数学教学中的核心问题》问题4,史宁中,北京:高等教育出版社,2018年。\n[^76]: 参见《义务教育数学课程标准(2022年版)》,北京:北京师范大学出版社,2022年,66。\n[^77]: 参见《数形结合与数学模型--高中数学教学中的核心问题》问题18,史宁中,北京:高等教育出版社,2018年。\n[^78]: 因为可以用几何学的语言表达力学的规律,因此,力学的本质往往与几何不变量是一致的,比如,假设光速绝对、时间绝对的牛顿力学与伽利略不变量,假设光速相对、时间相对的爱因斯坦力学与洛伦兹不变量。参见《数学基本思想18讲》,史宁中著,北京:北京师范大学出版社,2016,229-232。\n[^79]: 参见《数形结合与数学模型--高中数学教学中的核心问题》问题18,史宁中,北京:高等教育出版社,2018年。\n[^80]: 存在性的忽视,导致中国古代哲学没有形而上学。\n[^81]: 参见《数形结合与数学模型--高中数学教学中的核心问题》话题5,史宁中,北京:高等教育出版社,2018年。\n[^82]: 参见《世界数学通史·上》,梁宗巨著,沈阳:辽宁教育出版社,2001年,203-207。\n[^83]: 七大奇迹指的是公元前三世纪左右,在地中海东部沿岸地区七座宏伟的建筑和雕塑:埃及胡夫金字塔、巴比伦空中花园、阿尔忒弥斯神庙、奥林匹亚宙斯神像、摩索拉斯陵墓、罗德岛太阳神巨像和亚历山大灯塔。希罗多德在《历史》一书中,描写了巴比伦的城市规划、古埃及的金字塔,为七大奇迹最早的文字记载。但人们至今也没有发现空中花园的遗迹。\n[^84]: 所说的多面体都是凸多面体,是指基于多面体任何一个面作平面,这个多面体必然在平面的一侧;或者说,在多面体内任意取两点,两点的连线必然在多面体内。\n[^85]: 类似一个封了顶的灯笼,里面固定一个蜡烛,点燃蜡烛后可以上升。传说三国时代的诸葛亮为了指挥战斗发明了这种灯,后来人们称为孔明灯。孔明灯应当是现代热气球的前身。\n[^86]: 《吕氏春秋·慎大览·下贤》中说:\"精充天地而不竭,神覆宇宙而无望。\"东汉高诱注说:\"四方上下曰宇,以屋喻天地也,往古来今曰宙,言其神而包覆之,无望无界畔也。\"\n[^87]: 参见《科学与方法》,彭加勒(庞加莱)著,李醒民译,北京:商务印书馆,2006年,74。庞加莱在另一部书中又谈到:\"这些量不必总是可测量的,例如在有一种几何学的分支中人们无视于这些量的测量,...\n。这种数学名曰拓扑学。\"参见《科学与假设》,彭加勒(庞加莱)著,叶蕴理译,北京:商务印书馆,1997年(1930年第一版),28。\n[^88]: 参见《亚里士多德全集·Ⅱ》,苗力田主编,徐开来译,北京:中国人民大学出版社,1991年,265。\n[^89]: 参见《数学小丛书·一笔画和邮递路线问题》附录二,姜伯驹著,北京:科学出版社,2002年。\n[^90]: 参见《世界数学通史·下册》,梁宗巨 王青建\n孙宏安著,沈阳:辽宁教育出版社,2005年,772-773。\n[^91]: 参见《拓扑学奇趣》,巴尔佳斯基著,裘光明译,长沙:湖南教育出版社,1999年,16。\n[^92]: 1812年拉普拉斯的名著《分析概率论》出版,1814年出第二版时,拉普拉斯增加了长达150页的绪论,同年,这个绪论以《概率的哲学导论》为书名单独出版,本文译自英译本\nPierre Simon Marquis de Laplace, A Philosophical essay on\nprobabilities, New York: John Wiley & Sons, 1902, 6-7。\n[^93]: 回顾问题4的讨论。\n[^94]: 本质上是一个映射,因为涉及集合与集合的对应。函数表达实数与实数的对应,映射可以表达集合与集合的对应。\n[^95]: 参见《数形结合与数学模型--高中数学教学中的核心问题》问题28,史宁中,北京:高等教育出版社,2018年。\n[^96]: 参见《义务教育数学课程标准(2022年版)》,北京:北京师范大学出版社,2022年,126-127。\n[^97]: 在《义务教育数学课程标准(2022版)》中是例38,北京:北京师范大学出版社,2022年,。\n[^98]: 更确切地说是数据分组,参见《义务教育数学课程标准(2022年版)》例85,北京:北京师范大学出版社,2012年。\n[^99]: 详细讨论参见《统计检验的理论与方法》第五章,史宁中著,北京:科学出版社,\n2008年。AIC是Akaike Information\nCriterion的缩写,可以翻译为赤池信息量准则,在大数据时代得到广泛应用。\n[^100]: 权越大说明对应数值在总体均值或样本均值中占的比重越大。\n[^101]: 参见《数学基本思想18讲》第五讲,史宁中著,北京:北京师范大学出版社,2016。\n[^102]: 在许多现实问题中,还需要分辨小方块中是否有图,甚至还要分辨图的颜色,标以不同的数字。\n[^103]: 参见《逻辑学导轮·第11版》,柯匹 科恩著,张建军\n潘天群译,北京:中国人民大学出版社,2007年,115-120。\n[^104]: 古希腊哲学更多地研究一般与特殊的关系,判断原则是基于科学的,强调的是对结论的理解,中国古代哲学更多地研究类与类的关系,判断原则是基于艺术的,强调的是对结论的感悟。参见\"古代中国哲学的推理、命题和定义(上)(下)\",史宁中,《哲学研究》,2009年(3)(4)。\n[^105]: 参见《探索的思想 -\n哲学的故事》,杜兰特著,朱安等译,北京:文化艺术出版社,1991年,22。\n[^106]: 参见\"论定义中的殊相与共相-公孙龙子《指物论》评析\",史宁中,《古代文明》,2009年(1)。\n[^107]: 参见《公孙龙子译注》,谭业谦撰,北京:中华书局,1997年,11-17。\n[^108]: 参见《个体:论描述的形而上学》,斯特劳森著,江怡译,北京:中国人民大学出版社,2004年。\n[^109]: 原文为:物莫非指而指非指。天下无指,物无可以谓物。非指者,天下无物,可谓指乎?指也者,天下之所无也;物也者,天下之所有也。以天下之所有为天下之所无,未可。天下无指,而物不可谓指也;不可谓指者,非指也;非指者,物莫非指也。天下无指而物不可谓指者,非有非指也;非有非指者,物莫非指也。物莫非指而指非指也。\n[^110]: 因此,希尔伯特给出了点的名义定义,参见问题1的讨论。\n[^111]: 参见《逻辑学导轮·第11版》,柯匹 科恩著,张建军\n潘天群译,北京:中国人民大学出版社,146-149。\n[^112]: 这里所说的科学性,是指得到的结论必须独立于个人、独立于时间、独立于场合。\n[^113]: 参见《马克思恩格斯全集》第二十卷,北京:人民出版社,1971年,557。\n[^114]: 详细的讨论,参见话题16。\n[^115]: 集合论公理体系可以参见《数学基本思想18讲》附录2,史宁中著,北京:北京师范大学出版社,2016。德国逻辑学家弗雷格非常重视这样的区别,他用a=a和a=b这两个等式的不同讨论了意义和意谓之间的差异,参见《弗雷格哲学论著选辑》,王路译,王炳文校,北京:商务印书馆,2006年,119。\n[^116]: 参见《亚里士多德全集·Ⅶ》,苗力田主编,北京:中国人民大学出版社,1997年,91。\n[^117]: 出自《韩非子·难一》。\n[^118]: 英国历史学家汤因比非常重视中国的这种发明,并且以此建立他的历史观,参见《历史研究》,汤因比著,刘北成\n郭小凌译,上海:上海人民出版社,2005年,62。\n[^119]: 参见\"论《老子》的思维逻辑\",史宁中,《哲学研究》,2014(2),50-55。\n[^120]: 参见《亚里士多德全集·Ⅶ》,苗力田主编,北京:中国人民大学出版社,1997年,第106-107页。\n[^121]: 参见《工具论·后分析篇》,亚里士多德著,余纪元等译,北京:中国人民大学出版社,2003年,88。\n[^122]: 这个命题可以拓展到更为一般的形式:所有的逻辑推理都是依据规则的推理。所说的规则就是传递性,包括关系传递和性质传递两种形式,三段论表述的是性质传递。具体讨论参见\"试论数学推理过程的逻辑性:兼论什么是有逻辑的推理\",史宁中,《数学教育学报》,2016(4),1-16。\n[^123]: 参见《西方哲学史·上》,罗素著,何兆武\n李约瑟译,北京:商务印书馆,1976年,235。\n[^124]: 三个命题的形式是全称肯定、全称肯定、全称肯定,拉丁文称谓是\nBarbara,其中三个元音为A、A、A。\n[^125]: 详细讨论参见《数学基本思想18讲》第十三讲,史宁中著,北京:北京师范大学出版社,2016。\n[^126]: 三个命题的形式是全称否定、全称肯定、全称否定,拉丁文称谓是\nCelarent,其中三个元音为E、A、E。\n[^127]: 参见《西方哲学史·上》,罗素著,何兆武\n李约瑟译,北京:商务印书馆,2003年,255。\n[^128]: 三个命题是全称肯定、特称肯定、特称否定,这个型的拉丁文称谓是\nDARII,其中三个元音为A、I、I。\n[^129]: 这里所说的偶数不包括2。\n[^130]: 三个命题是全称否定、特称肯定、特称否定,这个型的拉丁文称谓是Ferio,其中三个元音为E、I、O。\n[^131]: 关于60度角不能三等分的讨论,参见《数形结合与数学模型:高中数学教学中的核心问题》问题12,史宁中,北京:高等教育出版社,2018年。\n[^132]: 更为详细的讨论参见《数学基本思想18讲》第十一讲,史宁中著,北京:北京师范大学出版社,2016。\n[^133]: 这样的数学特征是十九世纪逐渐形成的,现代数学不可或缺的算术公理体系、几何公理体系、集合论公理体系、概率论公理体系等,都是在那个时代成熟起来的。\n[^134]: 参见《陶哲轩实分析》,陶哲轩著,王昆扬译,北京:人民邮电出版社,2008年,16。\n[^135]: 参见《西方哲学史》,罗素著,何兆武\n李约瑟译,北京:商务印书馆,1963年,55。\n[^136]: 参见《费马大定理:一个困惑了世间智者358年的迷》,辛格著,薛密译,上海:上海译文出版社,2005年,54-55。\n[^137]: 相传作者是管夷吾,又名敬仲,字仲,安徽颖上人,春秋时期著名政治家,曾任齐国上卿(丞相)。\n[^138]: 参见《亚里士多德全集Ⅶ:形而上学》,苗力田主编,北京:中国人民大学出版社,1993年,39。\n[^139]: 需要强调的是,这个话题所说的自然数不包括0。\n[^140]: 近代数学有五个重要猜想,即:四色猜想、庞加莱猜想、费马大定理、哥德巴赫猜想、黎曼猜想,上个世纪末以来,前三个猜想相继解决,其中四色猜想的证明借助了计算机。哥德巴赫猜想最好的证明,依然是陈景润于1966年给出(1973年补充证明)的结果:偶数\n= 素数 + 素数×素数。\n[^141]: 参见《数学基本思想18讲》,史宁中著,北京:北京师范大学出版社,2016,60-61。\n[^142]: 参见《素数之恋》,德比希尔著,陈为蓬译,上海:上海科技出版社,2014年,52-54。\n[^143]: 参见McGraw-Hill,The History of Mathematics: An\nIntroduction,6^th^ Editi,Burton,571。\n[^144]: 菲尔兹奖是在四年一次的国际数学家大会上颁发给40岁以下数学家的奖励,誉为数学诺贝尔奖。1936年第一次颁发,后因国际形势恶化,直到1950年才继续颁发。获得这个奖项的华人学者有丘成桐(1982年)和陶哲轩(2006年)。\n[^145]: 沃尔夫奖(Wolf\nPrize)是1976年创设的,包括数学、物理、化学、医学、农业五个奖(1981年增设艺术奖),其中数学奖荣誉最高,类似终身成就奖。获得这个奖项的华人学者有陈省身(1983年)和丘成桐(2010年)。\n[^146]: 杨辉\n(生卒年份不详)字谦光,钱塘(今杭州)人,南宋杰出数学家。因为杨辉给出了计算二项系数的三角形表示法,记载在1261年的著作《详解九章算法》中,因此人们把二项系数也称为杨辉三角。杨辉三角又称贾宪三角,因为求系数的方法源于贾宪的\"开方作法本愿\"图,后者记载于《永乐大典》。\n[^147]: 参见《微积分发展史》,爱德华著,张鸿林译,北京:北京出版社,1987年,276-278。在现今大学微积分教材中,这些结论很容易通过泰勒级数展开得到。\n[^148]: 参见《历史》,希罗多德著,王嘉隽译,商务印书馆,1959年。\n[^149]: 古埃及人在纸莎草(Papyrus)压制成的草片上写书,被称为纸草书。莱茵德纸草书以苏格兰收藏家莱茵德(H.Rhind)的名字命名,现藏伦敦大英博物馆。英语paper(纸)一词就是从papyrus这个词演变过来的。\n[^150]: 参见《数学史上的里程碑》,依夫斯著,欧阳绛等译,北京:北京科学技术出版社,1990年。\n[^151]: 与莱茵德纸草书一样,莫斯科纸草书也是在用纸莎草压制成的草片上书写的古埃及的数学知识,是由俄国贵族戈列尼雪夫于1893年在埃及购得,现藏莫斯科普希金精细艺术博物馆。\n[^152]: 最初书名为《数学大略》,列算题81问,分为9类。这部书不是按数学方法分类,也不只谈数学,还涉及自然现象和社会生活,因此是了解当时社会政治和经济生活的重要参考文献。大约到元代时更名为《[数学九章](http://baike.sogou.com/v306200.htm)》,由9卷改为18卷。1408年,抄本收入《[永乐大典](http://baike.sogou.com/v66970.htm)》,明王应遴(?-1645)传抄时定书名为《数书九章》,沿用至今。1781年,[李锐](http://baike.sogou.com/v64906166.htm)(1768-1817)校订收入《[四库全书](http://baike.sogou.com/v52370.htm)》。\n[^153]: 少广为《九章算术》第四卷的题目,这一卷讨论面积与边长之间的关系,涉及开平方、开立方等概念。\n[^154]: 古埃及人在纸莎草(Papyrus)压制成的草片上写书,被称为纸草书。莱茵德纸草书以苏格兰收藏家莱茵德(H.Rhind)命名,现藏伦敦大英博物馆。英语paper(纸)一词是从papyrus这个词演变过来的。\n[^155]: 参见Smith,D.E., A source Book in Mathematics,Dover\nPiblications,vol. Ⅱ(1929),346。\n[^156]: 参见《世界数学通史》,梁宗巨 王青建\n孙宏安著,沈阳:辽宁教育出版社,2005年,350-354。\n[^157]: 《周髀算经》原名《周髀》,作者不详,大约成书公元前1世纪,是我国最古老的天文学著作。唐初规定为[国子监明算科](http://baike.baidu.com/view/1368030.htm)的教材,命名为《周髀算经》。\n[^158]: 参见\"中国圆周率略史\",茅以升,《科学》,1917年(4),411-423。\n[^159]: 参见《数形结合与数学模型:高中数学教学中的核心问题》问题12,史宁中,北京:高等教育出版社,2018年。\n[^160]: 参见《数学:确定性的丧失》,克莱因著,李宏魁译,长沙:湖南科学技术出版社,1997年,177。\n[^161]: 参见《古今数学思想·第1册》,克莱因著,上海:上海科学技术出版社,1979年,\n292。\n[^162]: 参见 Newcomb,Simon Elements of Geometry. Book Ⅵ: Regular\nPolygons and the Circle, Problem Ⅶ. New York: Henry Holt and\nCompany, 1881, 235。\n[^163]: 文章的题目为\"三角级数中一个定理的推广\",文中讨论了三角级数的系数与收敛的关系,首次给出了集合的概念。关于实数的论述,参见\nBurton,D.M.,The History of Mathematics:An Introduction,Sixth\nEdition,The McGraw-Hill,2007, p668。\n[^164]: 参见《数学分析简明教程·上》,辛钦著,北京大学数学力学系数学分析与函数论教研室译,许宝騄校,北京:人民教育出版社,1954年,34-39。\n[^165]: 据说,这是希尔伯特在1924年1月的一次演讲中的举例,后来人们进行了广泛的演绎,并把这样的演绎统称为\"希尔伯特旅馆\"。\n[^166]: 书名原文为\"Ars Magna(The Great\nArt)\",有的学者翻译为《大术》,参见梁宗巨著作《世界数学通史·上》;也有的学者翻译为《大法》,参见李文林著作《数学史概论》。本文参照克莱茵的著作《数学:确定性的丧失》。\n[^167]: 参见《笛卡尔几何》,袁向东译,北京:北京大学出版社,2008年,50-57。\n[^168]: 参见《数学:确定性的丧失》,克莱因著,李宏魁译,长沙:湖南科学技术出版社,1999年,81。\n[^169]: 参见 Butts, R.E., Casper Wessel, Dictionary of Scientific\nBiography, Vol ⅪⅤ, Gillispie(1980),279-281。\n[^170]: 参见 Wu Y.H., The Calendars Synchronization and Intercalary\nMonths in Umma, Puzriš-Dagan, Nippur, Lagash and Ur During Ur III\nPeriod, Journal of Ancient Civilizations, vol. 17 (2002), pp\n113-134。\n[^171]: 比如在日本,仍然把星期一到星期日依次称为:月曜日、火曜日、水曜日、木曜日、金曜日、土曜日、日曜日。\n[^172]: 在古汉语中\"岁\"与\"年\"的含义不同。岁是指某一气节,比如春分,到第二年这个气节这段时间,因此岁是指阳历的一年;年是正月初一到下一个正月初一这段时间,因此年是指阴历的一年。可以参见《古代汉语·第三册》,王力主编,中华书局,1999年(第三版)。\n[^173]: 参见《希腊黄金时代的古代科学》,乔治·萨顿著,鲁旭东译,郑州:大象出版社,2010年,35-36。\n[^174]: 虽然有学者指出这段内容出自伪《古文尚书》,但从天文学史视角考察,其中不乏合理之处,本文取之,参见《十三经注疏·尚书正义》,孔安国注,孔颖达疏,北京:北京大学出版社,2000年,35。另外,董作宾认为殷商就明确以365.25日为\"岁实\",参见《董作宾先生全集》乙编第2册第6章\"殷历沿革\",台北:台湾艺文印书馆,1977年,69。\n[^175]: 参见《后汉书》卷13《律历下》,北京:中华书局,1959年,3057。\n[^176]: 《周髀算经》原名《周髀》,作者不详,大约成书公元前1世纪,是我国最古老的天文学著作。唐初规定为[国子监明算科](http://baike.baidu.com/view/1368030.htm)的教材,命名为《周髀算经》。\n[^177]: 参见《周髀算经译注》,程贞一\n闻人军译注,上海:上海古籍出版社,2012年,87;也参考第3页第5个注。\n[^178]: 参见《世界数学通史·上》,梁宗巨著,沈阳:辽宁教育出版社,2001年,57。\n[^179]: 关于古埃及人对于单位分数的使用,参见问题6。\n[^180]: 参见 R.Englund, Mesopotamiem(OBO 160/1),Universitatsverlag\nFreiburg Schwez,1999, 118-119。\n[^181]: 参见H.Hungei and D.Pingree, Astral Sciences in\nMesopotamia,Leiden,1999。\n[^182]: 参见《古地图密码:1418》,刘钢著,桂林:广西师范大学出版社,2009年,85。\n[^183]: 参照《汉书·律历志》和《淮南子·天文训》,王力在《古汉语·第三册》中给出了十二次与星宿的对应表。\n[^184]: 甲骨文主要是指殷墟甲骨文,殷墟在现今河南安阳小屯村一带,商王盘庚于公元前14世纪左右将商王朝迁都于此,至纣亡国,历8代12王273年。\n[^185]: 参见《古代天文历法讲座》,张闻玉著,桂林:广西师范大学出版社,2008年,60-61;同书第39页还谈到,应当把星辰区别,其中星是指行星,辰是指恒星,如果是这样,那么时辰一词就可以理解为由恒星确定的时间。\n[^186]: 参见《甲骨文精粹释译》第598条,王宇信、杨升南、聂玉海主编,昆明:云南人民出版社,2004年。\n[^187]: 参见《古代汉语·第三册》,王力主编,北京:中华书局,2019年(第60次印刷),839。\n[^188]: 参见《世界数学通史·上册》,梁宗巨,沈阳:辽宁教育出版社,1995年,201-209。\n[^189]: 在英语中,表示金字塔和四棱锥体的单词是同样的:pyramid。\n[^190]: 参见 Smith,D.E. History of Mathematics, Volume Ⅰ: General\nSurvey of History of Elementary Mathematics. Dover Publications,\nInc., New York,1923,43。\n[^191]: 与莱茵德纸草书、莫斯科纸草书一样,也是在用纸莎草压制成的草片上书写的古埃及的数学知识,卡呼恩(Kahun)纸草书是以发现地命名的,现藏于伦敦大学学院皮特里博物馆,这是以现代考古学奠基人之一的Petrie命名的博物馆。\n[^192]: 参见 Cantor,E. Vorlesungen uber Geschichte der Mathematik,\nLeipzing,1906。\n[^193]: 除了勾股数,书中还记载,陈子给出了求直角三角形斜边的一般算法:勾股各自乘、并而开方除之。所说的陈子大概是公元前6、7世纪的人,参见\"周髀算经上之勾股普遍定义:陈子定理\",章鸿钊著,《中国数学杂志》,1951,1。\n[^194]: 参见\"宅兹中国:周人确定'地中'的地理和文化依据\",史宁中,《历史研究》,2012年(6),4-15。\n[^195]: 分见 《晋书》卷11《天文志上》,北京:中华书局,1974年,第278页;\n《隋书》卷19《天文志上》,北京:中华书局,1973年,第505页。\n[^196]: 参见《诸子集成·6·吕氏春秋》,上海书店出版社,1986年,166。\n[^197]: 参见《周髀算经译注》,程贞一\n闻人军译注,上海:上海古籍出版社,2012年,137。\n[^198]: 更仔细的分析参见\"宅兹中国:周人确定'地中'的地理和文化依据\",史宁中,《历史研究》,2012年(6),4-15。\n[^199]: 参见《何尊铭文初释》,马承源,《文物》,1976年第1期;也参见《殷周金文集录》,徐中舒主编:成都:四川人民出版社,1984年,第245页。\n[^200]: 参见《十三经注疏·周礼注疏》,郑玄注,贾公彦疏,北京:北京大学出版社,2000年,295-300。\n[^201]: 更确切地说,应当是地球自转轴方向发生微小移动引起的。\n[^202]: 参见《元史》卷48《天文一·四海测量》,北京:中华书局,1976年,1000-1001。\n[^203]: 参见《元史》卷164《郭守敬传》,3851。角度是基于圆周356又1/4计算。\n[^204]: 参见《隋书》卷19《天文上》,514-515。\n[^205]: 其中\"畿方千里,取象于日一寸为正\"就是上一个话题所说的\"景一寸地千里\"。\n[^206]: 参见《隋书》卷19《天文上》,北京:中华书局,1973年,521。\n[^207]: 参见《山海经解》,张步天著,香港:天马图书有限公司,2004年,50-51。\n[^208]: 同上,131。\n[^209]: 参见《长水粹编·论〈五藏山经〉的地域范围》,谭其骧著,石家庄:河北教育出版社,2000年,327。\n[^210]: 参见《算经十书》上册,钱宝琮校点,北京:中华书局,1963年,53。\n[^211]: 参见《中国科学技术史》第4卷\n《天学》第1分册,李约瑟著,北京:科学出版社,1975年,336-337。\n[^212]: 参见《桓谭及其新论》(安徽大学学报增刊),安徽大学中文系桓谭新论校注小组编,1976年,128。\n[^213]: 参见《汉书·哀帝纪》卷11《哀帝纪》,北京:中华书局,1962年,340。\n[^214]: 参见《畴人传》第9卷,阮元等撰,扬州:广陵书社,2009年,98。\n[^215]: 参见《十三经注疏·周礼注疏》,郑玄注,贾公彦疏,北京:北京大学出版社,2000年,251。\n[^216]: 参见《长水粹编·论〈五藏山经〉的地域范围》,谭其骧著,石家庄:河北教育出版社,2000年,322。\n[^217]: 中文\"地球\"一词出自意大利传教士利玛窦,他在《[坤舆万国全图](https://baike.baidu.com/item/%E5%9D%A4%E8%88%86%E4%B8%87%E5%9B%BD%E5%85%A8%E5%9B%BE/4311044?fromModule=lemma_inlink)》中使用了该词。《坤舆万国全图》是[利玛窦](https://baike.baidu.com/item/%E5%88%A9%E7%8E%9B%E7%AA%A6/1512904?fromModule=lemma_inlink)和[李之藻](https://baike.baidu.com/item/%E6%9D%8E%E4%B9%8B%E8%97%BB/734149?fromModule=lemma_inlink)合作绘制的世界地图,于明[万历](https://baike.baidu.com/item/%E4%B8%87%E5%8E%86/704569?fromModule=lemma_inlink)三十年在北京临摹,现存于南京博物院。\n[^218]: 参见《阿基米德全集》,希思编,朱恩宽\n李文铭等译,西安:陕西科学技术出版社,1998年。\n[^219]: 参见《亚里士多德全集·第二卷》,苗力田主编,北京:中国人民大学出版社,350-351。\n[^220]: 参见《开元占经·上·卷一天地名体》,(唐)瞿县悉达,深圳:九州出版社,2012年,3。\n[^221]: 参见M.EI-Abbadi, The Life and Fate of the Ancient Library of\nAlexandria, Paris: UNESCO/UNDP, 1990。\n[^222]: 参见\"西方古典著作的稿本、抄本与校本\",张强著,《历史研究》2007年第4期,179-189。\n[^223]: 参见《希腊黄金时代的古代科学》,乔治·萨顿著,鲁旭东译,郑州:大象出版社,2010年,653。\n[^224]: 参见《中国大百科全书·地理卷》,北京:中国大百科全书出版社,1990年,109和431。\n[^225]: 参见《周礼注疏·上·大司徒卷第十》,(汉)郑玄注,(唐)贾公彦疏,彭林整理,上海:上海古籍出版社,2010年,334。\n[^226]: 参见《大戴礼记解诂》,王聘珍解诂,王文锦点校,北京:中华书局,1983年,258。\n[^227]: 参见《晋书·列传第五·裴秀》,北京:中华书局,1974年,1040。\n[^228]: 参见《中国科学技术史·第五卷地学·第一分册》,李约瑟著,北京:科学出版社,1976年,108-117。\n[^229]: 参见《古地图密码:1418》,刘钢著,桂林:广西师范大学出版社,2009年,147。\n[^230]: 类似平面法向量与平面的夹角。\n[^231]: 在球面上与点O距离相等的那些点所组成的集合。\n[^232]: 参见《中国科学技术史·第四卷天学·第二分册》,李约瑟著,北京:科学出版社,1975年,467-489。\n[^233]: 参见《元史·列传·郭守敬》,北京:中华书局,1976年,3848。\n[^234]: 参见《元史·天文·四海测验》,北京:中华书局,1976年,1000-1001。\n[^235]: 参见《谈谈方法》(也译为《方法论》),笛卡尔著,王太庆译,北京:商务印书馆,2007年,15。\n[^236]: 参见《自然辩证法》,恩格斯著,于光远等译,北京:人民出版社,1984年,164。\n[^237]: 参见《笛卡尔几何》,笛卡尔著,袁向东译,北京:北京大学出版社,2008年,5-6。\n[^238]: 参见话题22的讨论。\n[^239]: 参见《笛卡尔几何》,笛卡尔著,袁向东译,北京:北京大学出版社,2008年,9-12和26-36。\n[^240]: 参见《几何基础》,希尔伯特著,江泽涵\n朱鼎勋译,北京:科学出版社,1995年。以下引文均出自这本译著。\n[^241]: 对数量多少的感知和对距离远近的感知,都是对顺序的感知,这是人类构建逻辑推理的前提。详细讨论参见第二卷。\n[^242]: 回顾问题18的讨论,存在性的假设是非常重要的。\n[^243]: 参见《数学与自然科学之哲学》,外尔著,齐明友译,上海:上海科技教育出版社,2007年,35。\n[^244]: 参见《论无限》,希尔伯特著,原文刊载于《数学哲学》,保罗·贝纳塞拉夫\n希拉里·普特南编,朱水林 应制夷 凌康源 张玉纲译,陈以鸿\n王善平校,北京:商务印书馆,2003年,230。\n[^245]: 参见《哲学逻辑》第四章《斯穆里安:哥德尔的不完全性定理》,格勃尔主编,张清宇、陈慕泽等译,北京:中国人民大学出版社,2008年,80。\n[^246]: 参见《数学问题》,希尔伯特著,李文林\n袁向东译,大连:大连理工大学出版社,2009年,63-65。\n[^247]: 参见Godel,What is Cantors Continuum Problem? American\nMathematical Monthly, 1947(54), 515-525。\n[^248]: 参见《哥德尔》,王浩著,康宏逵译,上海:上海译文出版社,1997年,415。\n[^249]: 参见《科学与方法》,彭加勒(庞加莱)著,李醒民译,北京:商务印书馆,2006年,74。\n[^250]: 因为,只有在三维空间才能判断一个面是不是平面。正因为如此,我们的定义不仅适用于欧几里得几何,也适用于罗巴切夫斯基几何和黎曼几何。\n[^251]: 在一般情况下,角的计算需要通过平面的曲率,比如话题16讨论过的高斯曲率。\n[^252]: 详细讨论参见《数学基本思想18讲》第八讲,史宁中著,北京:北京师范大学出版社,2016。\n[^253]: 参见T.L.Heath, A Manual of Greek Mathematics, Oxford Press,\n1931,151。\n[^254]: 参见《什么是数学》,柯朗著,左平\n张饴慈译,上海:复旦大学出版社,2005年,156。\n[^255]: 在一般情况下,系数是固定不变的,而参数的确定通常与所要描述的问题背景有关。\n[^256]: 玻义耳比牛顿大16岁。玻义耳于1661年出版了著作《怀疑派化学家》,对化学的发展产生了重大影响,因此许多化学史家把1661年作为近代化学起始的标志。\n[^257]: 根据量子力学原理,当粒子的动能达到量子力学最低点时,所有粒子的运动停止,温度也就达到了绝对零度。\n[^258]: 1946年5月,\n67岁的爱因斯坦发起组织\"原子科学家紧急委员会\",并担任主席。委员会的宗旨就是告诫人们原子弹的危害,希望和平利用原子能,终止使用核武器,最终实现世界和平。\n[^259]: 参见《爱因斯坦全集·第七卷》,邹振隆主译,长沙:湖南科学技术出版社,2009年,34。\n[^260]: 更为详细讨论参见《数学基本思想18讲》第十七讲,史宁中著,北京:北京师范大学出版社,2016。\n[^261]: 参见Pearson,K., The Problem of the Random\nWalk,Nature,72(1905),294。\n[^262]: 参见《数学之书》问题164,皮寇弗著,陈以礼译,洪万生审定,重庆:重庆大学出版社,2015年。\n[^263]: 白噪声是一个物理学概念,是对一类功率谱密度相等的噪声情况的表达。如果用数学语言描述,是指随机变量序列独立同分布,均值为\n0,方差有限;如果还服从正态分布,则称为高斯白噪声。\n[^264]: 平稳性是时间序列的重要性质,述说随机变量x~t~和x~s~的协方差r(t,s)只与时间差t-s有关,与t无关,即对任意k均有r(t+k,s+k)=r(t,s)。这个性质保证时间序列样本均值是总体均值的无偏估计,样本方差是总体方差的拒绝无偏估计。\n[^265]: 美通常与审美关联,审美的英语单词Aesthetic源于希腊语Aesthetikos,原意就是感觉。\n[^266]: 参见《马克思恩格斯全集·二十卷·自然辩证法》,中共中央马克思恩格斯列宁斯大林著作编译局译,北京:人民出版社,1971年,610。\n[^267]: 参见《真理与美》,钱德拉塞卡著,杨建邺\n王晓明译,长沙:湖南科学技术出版社,2018年,88。\n[^268]: 参见《爱因斯坦文集·第一卷》,许良英\n范岱年编译,北京:商务印书馆,1976年,101。\n[^269]: 参见《马克思恩格斯选集·第2卷》,中共中央马克思恩格斯列宁斯大林著作编译局\n编译,北京:人民出版社,1972年,114。\n[^270]: 参见《对称》,外尔著,李红杰译,长沙:湖南科学技术出版社,2020年,3。\n[^271]: Pearson, K. and Lee A.,On the law of inheritance in\nman:Inheritance of Physical\nCharacters,Biometrika,1903(2),357-462。\n[^272]: 参见《大数据:创新、竞争和生产力的下一个新领》,麦肯锡公司报告,2011年5月。\n[^273]: Hartley,R.V.,Transmission of Information,The Bell System\nTechnical Journal, 1928, Vol.7, 535-563。\n[^274]: Wiener,N. CYBERNETICS or control and communication in the\nanimal and the machine,New York:\nWiley,1948;中文翻译参见《控制论:或关于在动物和机器中控制和通讯的科学》,维纳著,郝季仁译,北京:科学出版社,1962年。\n[^275]: Shannon,C. E.,A Mathematical Theory of Communication, The Bell\nSystem Technical Journal,1948,Vol.27, 379-423。\n[^276]: 参见《控制论》,维纳著,郝季仁译,北京:科学出版社,1962年,10。\n[^277]: 比特(bit)是指二进制的数位,是信息量的最小度量单位。\n[^278]: Kullback, S. and Leibler, R.A., On information and sufficiency.\nThe annals of mathematical statistics, 1951,22(1),pp 79-86。\n[^279]: 德国统计学家恩格尔(Ernst\nEngel,1821-1896)根据统计资料,对消费结构变化得出一个规律:一个家庭收入越少,家庭收入中用来购买食物的支出所占比例就越大,随着家庭收入的增加,购买食物的支出比例会下降。\n[^280]: 见《国务院关于印发打赢蓝天保卫战三年行动计划的通知》(国发〔2018〕22号)。\n[^281]: 这就是用频率估计概率的方法。\n[^282]: Shannon, C. E. and Weaver W., [A mathematical theory of\ncommunication](https://en.wikipedia.org/wiki/A_mathematical_theory_of_communication),The\nBell System Technical Journal, 1948(27), 379--423 and 623--656。\n[^283]: Simpson, E. H., Measurement of\ndiversity,Nature,1949(163),688。\n[^284]: 是基于整体数据判断得到的结论与基于分层数据判断得到结论不同所引发的悖论。比如,对某一种药的疗效进行判断,会出现这样的情况,通过男性和女性的分组数据进行判断,这个药都是有效的,但通过整体数据(男性数据与女性数据之和)进行判断,这个药却是无效的。\n[^285]: 参见《2025年的数学科学》总序,美国科学院国家研究理事会编著,刘小平\n李泽霞译,北京:科学出版社,2014年。\n[^286]: 这是与马云鹏教授等课标修订组小学组成员共同商定的结果。\n[^287]: 参见《振兴美国数学:90年代的计划》,美国国家研究委员会著,世界图书出版公司,1993年,1。\n[^288]: 这段文字是我翻译的。英文原文见Science,New\nSeries,Vol.240(1988),611-616。中译文可以参考\"模式的科学\",张晓东译,《世界科学》,1989年10期,4-10页。\n[^289]: 参见《爱因斯坦文集·第一卷》,许良英\n范岱年编译,北京:商务印书馆,1976年,313。\n[^290]: 参见《亚里士多德全集·Ⅱ》,苗力田主编,中国人民大学出版社,1991年,74、223。\n[^291]: 原著的名称是《关于力学和位置运动的两门新科学的对话》。因为教会的反对,这部书最初是在荷兰而不是在意大利出版的,参见《物理学史》,弗·卡约里著,戴念祖译,范岱年校,北京:中国人民大学出版社,2010年,30。\n[^292]: 参见《关于两门新科学的对话》,伽利略著,武际可译,北京:北京大学出版社,2006年,153。\n[^293]: 参见《近代物理科学的形而上学基础》,爱德文·阿瑟·伯特著,徐向东译,北京:北京大学出版社,2003年,56。\n[^294]: 参见《数形结合与数学模型--高中数学教学中的核心问题》话题17,史宁中,北京:高等教育出版社,2018年。\n[^295]: 伽利略发现单摆的等时性后,惠更斯利用单摆原理于1656年制作了第一台机械钟,但伽利略于1642年去世。\n[^296]: 参见Crew and De Salvio, Dialogues Concerning Two New Science,\nNew York, 1914, p179。\n[^297]: 比如说,杨振宁和李政道诺贝尔物理学奖的获得,依赖的是吴健雄设计的实验和实验的结果。\n[^298]: 美国经济学家弗里德曼研究持久收入消费理论,他认为,如果收入是持久的,那么相应的边际消费倾向a=1。参见\nA Statistical Illusion in Judging Keynesian Models,with S. Becker,\nJournal of Political Economy, Vol.65, No.1, 1957,\n64-75。弗里德曼获得1976年度诺贝尔经济学奖。\n[^299]: 参见《西方经济学:宏观部分(第五版)》第13章,高鸿业主编,北京:中国人民大学出版社,2011年。\n[^300]: 为了便于比较,称萨谬尔森的乘数-加速模型凯恩斯动态模型。模型参见\nSamuelson, P.A., Interaction between the Multiplier Analysis and the\nPrinciple of Acceleration. Review of Economics and\nStatistics,1939,21,75-78。中译文参见《诺贝尔经济学奖与数学》,史树中编著,北京:清华大学出版社,2002年,22。\n[^301]: 参见《数学史译文集》,刘金顺\n何绍庚译,上海:上海科学技术出版社,1981年,123。\n[^302]: 在本质上,这个思想是属于柏拉图的。",
|