'commit'

4 weeks ago · f720982ddc
parent 9c702ab8fb
commit f720982ddc
65 changed files with 444 additions and 109 deletions
--- a/dsRag/ElasticSearch/T1_CreatingMapping.py
+++ b/dsRag/ElasticSearch/T1_CreatingMapping.py
@ -15,7 +15,7 @@ mapping = {
        "properties": {
            "embedding": {
                "type": "dense_vector",
-                "dims": 200,  # 假设embedding维度为200
+                "dims": 200,  # embedding维度为200
                "index": True,
                "similarity": "l2_norm"  # 使用L2距离
            },
--- a/dsRag/ElasticSearch/T1_HelloWord.py
+++ b/dsRag/ElasticSearch/T1_HelloWord.py
@ -1,20 +0,0 @@
-# 初始化ES连接
-import urllib3
-from elasticsearch import Elasticsearch
-
-from Config import Config
-
-urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
-
-# 初始化ES连接时添加verify_certs=False
-es = Elasticsearch(
-    hosts=Config.ES_CONFIG['hosts'],
-    basic_auth=Config.ES_CONFIG['basic_auth'],
-    verify_certs=False  # 禁用证书验证
-)
-
-# 查询所有index
-indices = es.cat.indices(format='json')
-print(f"当前ES集群中共有 {len(indices)} 个index:")
-for idx in indices:
-    print(f"- {idx['index']}")
--- a/dsRag/ElasticSearch/T2_SplitTxt.py
+++ b/dsRag/ElasticSearch/T2_SplitTxt.py
@ -0,0 +1,96 @@
+import os
+
+from Util.SplitDocxUtil import SplitDocxUtil
+
+
+def split_into_blocks(text):
+    """按行遍历文本，发现'问题X'或'话题X'时开始分割，只移除前缀但保留整行内容"""
+    blocks = []
+    current_block = []
+    in_block = False
+    
+    for line in text.splitlines():
+        if line.startswith(('问题', '话题')) and any(c.isdigit() for c in line[:5]):
+            if in_block:
+                blocks.append('\n'.join(current_block))
+                current_block = []
+            in_block = True
+            # 循环移除问题和话题前缀后的数字
+            while line and (line.startswith(('问题', '话题')) or (line and line and line[0].isdigit())):
+                if line.startswith(('问题', '话题')):
+                    line = line[2:] if len(line) > 2 else line
+                elif line and line[0].isdigit():
+                    line = line[1:] if len(line) > 1 else line
+                line = line.strip()
+        if in_block and line:  # 只添加非空行
+            current_block.append(line)
+    
+    if current_block:
+        blocks.append('\n'.join(current_block))
+    
+    return [(i+1, block) for i, block in enumerate(blocks)]
+
+def process_document(input_path, output_dir):
+    """处理文档主函数"""
+    text = SplitDocxUtil.read_docx(input_path)
+    if not text:
+        print("无法读取输入文件内容")
+        return False
+    
+    # 清空目录操作已移到process_directory函数中
+
+    chunks = split_into_blocks(text)
+    print(f"共分割出{len(chunks)}个段落块")
+
+    saved_count = 0
+    for chunk_num, chunk in chunks:
+        chunk = chunk.strip()  # 确保去除空白字符
+        output_file = os.path.join(output_dir, f"{chunk_num}.txt")
+        if save_to_txt(chunk, output_file, mode='w'):
+            saved_count += 1
+
+    print(f"处理完成，共保存{saved_count}个文件到目录: {output_dir}")
+    return saved_count > 0
+
+# 保留原有的save_to_txt函数
+def save_to_txt(content, file_path, mode='w'):
+    """将内容保存到文本文件"""
+    try:
+        with open(file_path, mode, encoding='utf-8') as f:
+            f.write(content)
+        return True
+    except Exception as e:
+        print(f"保存文件{file_path}时出错: {str(e)}")
+        return False
+
+def process_directory(input_dir, output_dir):
+    """处理目录下所有docx文件"""
+    if not os.path.exists(input_dir):
+        print(f"输入目录不存在: {input_dir}")
+        return False
+    
+    # 确保输出目录存在并清空目录（只需一次）
+    if os.path.exists(output_dir):
+        for file in os.listdir(output_dir):
+            os.remove(os.path.join(output_dir, file))
+    os.makedirs(output_dir, exist_ok=True)
+    
+    docx_files = [f for f in os.listdir(input_dir) if f.lower().endswith('.docx')]
+    if not docx_files:
+        print(f"目录中没有找到docx文件: {input_dir}")
+        return False
+    
+    success_count = 0
+    for docx_file in docx_files:
+        input_path = os.path.join(input_dir, docx_file)
+        print(f"正在处理文件: {docx_file}")
+        if process_document(input_path, output_dir):
+            success_count += 1
+    
+    print(f"处理完成，共处理{success_count}/{len(docx_files)}个文件")
+    return success_count > 0
+
+if __name__ == "__main__":
+    input_dir = '../static/Txt'
+    output_dir = '../Txt/processed_chunks'
+    process_directory(input_dir, output_dir)
--- a/dsRag/ElasticSearch/Utils/ElasticsearchCollectionManager.py
+++ b/dsRag/ElasticSearch/Utils/ElasticsearchCollectionManager.py
@ -0,0 +1,111 @@
+from elasticsearch import Elasticsearch
+from elasticsearch.exceptions import NotFoundError
+import logging
+
+logger = logging.getLogger(__name__)
+
+
+class ElasticsearchCollectionManager:
+    def __init__(self, index_name):
+        """
+        初始化Elasticsearch索引管理器
+        :param index_name: Elasticsearch索引名称
+        """
+        self.index_name = index_name
+
+    def load_collection(self, es_connection):
+        """
+        加载索引，如果不存在则创建
+        :param es_connection: Elasticsearch连接
+        """
+        try:
+            if not es_connection.indices.exists(index=self.index_name):
+                logger.warning(f"Index {self.index_name} does not exist, creating new index")
+                self._create_index(es_connection)
+        except Exception as e:
+            logger.error(f"Failed to load collection: {str(e)}")
+            raise
+
+    def _create_index(self, es_connection):
+        """创建新的Elasticsearch索引"""
+        mapping = {
+            "mappings": {
+                "properties": {
+                    "user_input": {"type": "text"},
+                    "tags": {
+                        "type": "object",
+                        "properties": {
+                            "tags": {"type": "keyword"},
+                            "full_content": {"type": "text"}
+                        }
+                    },
+                    "timestamp": {"type": "date"},
+                    "embedding": {"type": "dense_vector", "dims": 200}
+                }
+            }
+        }
+        es_connection.indices.create(index=self.index_name, body=mapping)
+
+    def search(self, es_connection, query_embedding, search_params, expr=None, limit=5):
+        """
+        执行混合搜索（向量+关键字）
+        :param es_connection: Elasticsearch连接
+        :param query_embedding: 查询向量
+        :param search_params: 搜索参数
+        :param expr: 过滤表达式
+        :param limit: 返回结果数量
+        :return: 搜索结果
+        """
+        try:
+            # 构建查询
+            query = {
+                "query": {
+                    "script_score": {
+                        "query": {
+                            "bool": {
+                                "must": []
+                            }
+                        },
+                        "script": {
+                            "source": "cosineSimilarity(params.query_vector, 'embedding') + 1.0",
+                            "params": {"query_vector": query_embedding}
+                        }
+                    }
+                },
+                "size": limit
+            }
+
+            # 添加标签过滤条件
+            if expr:
+                query["query"]["script_score"]["query"]["bool"]["must"].append(
+                    {"nested": {
+                        "path": "tags",
+                        "query": {
+                            "terms": {"tags.tags": expr.split(" OR ")}
+                        }
+                    }}
+                )
+
+            logger.info(f"Executing search with query: {query}")
+            response = es_connection.search(index=self.index_name, body=query)
+            return response["hits"]["hits"]
+        except Exception as e:
+            logger.error(f"Search failed: {str(e)}")
+            raise
+
+    def query_by_id(self, es_connection, doc_id):
+        """
+        根据ID查询文档
+        :param es_connection: Elasticsearch连接
+        :param doc_id: 文档ID
+        :return: 文档内容
+        """
+        try:
+            response = es_connection.get(index=self.index_name, id=doc_id)
+            return response["_source"]
+        except NotFoundError:
+            logger.warning(f"Document with id {doc_id} not found")
+            return None
+        except Exception as e:
+            logger.error(f"Failed to query document by id: {str(e)}")
+            raise
--- a/dsRag/ElasticSearch/Utils/ElasticsearchConnectionPool.py
+++ b/dsRag/ElasticSearch/Utils/ElasticsearchConnectionPool.py
@ -0,0 +1,68 @@
+from elasticsearch import Elasticsearch
+from elasticsearch.connection import create_connection
+from elasticsearch.connection_pool import ConnectionPool
+from elasticsearch.exceptions import ConnectionError
+import threading
+import logging
+
+logger = logging.getLogger(__name__)
+
+
+class ElasticsearchConnectionPool:
+    def __init__(self, hosts, basic_auth, verify_certs=False, max_connections=50):
+        """
+        初始化Elasticsearch连接池
+        :param hosts: Elasticsearch服务器地址
+        :param basic_auth: 认证信息(username, password)
+        :param verify_certs: 是否验证SSL证书
+        :param max_connections: 最大连接数
+        """
+        self.hosts = hosts
+        self.basic_auth = basic_auth
+        self.verify_certs = verify_certs
+        self.max_connections = max_connections
+        self._connections = []
+        self._lock = threading.Lock()
+        self._initialize_pool()
+
+    def _initialize_pool(self):
+        """初始化连接池"""
+        for _ in range(self.max_connections):
+            self._connections.append(self._create_connection()
+
+    def _create_connection(self):
+        """创建新的Elasticsearch连接"""
+        return Elasticsearch(
+            hosts=self.hosts,
+            basic_auth=self.basic_auth,
+            verify_certs=self.verify_certs
+        )
+
+    def get_connection(self):
+        """从连接池获取一个连接"""
+        with self._lock:
+            if not self._connections:
+                logger.warning("Connection pool exhausted, creating new connection")
+                return self._create_connection()
+            return self._connections.pop()
+
+    def release_connection(self, connection):
+        """释放连接回连接池"""
+        with self._lock:
+            if len(self._connections) < self.max_connections:
+                self._connections.append(connection)
+            else:
+                try:
+                    connection.close()
+                except Exception as e:
+                    logger.warning(f"Failed to close connection: {str(e)}")
+
+    def close(self):
+        """关闭所有连接"""
+        with self._lock:
+            for conn in self._connections:
+                try:
+                    conn.close()
+                except Exception as e:
+                    logger.warning(f"Failed to close connection: {str(e)}")
+            self._connections.clear()
--- a/dsRag/StartEs.py
+++ b/dsRag/StartEs.py
@ -3,6 +3,7 @@ import subprocess
 import tempfile
 import urllib.parse
 import uuid
+import logging
 from contextlib import asynccontextmanager
 from io import BytesIO
 from logging.handlers import RotatingFileHandler
@ -16,16 +17,16 @@ from gensim.models import KeyedVectors
 from pydantic import BaseModel, Field, ValidationError
 from starlette.responses import StreamingResponse

-from Config.Config import MS_MODEL_PATH, MS_MODEL_LIMIT, MS_HOST, MS_PORT, MS_MAX_CONNECTIONS, MS_NPROBE, \
-    MS_COLLECTION_NAME
-from Milvus.Utils.MilvusCollectionManager import MilvusCollectionManager
-from Milvus.Utils.MilvusConnectionPool import *
-from Milvus.Utils.MilvusConnectionPool import MilvusConnectionPool
+from Config.Config import ES_CONFIG, MS_MODEL_PATH, MS_MODEL_LIMIT
+from ElasticSearch.Utils.ElasticsearchCollectionManager import ElasticsearchCollectionManager
+from ElasticSearch.Utils.ElasticsearchConnectionPool import ElasticsearchConnectionPool
 from Util.ALiYunUtil import ALiYunUtil

 # 初始化日志
 logger = logging.getLogger(__name__)
 logger.setLevel(logging.INFO)
+# 确保日志目录存在
+os.makedirs('Logs', exist_ok=True)
 handler = RotatingFileHandler('Logs/start.log', maxBytes=1024 * 1024, backupCount=5)
 handler.setFormatter(logging.Formatter('%(asctime)s - %(levelname)s - %(message)s'))
 logger.addHandler(handler)
@ -42,19 +43,30 @@ def html_to_word_pandoc(html_file, output_file):

@asynccontextmanager
 async def lifespan(app: FastAPI):
-    # 初始化Milvus连接池
-    app.state.milvus_pool = MilvusConnectionPool(host=MS_HOST, port=MS_PORT, max_connections=MS_MAX_CONNECTIONS)
+    # 初始化Elasticsearch连接池
+    app.state.es_pool = ElasticsearchConnectionPool(
+        hosts=ES_CONFIG["hosts"],
+        basic_auth=ES_CONFIG["basic_auth"],
+        verify_certs=ES_CONFIG["verify_certs"],
+        max_connections=50
+    )
+    logger.info("Elasticsearch连接池初始化完成")

    # 初始化集合管理器
-    app.state.collection_manager = MilvusCollectionManager(MS_COLLECTION_NAME)
-    app.state.collection_manager.load_collection()
+    app.state.collection_manager = ElasticsearchCollectionManager(ES_CONFIG["index_name"])
+    # 获取连接并加载索引
+    es_conn = app.state.es_pool.get_connection()
+    try:
+        app.state.collection_manager.load_collection(es_conn)
+    finally:
+        app.state.es_pool.release_connection(es_conn)

    # 初始化阿里云大模型工具
    app.state.aliyun_util = ALiYunUtil()

    yield
-    # 关闭Milvus连接池
-    app.state.milvus_pool.close()
+    # 关闭Elasticsearch连接池
+    app.state.es_pool.close()


 app = FastAPI(lifespan=lifespan)
@ -78,59 +90,61 @@ def text_to_embedding(text):
        return [0.0] * model.vector_size


-async def generate_stream(client, milvus_pool, collection_manager, query, documents):
+async def generate_stream(client, es_pool, collection_manager, query, documents):
    # 从连接池获取连接
-    connection = milvus_pool.get_connection()
+    es_conn = es_pool.get_connection()
    try:
        # 1. 将查询文本转换为向量
        current_embedding = text_to_embedding(query)

-        # 2. 搜索相关数据
-        search_params = {
-            "metric_type": "L2",  # 使用 L2 距离度量方式
-            "params": {"nprobe": MS_NPROBE}  # 设置 IVF_FLAT 的 nprobe 参数
-        }
-        # 动态生成expr表达式
+        # 2. 构建搜索参数
        if documents:
-            conditions = [f"array_contains(tags['tags'], '{doc}')" for doc in documents]
-            expr = " OR ".join(conditions)
+            expr = {
+                "bool": {
+                    "should": [
+                        {"terms": {"tags.tags": [doc]}} for doc in documents
+                    ],
+                    "minimum_should_match": 1
+                }
+            }
        else:
-            expr = ""  # 如果没有选择文档，返回空字符串
-        # 7. 将文本转换为嵌入向量
-        results = collection_manager.search(current_embedding,
-                                            search_params,
-                                            expr=expr,  # 使用in操作符
-                                            limit=5)  # 返回 5 条结果
+            expr = None
+            
+        # 3. 执行混合搜索
+        results = collection_manager.search(
+            es_conn,
+            current_embedding,
+            search_params={"k": 5},  # 返回5个结果
+            expr=expr,
+            limit=5
+        )
+        logger.info(f"搜索返回结果数量: {len(results) if results else 0}")

        # 3. 处理搜索结果
        logger.info("最相关的知识库内容:")
        context = ""
        if results:
-            for hits in results:
-                for hit in hits:
-                    try:
-                        # 查询非向量字段
-                        record = collection_manager.query_by_id(hit.id)
-                        if hit.distance < 0.88:  # 设置距离阈值
-                            logger.info(f"ID: {hit.id}")
-                            logger.info(f"标签: {record['tags']}")
-                            logger.info(f"用户问题: {record['user_input']}")
-                            logger.info(f"时间: {record['timestamp']}")
-                            logger.info(f"距离: {hit.distance}")
-                            logger.info("-" * 40)  # 分隔线
-                            # 获取完整内容
-                            full_content = record['tags'].get('full_content', record['user_input'])
-                            context = context + full_content
-                        else:
-                            logger.warning(f"距离太远，忽略此结果: {hit.id}")
-                            logger.info(f"标签: {record['tags']}")
-                            logger.info(f"用户问题: {record['user_input']}")
-                            logger.info(f"时间: {record['timestamp']}")
-                            logger.info(f"距离: {hit.distance}")
-                            continue
-
-                    except Exception as e:
-                        logger.error(f"查询失败: {e}")
+            for hit in results:
+                try:
+                    source = hit["_source"]
+                    score = hit["_score"]
+                    
+                    if score > 0.5:  # 设置相似度阈值
+                        logger.info(f"ID: {hit['_id']}")
+                        logger.info(f"标签: {source['tags']}")
+                        logger.info(f"用户问题: {source['user_input']}")
+                        logger.info(f"时间: {source['timestamp']}")
+                        logger.info(f"分数: {score}")
+                        logger.info("-" * 40)
+                        
+                        full_content = source['tags'].get('full_content', source['user_input'])
+                        context = context + full_content
+                    else:
+                        logger.warning(f"分数太低，忽略此结果: {hit['_id']}")
+                        continue
+
+                except Exception as e:
+                    logger.error(f"查询失败: {e}")
        else:
            logger.warning("未找到相关历史对话，请检查查询参数或数据。")

@ -161,10 +175,12 @@ async def generate_stream(client, milvus_pool, collection_manager, query, docume
        else:
            yield {"data": "没有在知识库中找到相关的信息，无法回答此问题。"}
    except Exception as e:
+        logger.error(f"生成报告时出错: {str(e)}")
        yield {"data": f"生成报告时出错: {str(e)}"}
    finally:
        # 释放连接
-        milvus_pool.release_connection(connection)
+        es_pool.release_connection(es_conn)
+        logger.info("Elasticsearch连接已释放")


 """
@ -262,4 +278,5 @@ async def rag_stream(request: Request):


 if __name__ == "__main__":
+    logger.info("启动Elasticsearch混合搜索服务")
    uvicorn.run(app, host="0.0.0.0", port=8000)
--- a/dsRag/Txt/processed_chunks/1.txt
+++ b/dsRag/Txt/processed_chunks/1.txt
@ -1,2 +1,2 @@
-数量是什么？数量关系的本质是什么？
-         数量是对现实生活中事物量的抽象 / 数量关系的本质是多与少
+古今异义
+同一个词古今意义发生了变化，这种现象叫古今异义。平时要注意积累古今异义的词语；做题时要细心体察，不要望文生义，以今代古。
--- a/dsRag/Txt/processed_chunks/106.txt
+++ b/dsRag/Txt/processed_chunks/106.txt
@ -1,4 +1,4 @@
-为什么要强调数据分析观念？
+： 为什么要强调数据分析观念？
 统计学研究的基础是数据，是通过对数据的分析得到产生数据背景的信息。由此可以知道，虽然在数据分析的过程中要用到数学，但统计学与数学还是有所不同的，因为数学研究的基础是抽象了的定义和假设。因此，在“统计与概率”的教学过程中一定要强调数据，强调数据分析观念。
 粗略地说，数据分析大体可以分为两种情况：一种情况不考虑数据的随机性，被称为描述统计；一种考虑数据的随机性，被称为推断统计。当然，在推断统计中也经常会用到描述统计的方法。
 描述统计。描述统计只是针对调查了的数据本身进行表述。比如，调查了全班同学的身高可以得到一个表格，但为了把这些数据表述得更加清晰，可以把身高分段、然后计算每个身高段的人数，形成条形统计图或者扇形统计图。还可以对这些数据进一步分析，得到一些特征数据，比如，最高身高、最低身高、平均身高等等，这样就表述了全班同学身高的信息。
--- a/dsRag/Txt/processed_chunks/107.txt
+++ b/dsRag/Txt/processed_chunks/107.txt
@ -1,3 +1,3 @@
-三种统计图之间有什么共性和差异？
+： 三种统计图之间有什么共性和差异？
 在“统计与概率”的教学内容中涉及到三种统计图：条形统计图，扇形统计图和折线统计图。这三种统计图都可以用来直观地表述数据，使得数据表述信息一目了然，这是三种统计图的共性。但就信息表述的功能而言，这三种统计图还是有所区别的：条形统计图更有利于表述数量的多少，扇形统计图更有利于表述数量所占的比例，折线统计图更有利于表述数量的变化。应当注意到的是，虽然各种统计图的功能有所不同，但只有“好坏”之分而无“对错”之分，也就是说，在实际描述中无论使用那种统计图都不能说是错，而应当说表述的不够好、或许还有更好的方法。这也是统计学与数学的不同之处，因为数学对结果更多地是强调对、或者错。
 即便如此，在教学过程中应当引导学生学会选取合适的表述方式，学会确立判断事物好坏的准则，学会基于准则的判断。因为日常生活中的许多问题往往没有“对错”之分只有“好坏”之分，因此引导学生学会选择更合适的方法是重要的。这也像“数据分析观念”中所解释的那样：了解对于同样的数据，可以有多种分析的方法，需要根据问题的背景选择合适的方法。当然，这里所说的分析方法还包括估计等许多内容，但思想的本质是一样的。
--- a/dsRag/Txt/processed_chunks/108.txt
+++ b/dsRag/Txt/processed_chunks/108.txt
@ -1,4 +1,4 @@
-如何理解数据的随机性？
+： 如何理解数据的随机性？
 数据随机性中所说的数据主要是指通过抽样所得到的那些数据，也就说，是推断统计所使用的那些数据。既然是从总体中抽取的一部分样本，那么样本数据就必然存在不确定性：多次抽取样本，每次得到的样本数据会有所不同。但是，这里所说的随机性与不确定性还是有所区别的，为了数据分析的需要，数据的随机性要求数据的获取尽可能地排除人为干扰的影响，尽可能地排除系统误差的影响。比如，可以参见《义务教育数学课程标准》的例22，这个例子是在“综合与实践”的内容中：
 让学生记录自己在一个星期内每天上学途中所需要的时间，并从这些数据中发现有用的信息。
 针对随机性，这个例子的“说明”中特别强调：事先调整家里钟表的时间，使其和学校钟表的时间保持一致；在调查期间需要保证每天上学途中的行为尽量一致。可以看到，前一个要求是为了避免系统误差，后一个要求是为了排除人为干扰。之所以这样要求的理由，我们在下一个问题“平均数的意义是什么”中再详细讨论。
--- a/dsRag/Txt/processed_chunks/109.txt
+++ b/dsRag/Txt/processed_chunks/109.txt
@ -1,4 +1,4 @@
-平均数的意义是什么？
+： 平均数的意义是什么？
 如果仅就数学而言，平均数只是一个包含了加法和除法的算式，对数学运算来说实在是无足轻重，但平均数在统计学中却是一个非常重要的概念。我们通过下面的统计模型来解释这个重要性，从中体会模型的重要性（参见问题18中关于模型的讨论），并且体会如何用数学的方法表述问题26和问题28中所说的随机性。
 因为对事物进行观测或者观察会有误差，因此在大多数情况下，通过抽样得到的数据也会有误差。我们通过下面的算式来描述这个问题，通常称这个算式为误差模型：
 x = μ + ε                                                                                 （10）
--- a/dsRag/Txt/processed_chunks/110.txt
+++ b/dsRag/Txt/processed_chunks/110.txt
@ -1,4 +1,4 @@
-什么是概率？如何得到概率？
+： 什么是概率？如何得到概率？
 在上面的几个问题中多次谈到了随机性。经验告诉我们，在日常生活和生产实践中，一些事情可能发生、也可能不发生，可能这样发生、也可能那样发生，人们通常称这样的事情为随机事件。而统计学和概率论的研究对象就是随机事件。
 概率是指随机事件发生可能性的大小，在一般意义上，这个可能性的大小是未知的。因为概率的英文单词是probability，于是人们通常用英语字母 p 表示概率。虽然概率是未知的，但生活经验告诉我们：可以认为概率是一个非负的、不大于1的数，即 0 ≦ p ≦ 1。当概率p = 0 时认为随机事件发生的可能性为0，即意味着这个事件几乎不能发生；当概率p = 1 时认为随机事件发生的可能性为1，即意味着这个事件几乎必然发生；而其他的随机事件都在几乎不能发生和几乎必然发生之间。
 至少可以有两种方法得到未知的概率：一种方法就是前面谈到的估计的方法，比如问题28中所说的估计红球所占比例，如果把这个比例理解为摸出红球的可能性的大小的话，那么问题28的操作过程就是在估计概率；还有一种方法就是不借助数据而直接根据背景定义概率，定义的概率实质上就是对随机事件发生可能性大小的一种度量，这个度量是人们在理想状态制定出来的。
--- a/dsRag/Txt/processed_chunks/141.txt
+++ b/dsRag/Txt/processed_chunks/141.txt
@ -1,3 +1,4 @@
+“如何认识自然数”的相关教学设计
 （马云鹏  东北师范大学教育学院）
 有关教学内容：万以内数的认识。
 课程标准要求：（第一学段）在现实情境中理解万以内数的意义，能认、读、写万以内的数，能用数表示物体的个数或事物的顺序和位置。
--- a/dsRag/Txt/processed_chunks/142.txt
+++ b/dsRag/Txt/processed_chunks/142.txt
@ -1,3 +1,4 @@
+“表示自然数的关键是什么”的相关教学设计
 （孙兴华  长春市树勋小学）
 有关教学内容：数位的认识。
 课程标准要求：（第一学段）能说出各数位的名称，理解各数位上的数字表示的意义；知道用算盘可以表示多位数。（第二学段）在具体情境中，认识万以上的数，了解十进制计数法，会用万、亿为单位表示大数。
--- a/dsRag/Txt/processed_chunks/143.txt
+++ b/dsRag/Txt/processed_chunks/143.txt
@ -1,3 +1,4 @@
+“如何认识自然数的性质”的相关教学设计
 （孙兴华  长春市树勋小学）
 有关教学内容：数的整除
 课程标准要求：（第二学段）知道2，3，5的倍数的特征，了解公倍数和最小公倍数；在1-100的自然数中，能找出10以内自然数的所有倍数，能找出10以内两个自然数的公倍数和最小公倍数。了解公因数和最大公因数；在1-100的自然数中，能找出一个自然数的所有因数，能找出两个自然数的公因数和最大公因数。了解自然数、整数、奇数、偶数、质（素）数和合数。
--- a/dsRag/Txt/processed_chunks/144.txt
+++ b/dsRag/Txt/processed_chunks/144.txt
@ -1,3 +1,4 @@
+“如何认识负数”的相关教学设计
 （孙兴华  长春市树勋小学）
 有关教学内容：负数的认识
 课程标准要求：（第二学段）在熟悉的生活情境中，了解负数的意义，会用负数表示日常生活中的一些量。
--- a/dsRag/Txt/processed_chunks/145.txt
+++ b/dsRag/Txt/processed_chunks/145.txt
@ -1,4 +1,5 @@
-（李宁宁  长春市树勋小学）
+“如何认识分数”的相关教学设计
+                                   （李宁宁  长春市树勋小学）
 有关教学内容：分数的认识
 课程标准要求：（第一学段）能结合具体情境初步认识分数，能读、写分数。会进行同分母分数（分母小于10)的加减运算。（第二学段）进一步认识小数和分数，认识百分数；会进行小数、分数和百分数的转化(不包括将循环小数化为分数 )。会比较小数、分数和百分数的大小并会分别进行简单的小数、分数(不含带分数 )加、减、乘、除运算及混合运算(以两步为主，不超过三步 )。会解决有关小数、分数和百分数的简单的实际问题 。
 可以看到，在小学阶段涉及分数的内容是比较多的，大体要求是：第一学段初步认识分数，第二学段理解应用分数。正如在问题6中所说的那样，分数主要表达自然数之间存在的两种关系：一种关系是整体的等分，一种关系是数量的比例。在初步认识分数的阶段，采用“整体的等分”（即通常所说的平均分）比较合适，在理解应用分数的阶段再逐步引入“数量的比例”。
--- a/dsRag/Txt/processed_chunks/146.txt
+++ b/dsRag/Txt/processed_chunks/146.txt
@ -1,3 +1,4 @@
+“如何认识小数”的相关教学设计
 （李宁宁  长春市树勋小学）
 有关教学内容：小数的认识
 课程标准要求：（第一学段）能结合具体情境初步认识小数，并能读、写小数。结合具体情境能比较两个一位小数的大小。（第二学段）结合具体情境理解小数的意义，会进行小数、分数和百分数的转化 (不包括将循环小数化为分数) ，会比较小数的大小并会分别进行简单的小数、分数 (不含带分数) 加、减、乘、除运算及混合运算 (以两步为主，不超过三步) 。会解决有关小数的简单实际问题。
--- a/dsRag/Txt/processed_chunks/147.txt
+++ b/dsRag/Txt/processed_chunks/147.txt
@ -1,3 +1,4 @@
+“什么是数感”的相关教学设计
 （王艳玲 东北师大附小）
 有关教学内容：数的认识
 课程标准要求：“数感”是课程标准中规定的一个核心概念，在课程内容中没有具体要求，只是在第一学段“数学思考”中提到：“在运用数及适当的度量单位描述现实生活中的简单现象，以及对运算结果进行估计的过程中，发展数感。”
--- a/dsRag/Txt/processed_chunks/148.txt
+++ b/dsRag/Txt/processed_chunks/148.txt
@ -1,3 +1,4 @@
+“如何解释自然数的加法运算”的相关教学设计
 （刘艳平  东北师大附小）
 有关教学内容：自然数的加法
 课程标准要求：（第一学段）结合具体情境，体会整数四则运算的意义；能口算简单的百以内的加减法；能运用数的运算解决生活中的简单问题，能对结果的实际意义做出解释。
--- a/dsRag/Txt/processed_chunks/149.txt
+++ b/dsRag/Txt/processed_chunks/149.txt
@ -1,3 +1,4 @@
+“乘法是加法的简便运算吗”的相关教学设计
 （杨静  东北师大附小）
 有关教学内容：自然数的乘法
 课程标准要求：（第一学段）结合具体情境，体会整数四则运算的意义。
--- a/dsRag/Txt/processed_chunks/150.txt
+++ b/dsRag/Txt/processed_chunks/150.txt
@ -1,3 +1,4 @@
+“为什么说除法是乘法的逆运算”相关教学设计
 （孙兴华  长春市树勋小学）
 有关教学内容：除法的认识
 课程标准要求：（第二学段）在具体运算和解决简单实际问题的过程中，体会加与减、乘与除的互逆关系。
--- a/dsRag/Txt/processed_chunks/151.txt
+++ b/dsRag/Txt/processed_chunks/151.txt
@ -1,3 +1,4 @@
+“为什么混合运算要先乘除后加减”的相关教学设计
 （孙兴华  长春市树勋小学）
 有关教学内容：混合运算
 课程标准要求：（第一学段）认识小括号，能进行简单的整数四则混合运算（两步）。（第二学段）认识中括号，能进行简单的整数四则混合运算（以两步为主，不超过三步）。
--- a/dsRag/Txt/processed_chunks/152.txt
+++ b/dsRag/Txt/processed_chunks/152.txt
@ -1,3 +1,4 @@
+“为什么要学习估算”的相关教学设计
 （岳莹  长春市树勋小学）
 有关教学内容：估算
 课程标准要求：（第一学段）在具体情境中，能选择适当的单位，进行简单的估算。（第二学段）在解决问题的过程中，能选择合适的方法进行估算。
--- a/dsRag/Txt/processed_chunks/153.txt
+++ b/dsRag/Txt/processed_chunks/153.txt
@ -1,3 +1,4 @@
+“什么是符号意识”的相关教学设计
 （杨宇 长春市第一实验小学）
 有关教学内容：使用符号的意识
 课程标准要求：（第二学段）在具体情境中能用字母表示数。结合简单的实际情境，了解等量关系，并能用字母表示。在课程标准中，符号意识是作为核心概念提出的：能够理解并且运用符号表示数、数量关系和变化规律；知道使用符号可以进行运算和推理，得到的结论具有一般性。建立符号意识有助于学生理解符号的使用是数学表达和进行数学思考的重要形式。
--- a/dsRag/Txt/processed_chunks/154.txt
+++ b/dsRag/Txt/processed_chunks/154.txt
@ -1,4 +1,4 @@
-的相关教学设计
+“小学数学中有哪些模型” 的相关教学设计
 （王艳玲 东北师大附小）
 有关教学内容：模型的认识
 课程标准要求：模型思想是作为核心概念提出的：模型思想的建立是学生体会和理解数学与外部世界联系的基本途径。建立和求解模型的过程包括：从现实生活或具体情境中抽象出数学问题，用数学符号建立方程、不等式、函数等表示数学问题中的数量关系和变化规律，求出结果并讨论结果的意义。这些内容的学习有助于初步形成模型思想，提高学习数学的兴趣和应用意识。
--- a/dsRag/Txt/processed_chunks/155.txt
+++ b/dsRag/Txt/processed_chunks/155.txt
@ -1,3 +1,4 @@
+“如何理解点、线、面、体、角”的相关教学设计
 （高俊生 东北师大附小）
 有关教学内容：角的认识
 课程标准要求：（第一学段）结合生活情境认识角，了解直角、锐角和钝角。（第二学段）知道平角与周角，了解周角、平角、钝角、直角、锐角之间的大小关系。
--- a/dsRag/Txt/processed_chunks/156.txt
+++ b/dsRag/Txt/processed_chunks/156.txt
@ -1,3 +1,4 @@
+“如何理解长度、面积、体积”的相关教学设计
 （朱颖 东北师大附小）
 有关教学内容：长度单位、面积单位和体积单位的认识
 课程标准要求：（第一学段）结合生活实际，经历用不同方式测量物体长度的过程，体会建立统一度量单位的重要性。在实践活动中，体会并认识长度单位千米、米、厘米，知道分米、毫米，能进行简单的单位换算，能恰当地选择长度单位。能估测一些物体的长度，并进行测量。（第二学段）探索并掌握三角形、平行四边形和梯形的面积公式，并能解决简单的实际问题。知道面积单位千米2、公顷。探索并掌握圆的面积公式，并能解决简单的实际问题。会用方格子估计不规则图形的面积。通过实例了解体积（包括容积）的意义及度量单位，能进行单位之间的换算。结合具体情境，探索并掌握长方体、正方体、圆柱的体积和表面积以及圆锥体积的计算方法，并能解决简单的实际问题。体验某些实物（如土豆等）体积的测量方法。
--- a/dsRag/Txt/processed_chunks/157.txt
+++ b/dsRag/Txt/processed_chunks/157.txt
@ -1,3 +1,4 @@
+“如何理解平移、旋转、轴对称”相关教学设计
 （岳莹  长春市树勋小学）
 有关教学内容：平移、旋转、轴对称的认识
 课程标准要求：（第一学段）结合实例，感受平移、旋转、轴对称现象。能辨认简单图形平移后的图形。通过观察、操作，初步认识轴对称图形。（第二学段）通过观察、操作等活动，进一步认识轴对称图形及其对称轴，能在方格纸上画出轴对称图形的对称轴；能在方格纸上补全一个简单的轴对称图形。通过观察、操作等，在方格纸上认识图形的平移与旋转，能在方格纸上按水平或垂直方向将简单图形平移，会在方格纸上将简单图形旋转90°。能利用方格纸按一定比例将简单图形放大或缩小。能从平移、旋转和轴对称的角度欣赏生活中的图案，并运用它们在方格纸上设计简单的图案。
--- a/dsRag/Txt/processed_chunks/158.txt
+++ b/dsRag/Txt/processed_chunks/158.txt
@ -1,3 +1,4 @@
+“三种统计图之间有什么共性和差异”相关教学设计
 （赵艳辉 东北师大附小）
 有关教学内容：条形统计图、扇形统计图、折线统计图的认识
 课程标准要求：（第二学段）认识条形统计图、扇形统计图、折线统计图，能用条形统计图、折线统计图直观且有效地表示数据。能从报纸杂志、电视等媒体中，有意识地获得一些数据信息，并能读懂简单的统计图表。
--- a/dsRag/Txt/processed_chunks/159.txt
+++ b/dsRag/Txt/processed_chunks/159.txt
@ -1,3 +1,4 @@
+“平均数的意义是什么”相关教学设计
 （刘艳平  东北师大附小）
 有关教学内容：平均数的认识
 课程标准要求：（第二学段）体会平均数的作用，能计算平均数，能用自己的语言解释其实际意义。能解释统计结果，根据结果做出简单的判断和预测，并能进行交流。
--- a/dsRag/Txt/processed_chunks/2.txt
+++ b/dsRag/Txt/processed_chunks/2.txt
@ -1,3 +1,2 @@
-如何认识自然数？
-         数是对数量的抽象 / 数关系是对数量关系的抽象：大与小 / 可以有两种方法实现这种抽
-象：对应的方法和定义的方法
+一词多义
+文言实词往往具有几个甚至十几个义项，这种现象叫一词多义。对常用的多义词，要弄清其本义与引申义之间的关系，系统地掌握词义。如，“朝”本义是早晨，由于古代臣子在早晨拜见帝王，便引申为“朝见、朝拜”；由“朝见”又引申为朝见的处所“朝廷”；又引申为朝代。考生要善于根据相关词句（具体语境）准确理解词义。
--- a/dsRag/Txt/processed_chunks/26.txt
+++ b/dsRag/Txt/processed_chunks/26.txt
@ -1,2 +1,2 @@
-为什么要强调数据分析观念？
+： 为什么要强调数据分析观念？
           统计学研究的基础是数据 / 描述数据分析 / 推断数据分析 / 通过样本推断总体
--- a/dsRag/Txt/processed_chunks/27.txt
+++ b/dsRag/Txt/processed_chunks/27.txt
@ -1,3 +1,3 @@
-三种统计图之间有什么共性和差异？
+： 三种统计图之间有什么共性和差异？
 直观地表述数据是三种统计图的共性 / 条形统计图表述数量的多少 / 扇形统计图表
 述数量的比例 / 折线统计图表述数量的变化
--- a/dsRag/Txt/processed_chunks/28.txt
+++ b/dsRag/Txt/processed_chunks/28.txt
@ -1,3 +1,3 @@
-如何理解数据的随机性？
+： 如何理解数据的随机性？
 随机性与不确定性有所区别 / 减少系统误差 / 减少人为因素 / 估计是统计推断的重
 要手段 / 最大似然估计 / 通过样本频率估计概率
--- a/dsRag/Txt/processed_chunks/29.txt
+++ b/dsRag/Txt/processed_chunks/29.txt
@ -1,3 +1,3 @@
-平均数的意义是什么？
+： 平均数的意义是什么？
           样本平均数不仅是一个算式 / 误差模型 / 误差的随机性：正负抵消和为零 / 样本平均
 数是随机的 / 样本平均数是无偏估计
--- a/dsRag/Txt/processed_chunks/3.txt
+++ b/dsRag/Txt/processed_chunks/3.txt
@ -1,2 +1,2 @@
-表示自然数的关键是什么？
-         十个符号和数位 / 数位法则是依次相差十倍 / 自然数集合
+词类活用
+古代汉语中有些词语在特定的语言环境中，临时具有某种语法功能，并且临时改变了词性，有的还改变了读音，这就是词类活用。要掌握名词活用为一般动词，形容词活用为一般动词，数词活用为一般动词，动词的使动用法，形容词的使动用法，形容词的意动用法，名词的意动用法，动词用作名词，名词作状语，结合语境进行判断。
--- a/dsRag/Txt/processed_chunks/30.txt
+++ b/dsRag/Txt/processed_chunks/30.txt
@ -1,4 +1,4 @@
-什么是概率？如何得到概率？
+： 什么是概率？如何得到概率？
 概率是随机事件发生的属性 / 概率是未知的 / 估计概率 / 定义概率 / 定义概率是一
 种度量 / 古典概率模型
 附录1  若干与小学数学有关的话题
--- a/dsRag/Txt/processed_chunks/4.txt
+++ b/dsRag/Txt/processed_chunks/4.txt
@ -1,2 +1,2 @@
-如何认识自然数的性质？
-         依据性质可以对自然数进行分类 / 奇数与偶数 / 素数与合数
+偏义复词
+偏义复词就是一个词由两个意义相近、相对或相反的语素构成，其中只有一个语素表示意义，另一个语素不表示意义，只作陪衬。教材中的偏义复词的数量不多，因此要进行归纳总结。平时训练要注意积累，考场作答要体察语境，认真比较。
--- a/dsRag/Txt/processed_chunks/5.txt
+++ b/dsRag/Txt/processed_chunks/5.txt
@ -1,2 +1,2 @@
-如何认识负数？
-         负整数是与自然数数量相等意义相反的数 / 绝对值表示数量
+文言虚词
+理解常见文言虚词在文中的用法。常见文言虚词：而、何、乎、乃、其、且、若、所、为、焉、也、以、因、于、与、则、者、之。
--- a/dsRag/Txt/processed_chunks/6.txt
+++ b/dsRag/Txt/processed_chunks/6.txt
@ -1,2 +1,7 @@
-如何认识分数？
-         分数本身是数而不是运算 / 整体与等分关系 / 整比例关系
+判断句
+白话文用动词“是”联系判断句中两部分，而文言文中判断句的主要特点是不用判断词，而以主语谓语直接相续。文言文表判断的常见句式有：
+1．用助词“者”和“也”配合表示判断。例如：廉颇者，赵之良将也。夫战，勇气也。粟者，民之所种。
+2．在主谓间用“即、乃、则、皆、本、诚、亦、素”等副词表示肯定判断，兼加强语气。例如：①若事之不济，此乃天也。②此诚危急存亡之秋也。③梁父即楚将项燕。④此则岳阳楼之大观也。⑤环滁皆山也。⑥臣本布衣。“乃”“则”“即”有“就是”之意。
+3．动词“为”和判断词“是”表示判断。例如：①此为何若人？②问今是何世？
+4．“者”也”都不用，完全凭句意去判断。例如刘备，天下袅雄。
+5．用否定副词“非”表示否定判断，例如：视之，非字而画。
--- a/dsRag/Txt/processed_chunks/61.txt
+++ b/dsRag/Txt/processed_chunks/61.txt
@ -0,0 +1 @@
+“如何认识自然数”的相关教学设计
--- a/dsRag/Txt/processed_chunks/62.txt
+++ b/dsRag/Txt/processed_chunks/62.txt
@ -0,0 +1 @@
+“表示自然数的关键是什么”的相关教学设计
--- a/dsRag/Txt/processed_chunks/63.txt
+++ b/dsRag/Txt/processed_chunks/63.txt
@ -0,0 +1 @@
+“如何认识自然数的性质”的相关教学设计
--- a/dsRag/Txt/processed_chunks/64.txt
+++ b/dsRag/Txt/processed_chunks/64.txt
@ -0,0 +1 @@
+“如何认识负数”的相关教学设计
--- a/dsRag/Txt/processed_chunks/65.txt
+++ b/dsRag/Txt/processed_chunks/65.txt
@ -0,0 +1 @@
+“如何认识分数”的相关教学设计
--- a/dsRag/Txt/processed_chunks/66.txt
+++ b/dsRag/Txt/processed_chunks/66.txt
@ -0,0 +1 @@
+“如何认识小数”的相关教学设计
--- a/dsRag/Txt/processed_chunks/67.txt
+++ b/dsRag/Txt/processed_chunks/67.txt
@ -0,0 +1 @@
+“什么是数感”的相关教学设计
--- a/dsRag/Txt/processed_chunks/68.txt
+++ b/dsRag/Txt/processed_chunks/68.txt
@ -0,0 +1 @@
+“如何解释自然数的加法运算”的相关教学设计
--- a/dsRag/Txt/processed_chunks/69.txt
+++ b/dsRag/Txt/processed_chunks/69.txt
@ -0,0 +1 @@
+“乘法是加法的简便运算吗”的相关教学设计
--- a/dsRag/Txt/processed_chunks/7.txt
+++ b/dsRag/Txt/processed_chunks/7.txt
@ -1,2 +1,7 @@
-如何认识小数？
-         对应的方法 / 重新理解十进制 / 基底与线性组合 / 表示有理数与无理数
+被动句
+在动词作谓语的句子里，主语不是动词所表示的动作的施动者，而是动作的承受者，这种句式叫被动句。常见的文言被动句有以下几种：
+1．在动词谓语后边也用介词“于”，把动作行为的主动者介绍出来，例如：①而君幸于赵王。②怀王以不知忠臣之分，故内惑于郑袖，外欺于张仪。
+2．介词“为”引出动作行为主动者或配合“所”字一起使用，例如：身客死于秦，为天下笑。贾家庄几为巡徼所陵迫死。不者，若属皆且为所虏。
+3．在动词前边用“见”作为被动标志，例如：秦城恐不可得，徒见欺。又可以再在动词后边用介词“于”引出动作行为主动者，例如：臣诚恐见欺于王而负赵。
+4．在动词前边用“受”，同时在动词后边用介词“于”引出动作行为的主动者，例如：吾不能举全吴之地，十万之众，受制于人。
+5．在动词前边用介词“被”作为标志，例如：曲罢曾教善才服，妆成每被秋娘妒。或者配合介词“于”引出行为主动者，例如：燕以万乘之国被围于赵。
--- a/dsRag/Txt/processed_chunks/70.txt
+++ b/dsRag/Txt/processed_chunks/70.txt
@ -0,0 +1 @@
+“为什么说除法是乘法的逆运算”相关教学设计
--- a/dsRag/Txt/processed_chunks/71.txt
+++ b/dsRag/Txt/processed_chunks/71.txt
@ -0,0 +1 @@
+“为什么混合运算要先乘除后加减”的相关教学设计
--- a/dsRag/Txt/processed_chunks/72.txt
+++ b/dsRag/Txt/processed_chunks/72.txt
@ -0,0 +1 @@
+“为什么要学习估算”的相关教学设计
--- a/dsRag/Txt/processed_chunks/73.txt
+++ b/dsRag/Txt/processed_chunks/73.txt
@ -0,0 +1 @@
+“什么是符号意识”的相关教学设计
--- a/dsRag/Txt/processed_chunks/74.txt
+++ b/dsRag/Txt/processed_chunks/74.txt
@ -0,0 +1 @@
+“方程的本质是什么”的相关教学设计
--- a/dsRag/Txt/processed_chunks/75.txt
+++ b/dsRag/Txt/processed_chunks/75.txt
@ -1 +1 @@
-的相关教学设计
+“小学数学中有哪些模型” 的相关教学设计
--- a/dsRag/Txt/processed_chunks/76.txt
+++ b/dsRag/Txt/processed_chunks/76.txt
@ -0,0 +1 @@
+“如何理解点、线、面、体、角”的相关教学设计
--- a/dsRag/Txt/processed_chunks/77.txt
+++ b/dsRag/Txt/processed_chunks/77.txt
@ -0,0 +1 @@
+“如何理解长度、面积、体积”的相关教学设计
--- a/dsRag/Txt/processed_chunks/78.txt
+++ b/dsRag/Txt/processed_chunks/78.txt
@ -0,0 +1 @@
+“如何理解平移、旋转、轴对称”相关教学设计
--- a/dsRag/Txt/processed_chunks/79.txt
+++ b/dsRag/Txt/processed_chunks/79.txt
@ -0,0 +1 @@
+“三种统计图之间有什么共性和差异”相关教学设计
--- a/dsRag/Txt/processed_chunks/8.txt
+++ b/dsRag/Txt/processed_chunks/8.txt
@ -1,3 +1,15 @@
-什么是数感？
-         数与现实的联系 / 抽象的核心是舍去现实背景 / 联系的核心是回归现实背景
-第二部分  数的运算
+倒装句
+(一)宾语前置句
+在古代汉语里，宾语的位置也和现代汉语一样，一般都在动词(或介词)的后面，但为了强调宾语，在一定条件下，就把它放在动词(或介词)的前面。宾语前置可分为以下几种情况；
+1．在疑问句里，作宾语的疑问代词(安、何、谁等)，一般提到动词或介词前。例如；①沛公安在？②富者曰：“子何持而往？”③微斯人，吾谁与归？④何以效之？
+2．在否定句里，作宾语的代词，也都提到动词的前边，例如：①时人莫之许也。②三岁贯女，莫我肯顾③彼不我恩也。
+3．为了强调宾语，借助“之”“是”等的帮助，把宾语从词的后面提到动词的前面。这“之”“是”便成了宾语提前的标志，无其他义。例如：①孔子云：“何陋之有？”②唯利是图。
+4．介词宾语的前置。例如；①国胡以相恤？②一言以蔽之。
+(二)定语后置句
+1．“……者……”为标志。例：石之铿然有声者(《石钟山记》)
+2．“……之……”为标志。例：蚓无爪牙之利，筋骨之强(《劝学》)
+(三)状语后置句
+1．“于”为标志的介宾短语。例：季氏将有事于颛臾(《季氏将伐颛臾》)
+2．“以”为标志的介宾短语。例：虽董之以严刑，振之以威怒(《谏太宗十思疏》)
+(四)主谓倒装句
+例；甚矣，乌纱之横、皂隶之俗哉。(《虎丘记》)
--- a/dsRag/Txt/processed_chunks/80.txt
+++ b/dsRag/Txt/processed_chunks/80.txt
@ -1,4 +1,5 @@
-前  言
+“平均数的意义是什么”相关教学设计
+                                        前  言
 自从1998年担任东北师范大学校长以后，我开始关注基础教育，但关注的是一般性的问题，并没有深入到学科内部。2005年，接受教育部的委托，担任了《义务教育数学课程标准》修改组的组长以后，才开始真正思考数学教育。思考课程标准应当规定哪些教学内容，为什么要规定这些内容，这些内容的教育价值是什么？思考数学的本质是什么，应当如何在教学中体现这些本质？进一步，开始思考数学教育的本质，为了学生一生的发展，在义务教育阶段应当实施一种什么样的数学教育？开始思考培养创新性人才的核心是什么，应当通过什么样的教学活动进行培养？
 思考的结果，促使我在传统的课程目标、即基础知识和基本技能这“双基”的基础上，又加上了数学的基本思想和基本活动经验，形成了“四基”的课程目标。与传统的“双基”不同，基本思想和基本活动经验是一种隐性的东西，不言而喻，恰恰是这种隐性的东西体现了数学素养。我确信：数学素养的培养、特别是创新人才的培养是“悟”出来的而不是“教”出来的；数学的结果是“看”出来的而不是“证”出来的。可以想象，会“悟”会“看”的底蕴是把握数学思想，会“悟”会“看”的教育是一种经验的积累（包括思维的经验和实践的经验），需要受教育者本人的思考和实践，因此，受教育者本人参与其中的教育教学活动是至关重要的。
 令人欣慰的是，“四基”的提出得到修改组的成员的一致支持，后来又得到数学家、数学教育专家、教研员、以及活跃在教学第一线教师的广泛支持。这样的支持迫使我更加深入地思考：数学基本思想是什么？为此，我给出了一个判定数学基本思想的准则，这个准则包含两条：一是数学的产生和发展所必须依赖的那些思想；二是学习过数学的人与没有学习过数学的人的思维差异。这样，就把数学思想归纳为三方面的内容，可以用六个字表达：抽象、推理、模型。我计划写六本书来说明这些想法，即每一方面的内容写两本书。在东北师范大学出版社的敦促下，已经写完五本并陆续出版了。
--- a/dsRag/Txt/processed_chunks/82.txt
+++ b/dsRag/Txt/processed_chunks/82.txt
@ -1,4 +1,4 @@
-如何认识自然数？ 
+如何认识自然数？
 数是对数量的抽象，数的关系是对数量关系的抽象。在问题1中已经谈到，为了更好地研究现实世界中量的关系，就必须对数量进行更一般的抽象。抽象的结果就是自然数。在这个抽象过程中，人们把数量关系也一并抽象出来，形成数的关系。数量关系的本质是多与少，与此对应，数的关系的本质是大与小。因此，自然数是对数量、以及数量关系的抽象。可以有两种方法实现这种抽象，或者说，可以有两种方法认识自然数。
 一种方法是基于对应的。基于对应的抽象过程大概是这样的：首先利用图形对应表示事物数量的多少，然后再对图形的多少进行命名，最后把命名了的东西符号化。比如，
 □□ ←→ 2，
--- a/dsRag/Txt/processed_chunks/9.txt
+++ b/dsRag/Txt/processed_chunks/9.txt
@ -1,2 +1,7 @@
-如何解释自然数的加法运算？
-         可以有两种方法解释加法：对应的方法和定义的方法 / 如何体现数学思想
+省略句
+文言文某些词或某些成分经常省略，比白话文多见。
+1．省主语。例如：(成名)喜而捕之，(虫)一鸣辄跃去，(虫)行且速。
+2．省谓语动词。例如：一鼓作气，再(鼓)而衰，三(鼓)而竭。
+3．省宾语。①省动词宾语。例如：权起更衣，肃追(之)于宇下。②省介词宾语。例如：秦王不怿，为(之)一击缶。
+4．省介词。例如：将军战(于)河北，臣战(于)河南。
+5．省量词。例如：①蟹六(只)跪而二(只)整。②寒暑易节，始一(次)反焉。
				`@ -0,0 +1 @@`
				`“如何认识自然数”的相关教学设计`
				`@ -0,0 +1 @@`
				`“表示自然数的关键是什么”的相关教学设计`
				`@ -0,0 +1 @@`
				`“如何认识自然数的性质”的相关教学设计`
				`@ -0,0 +1 @@`
				`“如何认识负数”的相关教学设计`
				`@ -0,0 +1 @@`
				`“如何认识分数”的相关教学设计`
				`@ -0,0 +1 @@`
				`“如何认识小数”的相关教学设计`
				`@ -0,0 +1 @@`
				`“如何解释自然数的加法运算”的相关教学设计`
				`@ -0,0 +1 @@`
				`“乘法是加法的简便运算吗”的相关教学设计`
				`@ -0,0 +1 @@`
				`“为什么说除法是乘法的逆运算”相关教学设计`
				`@ -0,0 +1 @@`
				`“为什么混合运算要先乘除后加减”的相关教学设计`