diff --git a/dsRag/Config/__pycache__/Config.cpython-310.pyc b/dsRag/Config/__pycache__/Config.cpython-310.pyc index 4eca10f9..a5b9b101 100644 Binary files a/dsRag/Config/__pycache__/Config.cpython-310.pyc and b/dsRag/Config/__pycache__/Config.cpython-310.pyc differ diff --git a/dsRag/Config/__pycache__/__init__.cpython-310.pyc b/dsRag/Config/__pycache__/__init__.cpython-310.pyc index 2278514c..b3f99ca7 100644 Binary files a/dsRag/Config/__pycache__/__init__.cpython-310.pyc and b/dsRag/Config/__pycache__/__init__.cpython-310.pyc differ diff --git a/dsRag/Milvus/Utils/__pycache__/MilvusCollectionManager.cpython-310.pyc b/dsRag/Milvus/Utils/__pycache__/MilvusCollectionManager.cpython-310.pyc index 9a2fb6c6..bca00b2a 100644 Binary files a/dsRag/Milvus/Utils/__pycache__/MilvusCollectionManager.cpython-310.pyc and b/dsRag/Milvus/Utils/__pycache__/MilvusCollectionManager.cpython-310.pyc differ diff --git a/dsRag/Milvus/Utils/__pycache__/MilvusConnectionPool.cpython-310.pyc b/dsRag/Milvus/Utils/__pycache__/MilvusConnectionPool.cpython-310.pyc index 882bb3f3..ea6f6271 100644 Binary files a/dsRag/Milvus/Utils/__pycache__/MilvusConnectionPool.cpython-310.pyc and b/dsRag/Milvus/Utils/__pycache__/MilvusConnectionPool.cpython-310.pyc differ diff --git a/dsRag/Milvus/Utils/__pycache__/__init__.cpython-310.pyc b/dsRag/Milvus/Utils/__pycache__/__init__.cpython-310.pyc index 2c4b0099..ca15b8e5 100644 Binary files a/dsRag/Milvus/Utils/__pycache__/__init__.cpython-310.pyc and b/dsRag/Milvus/Utils/__pycache__/__init__.cpython-310.pyc differ diff --git a/dsRag/Milvus/X3_SplitTxt.py b/dsRag/Milvus/X3_SplitTxt.py index fd23e453..cdab9c3b 100644 --- a/dsRag/Milvus/X3_SplitTxt.py +++ b/dsRag/Milvus/X3_SplitTxt.py @@ -65,6 +65,7 @@ def save_to_txt(content, file_path, mode='w'): if __name__ == "__main__": #input_file = '../static/Txt/小学数学教学中的若干问题.docx' - input_file = '../static/Txt/小学数学知识点.docx' + #input_file = '../static/Txt/小学数学知识点.docx' + input_file = '../static/Txt/高中文言文.docx' output_dir = '../Txt/processed_chunks' process_document(input_file, output_dir) diff --git a/dsRag/Milvus/X4_InsertData.py b/dsRag/Milvus/X4_InsertData.py index 0420019b..9aa469a0 100644 --- a/dsRag/Milvus/X4_InsertData.py +++ b/dsRag/Milvus/X4_InsertData.py @@ -7,7 +7,7 @@ import os import time # 需要进行标记的标签 -selectedTags = ["MATH_DATA_2", "小学数学"] +selectedTags = ["CHINESE_DATA_1", "高中语文文言文"] # 1. 加载预训练的 Word2Vec 模型 model_path = MS_MODEL_PATH diff --git a/dsRag/Milvus/__pycache__/__init__.cpython-310.pyc b/dsRag/Milvus/__pycache__/__init__.cpython-310.pyc index c393183f..bdbac209 100644 Binary files a/dsRag/Milvus/__pycache__/__init__.cpython-310.pyc and b/dsRag/Milvus/__pycache__/__init__.cpython-310.pyc differ diff --git a/dsRag/Txt/processed_chunks/1.txt b/dsRag/Txt/processed_chunks/1.txt index 6a946440..2646f730 100644 --- a/dsRag/Txt/processed_chunks/1.txt +++ b/dsRag/Txt/processed_chunks/1.txt @@ -1,7 +1,2 @@ -1年级数学知识点 -1年级是孩子们接触数学的开始,主要以数的概念和基础运算为主。 -数的认识:孩子们学习1到100的数字,能够正确读、写、比较、排序。理解数字的顺序,并掌握1-10的基础加减法。 -基本的加减法:通过具体物品的摆放和操作,帮助孩子理解加法和减法的意义。例如,通过小棒、苹果等实物帮助学生理解“加”和“减”操作。 -十位与个位:引导学生理解10以内数字的加法和减法,同时认识到十位和个位的不同,学习如何进行十位和个位的分解。 -时间的概念:学习读钟表、了解时间的基本单位(如秒、分、时)。 -平面图形:认识简单的平面几何图形,如正方形、长方形、三角形、圆形等,能够根据图形的特征进行简单分类。 \ No newline at end of file +古今异义 +同一个词古今意义发生了变化,这种现象叫古今异义。平时要注意积累古今异义的词语;做题时要细心体察,不要望文生义,以今代古。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/2.txt b/dsRag/Txt/processed_chunks/2.txt index 82ee5fdf..21223c65 100644 --- a/dsRag/Txt/processed_chunks/2.txt +++ b/dsRag/Txt/processed_chunks/2.txt @@ -1,6 +1,2 @@ -2年级数学知识点 -2年级的数学知识点开始涉及更复杂的运算,尤其是加减法的应用以及乘法的初步学习。 -加减法的扩展:学生在学习加减法时,不仅限于10以内,还包括进位和退位的加减法,如加减到100以内的数。 -乘法和除法:这是2年级的重点,学生开始学习乘法表,掌握1到9的乘法表,了解乘法和除法的关系,初步理解乘法是加法的简化。 -图形的认识:进一步学习多边形、对称图形等,能够理解并画出简单的几何图形,如正五边形、正六边形等。 -应用题的训练:通过具体生活中的实际问题,锻炼学生的解题能力,帮助学生理解加法、减法、乘法、除法在实际生活中的应用。 \ No newline at end of file +一词多义 +文言实词往往具有几个甚至十几个义项,这种现象叫一词多义。对常用的多义词,要弄清其本义与引申义之间的关系,系统地掌握词义。如,“朝”本义是早晨,由于古代臣子在早晨拜见帝王,便引申为“朝见、朝拜”;由“朝见”又引申为朝见的处所“朝廷”;又引申为朝代。考生要善于根据相关词句(具体语境)准确理解词义。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/3.txt b/dsRag/Txt/processed_chunks/3.txt index 5b0808c7..f5f10175 100644 --- a/dsRag/Txt/processed_chunks/3.txt +++ b/dsRag/Txt/processed_chunks/3.txt @@ -1,7 +1,2 @@ -3年级数学知识点 -3年级是孩子们数学学习的关键期,学生在此阶段开始接触更多的数学概念和计算技巧。 -乘法和除法的深入:学生开始学习两位数的乘法和除法,理解乘法的交换律、结合律,掌握乘除法的实际应用。 -小数的概念:开始接触小数,学习认识小数点并能够进行简单的小数与整数之间的加减法运算。 -周长和面积:学习长方形和正方形的周长计算方法,以及通过公式计算这些图形的面积。 -分数的初步认识:了解分数的意义,能够读写常见的分数,学习如何比较分数大小。 -时间和日历:能够准确计算时间,了解如何在日历上查找日期,掌握一天24小时的时段划分。 \ No newline at end of file +词类活用 +古代汉语中有些词语在特定的语言环境中,临时具有某种语法功能,并且临时改变了词性,有的还改变了读音,这就是词类活用。要掌握名词活用为一般动词,形容词活用为一般动词,数词活用为一般动词,动词的使动用法,形容词的使动用法,形容词的意动用法,名词的意动用法,动词用作名词,名词作状语,结合语境进行判断。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/4.txt b/dsRag/Txt/processed_chunks/4.txt index 6381312e..5527ed08 100644 --- a/dsRag/Txt/processed_chunks/4.txt +++ b/dsRag/Txt/processed_chunks/4.txt @@ -1,7 +1,2 @@ -4年级数学知识点 -4年级的数学学习内容逐渐扩展到更多的数学运算和几何知识,计算能力得到加强。 -分数的应用:学生开始深入学习分数,能够进行简单的分数加减法运算,理解分数的实际应用,如表示部分与整体的关系。 -整数乘法和除法:学生学习更复杂的乘法和除法,掌握两位数乘一位数以及两位数除一位数的运算技巧。 -几何图形的性质:学习长方形、正方形、三角形、圆形等图形的面积、周长计算方法,并能够识别和比较不同几何图形的特点。 -因数与倍数:学生开始接触因数和倍数的概念,能够进行因数的分解,理解最小公倍数和最大公因数。 -应用题的提高:学生学习更多的实际应用问题,能够通过多步运算解决较复杂的应用题。 \ No newline at end of file +偏义复词 +偏义复词就是一个词由两个意义相近、相对或相反的语素构成,其中只有一个语素表示意义,另一个语素不表示意义,只作陪衬。教材中的偏义复词的数量不多,因此要进行归纳总结。平时训练要注意积累,考场作答要体察语境,认真比较。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/5.txt b/dsRag/Txt/processed_chunks/5.txt index 9403ce17..cff9121b 100644 --- a/dsRag/Txt/processed_chunks/5.txt +++ b/dsRag/Txt/processed_chunks/5.txt @@ -1,7 +1,2 @@ -5年级数学知识点 -5年级是孩子们学习数学的关键时期,知识点更加深入,要求学生有更高的思维能力。 -分数的加减乘除:学生能够进行带分数和假分数的加减法运算,学习分数乘法和除法的基本方法。 -小数的运算:掌握小数的加减法,并能进行小数与整数之间的转换和运算。 -比例与百分数:学习比例的概念,能够解决有关比例的应用题,了解百分数的意义,并能够进行简单的百分数运算。 -几何体的认识:学生学习立体几何图形,如长方体、正方体、圆柱体等,能够计算这些图形的表面积和体积。 -统计与数据:通过收集数据并进行整理,学习绘制条形图、折线图等,能够从图表中提取和分析信息。 \ No newline at end of file +文言虚词 +理解常见文言虚词在文中的用法。常见文言虚词:而、何、乎、乃、其、且、若、所、为、焉、也、以、因、于、与、则、者、之。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/6.txt b/dsRag/Txt/processed_chunks/6.txt index 4407861b..079c1859 100644 --- a/dsRag/Txt/processed_chunks/6.txt +++ b/dsRag/Txt/processed_chunks/6.txt @@ -1,8 +1,6 @@ -6年级数学知识点 -6年级是小学数学知识的总结和深化阶段,孩子们的计算能力和思维能力有了很大的提升。 -分数和小数的混合运算:学生掌握分数与小数的混合运算,能够灵活运用分数、小数解决实际问题。 -负数和绝对值:了解负数的概念,学习绝对值的计算方法,能够理解负数在数轴上的位置。 -比和比例的应用:学生进一步学习比和比例,能够解决实际生活中的比例问题,如配方问题、配比问题等。 -几何图形的综合应用:学生能够综合运用几何图形的知识,解决关于图形的面积、周长、体积等问题。 -方程的初步认识:学生初步接触方程的概念,学习如何通过简单的方程解决实际问题。 -统计与概率:在数据统计的基础上,进一步了解概率的概念,能够通过数据进行预测和分析。 \ No newline at end of file +白话文用动词“是”联系判断句中两部分,而文言文中判断句的主要特点是不用判断词,而以主语谓语直接相续。文言文表判断的常见句式有: +1.用助词“者”和“也”配合表示判断。例如:廉颇者,赵之良将也。夫战,勇气也。粟者,民之所种。 +2.在主谓间用“即、乃、则、皆、本、诚、亦、素”等副词表示肯定判断,兼加强语气。例如:①若事之不济,此乃天也。②此诚危急存亡之秋也。③梁父即楚将项燕。④此则岳阳楼之大观也。⑤环滁皆山也。⑥臣本布衣。“乃”“则”“即”有“就是”之意。 +3.动词“为”和判断词“是”表示判断。例如:①此为何若人?②问今是何世? +4.“者”也”都不用,完全凭句意去判断。例如刘备,天下袅雄。 +5.用否定副词“非”表示否定判断,例如:视之,非字而画。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/7.txt b/dsRag/Txt/processed_chunks/7.txt new file mode 100644 index 00000000..4c04de79 --- /dev/null +++ b/dsRag/Txt/processed_chunks/7.txt @@ -0,0 +1,7 @@ +被动句 +在动词作谓语的句子里,主语不是动词所表示的动作的施动者,而是动作的承受者,这种句式叫被动句。常见的文言被动句有以下几种: +1.在动词谓语后边也用介词“于”,把动作行为的主动者介绍出来,例如:①而君幸于赵王。②怀王以不知忠臣之分,故内惑于郑袖,外欺于张仪。 +2.介词“为”引出动作行为主动者或配合“所”字一起使用,例如:身客死于秦,为天下笑。贾家庄几为巡徼所陵迫死。不者,若属皆且为所虏。 +3.在动词前边用“见”作为被动标志,例如:秦城恐不可得,徒见欺。又可以再在动词后边用介词“于”引出动作行为主动者,例如:臣诚恐见欺于王而负赵。 +4.在动词前边用“受”,同时在动词后边用介词“于”引出动作行为的主动者,例如:吾不能举全吴之地,十万之众,受制于人。 +5.在动词前边用介词“被”作为标志,例如:曲罢曾教善才服,妆成每被秋娘妒。或者配合介词“于”引出行为主动者,例如:燕以万乘之国被围于赵。 \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/8.txt b/dsRag/Txt/processed_chunks/8.txt new file mode 100644 index 00000000..e283fc35 --- /dev/null +++ b/dsRag/Txt/processed_chunks/8.txt @@ -0,0 +1,15 @@ +倒装句 +(一)宾语前置句 +在古代汉语里,宾语的位置也和现代汉语一样,一般都在动词(或介词)的后面,但为了强调宾语,在一定条件下,就把它放在动词(或介词)的前面。宾语前置可分为以下几种情况; +1.在疑问句里,作宾语的疑问代词(安、何、谁等),一般提到动词或介词前。例如;①沛公安在?②富者曰:“子何持而往?”③微斯人,吾谁与归?④何以效之? +2.在否定句里,作宾语的代词,也都提到动词的前边,例如:①时人莫之许也。②三岁贯女,莫我肯顾③彼不我恩也。 +3.为了强调宾语,借助“之”“是”等的帮助,把宾语从词的后面提到动词的前面。这“之”“是”便成了宾语提前的标志,无其他义。例如:①孔子云:“何陋之有?”②唯利是图。 +4.介词宾语的前置。例如;①国胡以相恤?②一言以蔽之。 +(二)定语后置句 +1.“……者……”为标志。例:石之铿然有声者(《石钟山记》) +2.“……之……”为标志。例:蚓无爪牙之利,筋骨之强(《劝学》) +(三)状语后置句 +1.“于”为标志的介宾短语。例:季氏将有事于颛臾(《季氏将伐颛臾》) +2.“以”为标志的介宾短语。例:虽董之以严刑,振之以威怒(《谏太宗十思疏》) +(四)主谓倒装句 +例;甚矣,乌纱之横、皂隶之俗哉。(《虎丘记》) \ No newline at end of file diff --git a/dsRag/Txt/processed_chunks/9.txt b/dsRag/Txt/processed_chunks/9.txt new file mode 100644 index 00000000..e9e31fb2 --- /dev/null +++ b/dsRag/Txt/processed_chunks/9.txt @@ -0,0 +1,7 @@ +省略句 +文言文某些词或某些成分经常省略,比白话文多见。 +1.省主语。例如:(成名)喜而捕之,(虫)一鸣辄跃去,(虫)行且速。 +2.省谓语动词。例如:一鼓作气,再(鼓)而衰,三(鼓)而竭。 +3.省宾语。①省动词宾语。例如:权起更衣,肃追(之)于宇下。②省介词宾语。例如:秦王不怿,为(之)一击缶。 +4.省介词。例如:将军战(于)河北,臣战(于)河南。 +5.省量词。例如:①蟹六(只)跪而二(只)整。②寒暑易节,始一(次)反焉。 \ No newline at end of file diff --git a/dsRag/Util/__pycache__/ALiYunUtil.cpython-310.pyc b/dsRag/Util/__pycache__/ALiYunUtil.cpython-310.pyc index b3e93cbe..72959b4c 100644 Binary files a/dsRag/Util/__pycache__/ALiYunUtil.cpython-310.pyc and b/dsRag/Util/__pycache__/ALiYunUtil.cpython-310.pyc differ diff --git a/dsRag/Util/__pycache__/SplitDocxUtil.cpython-310.pyc b/dsRag/Util/__pycache__/SplitDocxUtil.cpython-310.pyc index a5e7f7cf..9836806c 100644 Binary files a/dsRag/Util/__pycache__/SplitDocxUtil.cpython-310.pyc and b/dsRag/Util/__pycache__/SplitDocxUtil.cpython-310.pyc differ diff --git a/dsRag/Util/__pycache__/__init__.cpython-310.pyc b/dsRag/Util/__pycache__/__init__.cpython-310.pyc index 2089b6b5..79767003 100644 Binary files a/dsRag/Util/__pycache__/__init__.cpython-310.pyc and b/dsRag/Util/__pycache__/__init__.cpython-310.pyc differ diff --git a/dsRag/static/Txt/高中文言文.docx b/dsRag/static/Txt/高中文言文.docx new file mode 100644 index 00000000..c1a60326 Binary files /dev/null and b/dsRag/static/Txt/高中文言文.docx differ