diff --git a/dsRag/Test/T2_read_word_content.py b/dsRag/Test/T2_read_word_content.py index d8281e8f..7b16d2bb 100644 --- a/dsRag/Test/T2_read_word_content.py +++ b/dsRag/Test/T2_read_word_content.py @@ -1,3 +1,5 @@ +import os + import docx @@ -58,14 +60,35 @@ def split_into_blocks(text): return [(i + 1, block) for i, block in enumerate(blocks)] +# 保留原有的save_to_txt函数 +def save_to_txt(content, file_path, mode='w'): + """将内容保存到文本文件""" + try: + with open(file_path, mode, encoding='utf-8') as f: + f.write(content) + return True + except Exception as e: + print(f"保存文件{file_path}时出错: {str(e)}") + return False + if __name__ == "__main__": word_document_path = "d:\\dsWork\\dsProject\\dsRag\\static\\Test\\带图的WORD文档_MATH_3.docx" + output_dir="d:\\dsWork\\dsProject\\dsRag\\static\\Test\\" res = read_word_content(word_document_path) - q = split_into_blocks(res) - for x in q: + chunks = split_into_blocks(res) + for x in chunks: print("===段落开始:===") firstLine = x[1].split("\n")[0].strip() content = x[1][len(firstLine):].strip() print("firstLine=" + firstLine) print("content=" + content) print("===段落结束:===\n") + + saved_count=0 + for chunk_num, chunk in chunks: + chunk = chunk.strip() # 确保去除空白字符 + output_file = os.path.join(output_dir, f"{chunk_num}.txt") + if save_to_txt(chunk, output_file, mode='w'): + saved_count += 1 + + print(f"处理完成,共保存{saved_count}个文件到目录: {output_dir}") diff --git a/dsRag/static/Test/1.txt b/dsRag/static/Test/1.txt new file mode 100644 index 00000000..672fbbbf --- /dev/null +++ b/dsRag/static/Test/1.txt @@ -0,0 +1,5 @@ +教学建议与意义 +在教学过程中,引导学生构建和理解模型,不仅能提升他们分析和解决问题的能力,还能激发他们发现问题和提出问题的意识。例如,在认识路程模型时,教师可通过生活化情境让学生理解速度的概念及其单位表示。 +模型思想是《义务教育数学课程标准》中强调的核心素养之一,它帮助学生建立从现实世界抽象出数学问题的能力,并通过数学语言进行描述和解释。 +因此,在“综合与实践”类教学内容中,应加强模型的应用训练,以培养学生应用数学知识解决实际问题的能力。 +【图片1】 \ No newline at end of file diff --git a/dsRag/static/Test/2.txt b/dsRag/static/Test/2.txt new file mode 100644 index 00000000..a2f20a7c --- /dev/null +++ b/dsRag/static/Test/2.txt @@ -0,0 +1,2 @@ +我随便写点什么 +【图片2】 \ No newline at end of file