import datetime import os from paddleocr import PPStructureV3 # 安装OCR引擎 # python -m pip install paddlepaddle paddleocr # 如果使用GPU,请安装GPU版本 # pip install paddlepaddle-gpu from Pptx.Config import ocr_output_dir, markdown_output_dir, time_format # 确保输出目录存在 os.makedirs(ocr_output_dir, exist_ok=True) os.makedirs(markdown_output_dir, exist_ok=True) # 初始化OCR引擎 pipeline = PPStructureV3() # 图片位置 image_files=r"D:\dsWork\dsProject\dsRag\Pptx" # 处理每个图片 for i, img_path in enumerate(image_files): # 从文件名中提取页码 page_num = os.path.basename(img_path).split('_')[1] # 检查目标目录是否已存在 markdown_save_path = os.path.join(markdown_output_dir, f"page_{page_num}") if os.path.exists(markdown_save_path): print(f"{datetime.datetime.now().strftime(time_format)} 第{page_num}页的OCR结果已存在,跳过处理") continue # 输出处理信息 print(f"{datetime.datetime.now().strftime(time_format)} 正在处理第{page_num}页的OCR识别") # 执行OCR识别 output = pipeline.predict(img_path) # 使用save_to_markdown方法保存结果 for res in output: res.save_to_markdown(save_path=markdown_save_path) print(f"第{page_num}页OCR识别完成,结果已保存到: {markdown_save_path}") print(f"所有图片OCR识别完成,结果保存在: {markdown_output_dir}")