You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
dsProject/dsLightRag/Doc/7、LibreOffice与MinerU安装.md

1.3 KiB

一、依赖环境

  • 1、Libreoffice

https://zh-cn.libreoffice.org/

# 下载的版本:
https://mirrors.nju.edu.cn/tdf/libreoffice/stable/25.2.4/win/x86_64/LibreOffice_25.2.4_Win_x86-64.msi

:因为后面要使用的MinerU能力是将PDF转为markdown,所以需要一个将Office转成PDF的功能

下载完成后,安装即可。

  • 2、RAGAnything
# 安装RagAnything
pip install raganything pycocotools timm detectron2 sse_starlette

# 安装包
# pip install detectron2 --extra-index-url https://myhloli.github.io/wheels/

# 下载模型
mineru-models-download 

二、代码调试

  • 将soffice.exe添加到环境变量

  • C:\Program Files\LibreOffice\program
    D:\anaconda3\envs\py310\Scripts
    

  • 注意:需要提前配置好环境变量后,再进入PyCharm进行调试,因为我发现,如果是在打开PyCharm的前提下,添加了环境就是PyCharm里面的代码是检测不到的。