You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
dsProject/dsLightRag/Doc/7、LibreOffice与MinerU安装.md

46 lines
1.3 KiB

#### 一、依赖环境
- 1、$Libreoffice$
https://zh-cn.libreoffice.org/
```sh
# 下载的版本:
https://mirrors.nju.edu.cn/tdf/libreoffice/stable/25.2.4/win/x86_64/LibreOffice_25.2.4_Win_x86-64.msi
```
> **注**:因为后面要使用的$MinerU$能力是将$PDF$转为$markdown$,所以需要一个将$Office$转成$PDF$的功能
下载完成后,安装即可。
- 2、$RAGAnything$
```cmd
# 安装RagAnything
pip install raganything pycocotools timm detectron2 sse_starlette
# 安装包
# pip install detectron2 --extra-index-url https://myhloli.github.io/wheels/
# 下载模型
mineru-models-download
```
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/%7Byear%7D/%7Bmonth%7D/%7Bmd5%7D.%7BextName%7D/20250706152846354.png)
#### 二、代码调试
- 将soffice.exe添加到环境变量
- ```
C:\Program Files\LibreOffice\program
D:\anaconda3\envs\py310\Scripts
```
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/%7Byear%7D/%7Bmonth%7D/%7Bmd5%7D.%7BextName%7D/20250707135645685.png)
- **注意**:需要提前配置好环境变量后,再进入$PyCharm$进行调试,因为我发现,如果是在打开$PyCharm$的前提下,添加了环境就是$PyCharm$里面的代码是检测不到的。