Files
dsProject/dsLightRag/Util/GGB/GGB_4_LLM.py

131 lines
4.1 KiB
Python
Raw Normal View History

2025-08-14 15:45:08 +08:00
import logging
from openai import OpenAI
from Config.Config import ALY_LLM_API_KEY, ALY_LLM_MODEL_NAME, ALY_LLM_BASE_URL
logger = logging.getLogger(__name__)
# 生成GeoGebra命令
def generate_ggb(ocr_result, qvq_result, output_dir):
# 初始化OpenAI客户端
client = OpenAI(
api_key=ALY_LLM_API_KEY,
base_url=ALY_LLM_BASE_URL
)
reasoning_content = "" # 定义完整思考过程
answer_content = "" # 定义完整回复
is_answering = False # 判断是否结束思考过程并开始回复
prompt = """
几何试题转GeoGebra命令生成提示词可行版
输入数据
1. 文本条件OCR提取结果
2. 图形结构图像识别JSON
核心处理规则
1. 必须建立基础坐标系
- 明确指定原点(0,0)
- 明确指定x轴方向
2. 点创建原则
a) 根据视觉提供的信息进行大致位置估算
b) 禁止创建无约束的自由点
3. 线段创建
- 如果题目与图形中没有明确的长度声明可以视最长边长度为10个单位,其它边以此为基础计算长度
- 没有明显提出是动点的不要使用滑块可以依据题意估算即可
- 只连接已定义的点
- 禁止创建未定义端点的线段
4. 几何关系实现
- 垂直关系使用PerpendicularLine命令
- 中点关系使用Midpoint命令
5. 严格构建顺序
1) 创建坐标系基准点
2) 创建其他点
3) 创建线段
4) 创建多边形
冲突处理
1. 图文冲突优先文本条件
2. 信息缺失使用最小可行假设
- 假设直角在原点
- 假设单位长度
禁止输出
1. Point()无参数命令
2. 未定义端点的线段
3. 无法实现的注释关系
4. 未连接点的多边形
5. Geogebra指令集中的注释
6. PerpendicularLine
特殊情形处理
1. 中点Midpoint命令
2. 动点Slider
3. 几何问题一般避免使用射线优先使用线段
### 题目的文字描述信息
```
{Ocr}
```
### 题目的图形描述信息
```
{Qvq}
```
"""
with open(ocr_result, 'r', encoding='utf-8') as file:
Ocr = file.read() # 直接获取整个文件内容为字符串
with open(qvq_result, 'r', encoding='utf-8') as file:
Qvq = file.read() # 直接获取整个文件内容为字符串
prompt = prompt.replace("{Qvq}", Qvq)
prompt = prompt.replace("{Ocr}", Ocr)
# 创建聊天完成请求
completion = client.chat.completions.create(
model=ALY_LLM_MODEL_NAME,
messages=[
{
"role": "user",
"content": [
{"type": "text",
"text": prompt},
],
},
],
stream=True,
)
print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")
for chunk in completion:
# 如果chunk.choices为空则打印usage
if not chunk.choices:
print("\nUsage:")
print(chunk.usage)
else:
delta = chunk.choices[0].delta
# 打印思考过程
if hasattr(delta, 'reasoning_content') and delta.reasoning_content != None:
print(delta.reasoning_content, end='', flush=True)
reasoning_content += delta.reasoning_content
else:
# 开始回复
if delta.content != "" and is_answering is False:
print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
is_answering = True
# 打印回复过程
print(delta.content, end='', flush=True)
answer_content += delta.content
ggb = f"{output_dir}/GGB.txt"
with open(ggb, "w", encoding='utf-8') as f:
f.write(answer_content)
return ggb