dsProject/dsLightRag/Util/GGB/GGB_4_LLM.py

import logging
from openai import OpenAI
from Config.Config import ALY_LLM_API_KEY, ALY_LLM_MODEL_NAME, ALY_LLM_BASE_URL
logger = logging.getLogger(__name__)


# 生成GeoGebra命令
def generate_ggb(ocr_result, qvq_result, output_dir):
    # 初始化OpenAI客户端
    client = OpenAI(
        api_key=ALY_LLM_API_KEY,
        base_url=ALY_LLM_BASE_URL
    )

    reasoning_content = ""  # 定义完整思考过程
    answer_content = ""  # 定义完整回复
    is_answering = False  # 判断是否结束思考过程并开始回复

    prompt = """
    几何试题转GeoGebra命令生成提示词（可行版）

    输入数据
    1. 文本条件（OCR提取结果）
    2. 图形结构（图像识别JSON）

    核心处理规则
    1. 必须建立基础坐标系：
       - 明确指定原点(0,0)
       - 明确指定x轴方向

    2. 点创建原则：
       a) 根据视觉提供的信息进行大致位置估算
       b) 禁止创建无约束的自由点

    3. 线段创建：
       - 如果题目与图形中没有明确的长度声明，可以视最长边长度为10个单位,其它边以此为基础计算长度。
       - 没有明显提出是动点的，不要使用滑块，可以依据题意估算即可。
       - 只连接已定义的点
       - 禁止创建未定义端点的线段

    4. 几何关系实现：
       - 垂直关系：使用PerpendicularLine命令
       - 中点关系：使用Midpoint命令

    5. 严格构建顺序：
       1) 创建坐标系基准点
       2) 创建其他点
       3) 创建线段
       4) 创建多边形

    冲突处理
    1. 图文冲突：优先文本条件
    2. 信息缺失：使用最小可行假设
       - 假设直角在原点
       - 假设单位长度

    禁止输出
    1. Point()无参数命令
    2. 未定义端点的线段
    3. 无法实现的注释关系
    4. 未连接点的多边形
    5. Geogebra指令集中的注释
    6. PerpendicularLine

    特殊情形处理
    1. 中点：Midpoint命令
    2. 动点：Slider
    3. 几何问题一般避免使用射线，优先使用线段


    ### 题目的文字描述信息
    ```
    {Ocr}
    ```

    ### 题目的图形描述信息
    ```
    {Qvq}
    ```
          """

    with open(ocr_result, 'r', encoding='utf-8') as file:
        Ocr = file.read()  # 直接获取整个文件内容为字符串

    with open(qvq_result, 'r', encoding='utf-8') as file:
        Qvq = file.read()  # 直接获取整个文件内容为字符串

    prompt = prompt.replace("{Qvq}", Qvq)
    prompt = prompt.replace("{Ocr}", Ocr)
    # 创建聊天完成请求
    completion = client.chat.completions.create(
        model=ALY_LLM_MODEL_NAME,
        messages=[
            {
                "role": "user",
                "content": [
                    {"type": "text",
                     "text": prompt},
                ],
            },
        ],
        stream=True,
    )

    print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")

    for chunk in completion:
        # 如果chunk.choices为空，则打印usage
        if not chunk.choices:
            print("\nUsage:")
            print(chunk.usage)
        else:
            delta = chunk.choices[0].delta
            # 打印思考过程
            if hasattr(delta, 'reasoning_content') and delta.reasoning_content != None:
                print(delta.reasoning_content, end='', flush=True)
                reasoning_content += delta.reasoning_content
            else:
                # 开始回复
                if delta.content != "" and is_answering is False:
                    print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
                    is_answering = True
                # 打印回复过程
                print(delta.content, end='', flush=True)
                answer_content += delta.content

    ggb = f"{output_dir}/GGB.txt"
    with open(ggb, "w", encoding='utf-8') as f:
        f.write(answer_content)
    return ggb