'commit'

5 months ago · 46b8665528
parent 43b739a4cd
commit 46b8665528
8 changed files with 176 additions and 198 deletions
--- a/AI/AiService/CallDeepSeekStream.py
+++ b/AI/AiService/CallDeepSeekStream.py
@ -2,8 +2,58 @@ import uvicorn
 from fastapi import FastAPI, Body
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import StreamingResponse, PlainTextResponse
+import asyncio
+import socket
+from openai import OpenAI
+from MarkdownToJsonUtil import *
+
+# 阿里云中用来调用 deepseek v3 的密钥
+MODEL_API_KEY = "sk-01d13a39e09844038322108ecdbd1bbc"
+MODEL_NAME = "deepseek-v3"
+#MODEL_NAME = "qwen-plus"
+
+# 初始化 OpenAI 客户端
+client = OpenAI(
+    api_key=MODEL_API_KEY,
+    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
+)
+
+# 获取本机所有 IPv4 地址
+def get_local_ips():
+    ips = []
+    hostname = socket.gethostname()
+    try:
+        # 获取所有 IP 地址
+        addrs = socket.getaddrinfo(hostname, None, family=socket.AF_INET)  # 只获取 IPv4 地址
+        for addr in addrs:
+            ip = addr[4][0]
+            if ip not in ips:
+                ips.append(ip)
+    except Exception as e:
+        print(f"获取 IP 地址失败: {e}")
+    return ips
+
+# 流式生成数据的函数
+async def generate_stream_markdown(course_name: str):
+    # 调用阿里云 API，启用流式响应
+    stream = client.chat.completions.create(
+        model=MODEL_NAME,
+        messages=[
+            {'role': 'system', 'content': '你是一个教学经验丰富的基础教育教师'},
+            {'role': 'user', 'content': '帮我设计一下' + course_name + '的课件提纲，用markdown格式返回。不要返回 ```markdown 或者 ```  这样的内容！'}
+        ],
+        stream=True,  # 启用流式响应
+        timeout=6000,
+    )
+
+    # 逐字返回数据
+    for chunk in stream:
+        if chunk.choices[0].delta.content:
+            for char in chunk.choices[0].delta.content:
+                yield char.encode("utf-8")
+                await asyncio.sleep(0.05)  # 控制逐字输出的速度
+

-from Util import  *
 app = FastAPI()

 # 添加 CORS 中间件
@ -39,7 +89,7 @@ async def aippt_outline(
@app.post("/api/tools/aippt")  # 修改为 POST 方法
 async def aippt(content: str = Body(..., embed=True, description="Markdown 内容")):  # 使用 Body 接收请求体参数
    return StreamingResponse(
-        convert_markdown_to_json(content),  # 传入 content
+        getMyJson(content),  # 传入 content
        media_type="text/plain",  # 使用 text/plain 格式
        headers={
            "Cache-Control": "no-cache",
--- a/AI/AiService/MarkdownToJsonUtil.py
+++ b/AI/AiService/MarkdownToJsonUtil.py
@ -0,0 +1,97 @@
+import markdown_to_json
+import json
+import asyncio
+
+
+def markdown_to_dict(markdown_content):
+    """
+    将 Markdown 内容转换为 Python 字典
+    """
+    # 将 Markdown 转换为 JSON 字符串
+    json_content = markdown_to_json.jsonify(markdown_content)
+    # 解码 Unicode 转义
+    json_content = json_content.encode('utf-8').decode('unicode_escape')
+    # 将 JSON 字符串转换为字典
+    return json.loads(json_content)
+
+
+def extract_level1(json_dict):
+    """
+    提取一级目录，生成指定格式的 JSON 对象列表
+    """
+    # 获取第一个一级目录的名称
+    level1_title = next(iter(json_dict.keys()), None)
+    if level1_title:
+        return [{"type": "cover", "data": {"title": level1_title, "text": level1_title}}]
+    return []
+
+
+def extract_level2_and_level3(json_dict, level1_title=None):
+    """
+    提取指定一级目录下的二级目录及其三级目录内容，生成指定格式的 JSON 对象列表
+    """
+    # 如果没有指定一级目录，则使用第一个一级目录
+    if level1_title is None:
+        level1_title = next(iter(json_dict.keys()), None)
+
+    if level1_title and level1_title in json_dict:
+        result = []
+        for level2_title, level2_content in json_dict[level1_title].items():
+            # 输出二级目录
+            result.append({"type": "transition", "data": {"title": level2_title, "text": level2_title}})
+            # 输出三级目录内容
+            if isinstance(level2_content, dict):
+                for level3_title, level3_items in level2_content.items():
+                    items = [{"title": item, "text": item} for item in level3_items]
+                    result.append({
+                        "type": "content",
+                        "data": {
+                            "title": level3_title,
+                            "items": items
+                        }
+                    })
+        return result
+    return []
+
+
+def extract_contents(json_dict, level1_title=None):
+    """
+    提取所有二级目录名称，生成目录部分的 JSON 对象
+    """
+    # 如果没有指定一级目录，则使用第一个一级目录
+    if level1_title is None:
+        level1_title = next(iter(json_dict.keys()), None)
+
+    if level1_title and level1_title in json_dict:
+        # 获取所有二级目录名称
+        level2_titles = list(json_dict[level1_title].keys())
+        return {"type": "contents", "data": {"items": level2_titles}}
+    return {"type": "contents", "data": {"items": []}}
+
+
+async def getMyJson(markdown_content):
+    """
+    生成一个 AsyncIterable，逐行返回 JSON 字符串
+    """
+    # 将 Markdown 转换为字典
+    json_dict = markdown_to_dict(markdown_content)
+
+    # 提取一级目录
+    level1_json = extract_level1(json_dict)
+    for item in level1_json:
+        yield json.dumps(item, ensure_ascii=False)
+        await asyncio.sleep(0.5)  # 控制逐行输出的速度
+
+    # 生成目录部分
+    contents_json = extract_contents(json_dict)
+    yield json.dumps(contents_json, ensure_ascii=False)
+    await asyncio.sleep(0.5)
+
+    # 提取二级目录及其三级目录内容
+    level2_and_level3_json = extract_level2_and_level3(json_dict)
+    for item in level2_and_level3_json:
+        yield json.dumps(item, ensure_ascii=False)
+        await asyncio.sleep(0.5)
+
+    # 添加结束标记
+    yield '{"type": "end" }'
--- a/AI/AiService/Test/Json.txt
+++ b/AI/AiService/Test/Json.txt
@ -0,0 +1,27 @@
+{"type": "cover", "data": { "title": "大学生职业生涯规划", "text": "助力大学生规划美好职业未来" } }
+
+{"type": "contents", "data": { "items": [ "认识职业生涯规划", "自我评估", "职业环境分析", "设定职业目标", "制定行动计划", "评估与调整", "常见误区与应对" ] } }
+
+{"type": "transition", "data": { "title": "认识规划", "text": "了解职业生涯规划定义与重要性" } }
+
+{"type": "content", "data": { "title": "规划定义", "items": [ { "title": "计划安排", "text": "职业生涯规划是明确职业发展的一系列计划和安排，涵盖自我认知、职业探索等多方面，帮助大学生理清职业发展路径。" }, { "title": "多方面涵盖", "text": "它不仅仅是确定一份工作，还涉及到对自身的全面了解和对职业市场的深入探索，为未来职业发展奠定基础。" } ] } }
+
+{"type": "content", "data": { "title": "规划重要性", "items": [ { "title": "明确方向", "text": "帮助大学生明确职业方向，避免在求职过程中盲目选择，使大学生能够有针对性地进行学习和实践。" }, { "title": "提升竞争力", "text": "通过规划可以提前做好职业准备，提升就业竞争力，增加在就业市场中的优势。" }, { "title": "增加满意度", "text": "合理的规划能让大学生找到适合自己的职业，从而增加职业满意度和成就感，提升工作幸福感。" } ] } }
+
+{"type": "transition", "data": { "title": "自我评估", "text": "剖析自身性格、兴趣与能力" } }
+
+{"type": "content", "data": { "title": "性格特点分析", "items": [ { "title": "性格倾向", "text": "分析自己外向或内向的性格倾向，不同性格在职业中有不同的适配性。外向性格适合销售等岗位，内向性格适合研发等工作。" }, { "title": "职业适配", "text": "了解性格与职业的适配性，能让大学生在选择职业时更贴合自身特点，提高职业满意度和工作效率。" } ] } }
+
+{"type": "content", "data": { "title": "兴趣爱好探索", "items": [ { "title": "兴趣领域", "text": "探索个人的兴趣领域，兴趣是最好的老师，它能让大学生在工作中更有动力和热情。" }, { "title": "兴趣结合", "text": "找到兴趣与职业的结合点，将兴趣转化为职业优势，有助于在职业生涯中取得更好的发展。" } ] } }
+
+{"type": "content", "data": { "title": "能力优势盘点", "items": [ { "title": "专业技能", "text": "盘点专业技能水平，明确自己在专业领域的优势和不足，以便有针对性地进行提升。" }, { "title": "通用能力", "text": "评估沟通、团队协作等通用能力，这些能力在不同职业中都非常重要，能帮助大学生更好地适应工作环境。" } ] } }
+
+{"type": "transition", "data": { "title": "职业环境分析", "text": "洞察行业、职业与企业需求" } }
+
+{"type": "content", "data": { "title": "行业发展趋势", "items": [ { "title": "新兴行业", "text": "关注新兴行业的崛起，如人工智能、大数据等，这些行业蕴含着巨大的发展潜力和就业机会。" }, { "title": "传统变革", "text": "了解传统行业的变革，传统行业在科技的推动下不断转型升级，也创造了新的职业需求。" } ] } }
+
+{"type": "content", "data": { "title": "职业需求状况", "items": [ { "title": "人才数量", "text": "了解各职业的人才需求数量，选择人才需求大的职业，就业机会相对更多。" }, { "title": "发展前景", "text": "分析职业的发展前景，选择有良好发展前景的职业，能为个人的职业生涯带来更多的上升空间。" } ] } }
+
+{"type": "content", "data": { "title": "企业招聘要求", "items": [ { "title": "素质要求", "text": "明确不同企业对人才的素质要求，包括专业知识、技能、品德等方面，以便有针对性地提升自己。" }, { "title": "企业文化", "text": "了解企业的文化和价值观，选择与自己价值观相符的企业，能更好地融入企业，发挥自己的优势。" } ] } }
+
+{"type": "transition", "data": { "title": "设定职业目标", "text": "确立短、中、长期职业目标" } }
--- a/AI/AiService/Test/TestMarkdownToJson.py
+++ b/AI/AiService/Test/TestMarkdownToJson.py
@ -1,60 +0,0 @@
-import markdown_to_json
-import json
-
-
-def markdown_to_dict(markdown_content):
-    """
-    将 Markdown 内容转换为 Python 字典
-    """
-    # 将 Markdown 转换为 JSON 字符串
-    json_content = markdown_to_json.jsonify(markdown_content)
-    # 解码 Unicode 转义
-    json_content = json_content.encode('utf-8').decode('unicode_escape')
-    # 将 JSON 字符串转换为字典
-    return json.loads(json_content)
-
-
-def extract_level1(json_dict):
-    """
-    提取一级目录，生成指定格式的 JSON 对象列表
-    """
-    # 获取第一个一级目录的名称
-    level1_title = next(iter(json_dict.keys()), None)
-    if level1_title:
-        return [{"type": "cover", "data": {"title": level1_title, "text": level1_title}}]
-    return []
-
-
-def extract_level2(json_dict, level1_title=None):
-    """
-    提取指定一级目录下的二级目录，生成指定格式的 JSON 对象列表
-    """
-    # 如果没有指定一级目录，则使用第一个一级目录
-    if level1_title is None:
-        level1_title = next(iter(json_dict.keys()), None)
-
-    if level1_title and level1_title in json_dict:
-        return [{"type": "transition", "data": {"title": title, "text": title}} for title in
-                json_dict[level1_title].keys()]
-    return []
-
-
-if __name__ == '__main__':
-    # 打开文本文件 Sample.md
-    with open("Sample.md", "r", encoding="utf-8") as file:
-        # 读取 Markdown 文件的内容
-        markdown_content = file.read()
-        # 将 Markdown 转换为字典
-        json_dict = markdown_to_dict(markdown_content)
-
-        # 提取一级目录
-        level1_json = extract_level1(json_dict)
-        print("一级目录：")
-        for item in level1_json:
-            print(json.dumps(item, ensure_ascii=False))
-
-        # 提取二级目录（自动获取一级目录名称）
-        level2_json = extract_level2(json_dict)
-        print("\n二级目录：")
-        for item in level2_json:
-            print(json.dumps(item, ensure_ascii=False))
--- a/AI/AiService/Util.py
+++ b/AI/AiService/Util.py
@ -1,109 +0,0 @@
-import asyncio
-import json
-import socket
-from typing import AsyncGenerator
-
-from openai import OpenAI
-
-# 阿里云中用来调用 deepseek v3 的密钥
-MODEL_API_KEY = "sk-01d13a39e09844038322108ecdbd1bbc"
-MODEL_NAME = "deepseek-v3"
-#MODEL_NAME = "qwen-plus"
-
-# 初始化 OpenAI 客户端
-client = OpenAI(
-    api_key=MODEL_API_KEY,
-    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
-)
-
-# 获取本机所有 IPv4 地址
-def get_local_ips():
-    ips = []
-    hostname = socket.gethostname()
-    try:
-        # 获取所有 IP 地址
-        addrs = socket.getaddrinfo(hostname, None, family=socket.AF_INET)  # 只获取 IPv4 地址
-        for addr in addrs:
-            ip = addr[4][0]
-            if ip not in ips:
-                ips.append(ip)
-    except Exception as e:
-        print(f"获取 IP 地址失败: {e}")
-    return ips
-
-# 流式生成数据的函数
-async def generate_stream_markdown(course_name: str):
-    # 调用阿里云 API，启用流式响应
-    stream = client.chat.completions.create(
-        model=MODEL_NAME,
-        messages=[
-            {'role': 'system', 'content': '你是一个教学经验丰富的基础教育教师'},
-            {'role': 'user', 'content': '帮我设计一下' + course_name + '的课件提纲，用markdown格式返回。不要返回 ```markdown 或者 ```  这样的内容！'}
-        ],
-        stream=True,  # 启用流式响应
-        timeout=6000,
-    )
-
-    # 逐字返回数据
-    for chunk in stream:
-        if chunk.choices[0].delta.content:
-            for char in chunk.choices[0].delta.content:
-                yield char.encode("utf-8")
-                await asyncio.sleep(0.05)  # 控制逐字输出的速度
-
-
-
-
-def generate_prompt(source: str) -> str:
-    # 打开 prompt.txt 文件，读取内容
-    with open("prompt.txt", "r", encoding="utf-8") as file:
-        prompt = file.read()
-    prompt = prompt.replace("{{source}}", source)
-    return prompt
-
-
-
-async def convert_markdown_to_json(source: str) -> AsyncGenerator[bytes, None]:
-    # 生成提示词
-    prompt = generate_prompt(source)
-
-    # 调用 AI 模型，启用流式响应
-    stream = client.chat.completions.create(
-        model=MODEL_NAME,
-        messages=[
-            {"role": "system", "content": "你是一个专业的 Markdown 内容解析器。"},
-            {"role": "user", "content": prompt}
-        ],
-        stream=True,  # 启用流式响应
-        max_tokens=2000,
-        temperature=0.5
-    )
-
-    # 缓存当前内容
-    buffer = ""
-
-    # 将同步的 Stream 转换为异步迭代器
-    async def async_iter_stream():
-        for chunk in stream:
-            yield chunk
-
-    # 逐块处理流式数据
-    async for chunk in async_iter_stream():
-        if chunk.choices[0].delta.content:
-            # 将新内容添加到缓冲区
-            buffer += chunk.choices[0].delta.content
-
-            # 检查是否有换行符（\n 或 \r）
-            while "\n" in buffer or "\r" in buffer:
-                # 找到第一个换行符的位置
-                newline_index = buffer.find("\n") if "\n" in buffer else buffer.find("\r")
-                # 提取并返回完整的一行
-                line = buffer[:newline_index]
-                if line:  # 确保 line 不为空
-                    yield line.encode("utf-8")
-                # 移除已处理的部分
-                buffer = buffer[newline_index + 1:]
-
-    # 返回缓冲区中剩余的内容（最后一行）
-    if buffer:
-        yield buffer.encode("utf-8")
--- a/AI/AiService/pycache/MarkdownToJsonUtil.cpython-310.pyc
+++ b/AI/AiService/pycache/MarkdownToJsonUtil.cpython-310.pyc
--- a/AI/AiService/pycache/Util.cpython-310.pyc
+++ b/AI/AiService/pycache/Util.cpython-310.pyc
--- a/AI/AiService/prompt.txt
+++ b/AI/AiService/prompt.txt
@ -1,27 +0,0 @@
-你是一个专业的 Markdown 内容解析器，能够将 Markdown 格式的文本转换为文本字符串。请根据以下规则处理 Markdown 内容：
-
-1. 每生成一个 JSON 对象后，必须添加一个换行符（\n），确保每个 JSON 对象独占一行。这是最重要的规则，请务必遵守。
-
-2. 第一级目录按下面的格式返回，title 就是一级目录文字，text 你帮着生成简短的描述语言：
-{"type": "cover", "data": { "title": "说明文阅读技巧课件提纲", "text": "掌握说明文阅读方法，提高理解能力" } }\n
-
-3. 整理所有二级目录，按下面格式返回：
-{"type": "contents", "data": { "items": [ "说明文概述", "明确说明对象", "把握说明顺序", "分析说明方法及其作用", "理解说明文的语言特点", "归纳文章结构", "练习巩固" ] } }\n
-
-4. 每个二级目录，按下面的格式返回，同样，title 是二级目录文字，text 你帮着生成简短的描述语言：
-{"type": "transition", "data": { "title": "进入说明文概述", "text": "了解说明文的基本概念和特征" } }\r\n
-
-5. 每个二级下的三级目录，按下面格式返回，同样，title 是二级目录文字，text 你帮着生成简短的描述语言：
-{"type": "content", "data": { "title": "说明文概述", "items": [{ "title": "定义", "text": "以说明为主要表达方式，介绍事物或事理的文章" }, { "title": "内容的知识性", "text": "提供丰富的知识信息，帮助读者了解新事物" }, { "title": "语言的准确性", "text": "用词准确，表达严谨，确保信息传递无误" }, { "title": "结构的条理性", "text": "层次分明，逻辑清晰，便于读者理解" } ] } }\n
-
-6. 最后按下面字符串固定输出：
-{"type": "end" }\n
-
-7. 不要输出：```json 和 ```。
-
-8. 不要生成 **xx** 这样的 markdown 中加重的符号。
-
-以下是需要处理的 Markdown 内容：
-{{source}}
-
-请将上述 Markdown 内容转换为以下文本字符串格式：