Spaces:

1oscon
/

hunyuanfy

Runtime error

App Files Files Community

1oscon commited on Sep 6

Commit

71f20e5

verified ·

1 Parent(s): d3d246a

Update app.py

Browse files

Files changed (1) hide show

app.py +248 -167

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import os, json, gc, datetime
-from typing import List, Tuple
 from pathlib import Path
 # 性能与日志
 os.environ["OMP_NUM_THREADS"] = "2"
@@ -17,10 +17,10 @@ from huggingface_hub import snapshot_download
 模型本地目录 = "./phi4_model"
 历史目录 = "./chat_history"
-系统提示 = "你是一个友好的中文 AI 助手。"
 结束标记 = "<|end|>"
-上下文窗口 = 4096  # 估计
-默认回复长度 = 256
 # ================ 工具函数 ================
 def 确保目录():
@@ -46,20 +46,25 @@ class 历史管理:
         return os.path.join(历史目录, f"{会话}.json")
     @staticmethod
-    def 保存(历史: List[List[str]], 会话="默认会话"):
-        data = {"history": 历史, "time": datetime.datetime.now().isoformat()}
         with open(历史管理.路径(会话), "w", encoding="utf-8") as f:
             json.dump(data, f, ensure_ascii=False)
     @staticmethod
-    def 加载(会话="默认会话") -> List[List[str]]:
         p = 历史管理.路径(会话)
         if os.path.exists(p):
             with open(p, "r", encoding="utf-8") as f:
-                return json.load(f).get("history", [])
-        return []
-# ORT GenAI 兼容（不同版本的长度/搜索参数）
 def 设定长度参数(params: "og.GeneratorParams", 最大长度: int) -> bool:
     if hasattr(params, "set_length_options"):
         params.set_length_options(max_length=int(最大长度))
@@ -67,8 +72,8 @@ def 设定长度参数(params: "og.GeneratorParams", 最大长度: int) -> bool:
     return False
 def 设定搜索参数(params: "og.GeneratorParams",
-            采样: bool, 温度: float, top_p: float, top_k: int, 重复惩罚: float,
-            最大长度_if_needed: int | None):
     kwargs = dict(
         do_sample=bool(采样),
         temperature=float(温度),
@@ -81,7 +86,6 @@ def 设定搜索参数(params: "og.GeneratorParams",
     try:
         params.set_search_options(**kwargs)
     except TypeError:
-        # 极旧版不支持时，移除不兼容键
         kwargs.pop("top_k", None)
         kwargs.pop("repetition_penalty", None)
         params.set_search_options(**kwargs)
@@ -107,7 +111,6 @@ def 按窗口裁剪(input_ids: list, 新token上限: int, 上下文上限: int)
 print("🚀 初始化中...")
 try:
     模型路径 = 下载模型()
-    # 降低 ORT 日志
     try:
         import onnxruntime as ort
         ort.set_default_logger_severity(3)
@@ -135,16 +138,17 @@ except Exception as e:
     分词器 = None
 # ================ 生成（流式） ================
-def 流式回复(用户消息: str, 历史: List[List[str]], 回复长度: int, 温度: float, 记忆轮数: int, 上下文tokens: int):
     if not 模型 or not 分词器:
-        yield "❌ 模型未加载，请稍后重试"
         return
     try:
-        # 仅保留最近 N 轮，避免过长
         if 记忆轮数 > 0 and len(历史) > 记忆轮数:
             历史 = 历史[-记忆轮数:]
-        提示 = 构建模板(系统提示, 历史, 用户消息)
         输入ID = 分词器.encode(提示)
         输入ID = 按窗口裁剪(输入ID, 回复长度, min(上下文tokens, 上下文窗口))
@@ -164,6 +168,7 @@ def 流式回复(用户消息: str, 历史: List[List[str]], 回复长度: int,
         流 = 分词器.create_stream()
         回复 = ""
         while not 生成器.is_done():
             生成器.compute_logits()
             生成器.generate_next_token()
@@ -171,203 +176,279 @@ def 流式回复(用户消息: str, 历史: List[List[str]], 回复长度: int,
             片段 = 流.decode(新)
             if not 片段:
                 continue
             回复 += 片段
             if 结束标记 in 回复:
                 回复 = 回复.split(结束标记)[0].rstrip()
-                yield 回复
                 break
-            # 适度降频更新，提升流畅度
-            if len(回复) % 8 == 0:
-                yield 回复
         else:
-            yield 回复.strip()
         del 生成器, params
         gc.collect()
     except Exception as e:
-        yield f"❌ 生成错误: {str(e)}"
-# ================== UI（极简 + 自适应所有设备） ==================
 css = """
-/* 页面三段式：头部 / 聊天 / 输入 */
-#layout {
-  height: 100dvh;  /* 移动端更准确的视口单位 */
-  display: grid;
-  grid-template-rows: auto 1fr auto;
-  gap: 8px;
-  max-width: 880px;
-  margin: 0 auto;
-  padding: 8px 10px 12px;
-}
-/* 头部 */
-#hdr {
-  background: #ffffff;
-  border-radius: 12px;
-  padding: 10px 14px;
-  box-shadow: 0 2px 10px rgba(0,0,0,0.05);
 }
-/* 聊天容器可滚动 */
-#chat_region {
-  min-height: 0; /* 允许子元素收缩 */
-  overflow: hidden; /* 由内部滚动 */
-}
-#chatbox [data-testid="chatbot"] {
-  height: 100% !important;
 }
-#chatbox {
-  height: 100%;
-  overflow: auto;            /* 滚动由此容器承担 */
-  background: #fff;
-  border-radius: 12px;
-  box-shadow: 0 2px 10px rgba(0,0,0,0.05);
 }
-/* 输入区 */
-#input_region {
-  background: #ffffff;
-  border-radius: 12px;
-  box-shadow: 0 2px 10px rgba(0,0,0,0.05);
   padding: 8px;
 }
-/* 自适应：小屏压缩间距与字号 */
 @media (max-width: 640px) {
-  #hdr h1 { font-size: 18px; }
-  #hdr p  { font-size: 12px; }
-}
-/* 简洁按钮样式 */
-.gr-button { border-radius: 10px !important; }
-.gr-button-primary {
-  background: #6d28d9 !important;
 }
 """
-# 用 JS 动态计算聊天区高度（更稳适配各种设备与键盘/地址栏）
-autosize_js = """
-<script>
-function sizeChat() {
-  const layout = document.getElementById('layout');
-  const hdr = document.getElementById('hdr');
-  const input = document.getElementById('input_region');
-  const chat = document.getElementById('chatbox');
-  if (!layout || !chat) return;
-  const vh = (window.visualViewport && window.visualViewport.height) || window.innerHeight;
-  const used = (hdr?.offsetHeight || 0) + (input?.offsetHeight || 0) + 24; // padding + gap
-  const h = Math.max(240, vh - used);
-  chat.style.height = h + 'px';
-}
-window.addEventListener('resize', sizeChat);
-window.addEventListener('orientationchange', sizeChat);
-setTimeout(sizeChat, 50);
-setTimeout(sizeChat, 300);
-</script>
-"""
-历史 = 历史管理.加载("默认会话")
 with gr.Blocks(theme=gr.themes.Soft(), css=css) as demo:
-    # 页面布局
-    with gr.Column(elem_id="layout"):
-        with gr.Column(elem_id="hdr"):
-            gr.Markdown("### 💬 Phi-4 中文助手")
-            gr.Markdown("简洁 · 智能 · 自适应所有设备")
-        with gr.Column(elem_id="chat_region"):
-            聊天框 = gr.Chatbot(
-                value=历史,
-                type="tuples",           # 与 [[user, assistant], ...] 兼容，无警告
-                elem_id="chatbox",
-                show_copy_button=True
-            )
-        with gr.Column(elem_id="input_region"):
             with gr.Row():
-                消息 = gr.Textbox(
-                    placeholder="输入你的问题...",
-                    lines=1,
-                    max_lines=4,
-                    scale=6
-                )
-                发送 = gr.Button("发送", variant="primary", scale=1)
             with gr.Row():
-                清空 = gr.Button("清空", size="sm")
-                撤销 = gr.Button("撤销", size="sm")
-                重试 = gr.Button("重试", size="sm")
-                停止 = gr.Button("停止", size="sm")
             with gr.Row():
-                回复长度 = gr.Slider(50, 512, value=默认回复长度, step=16, label="回复长度")
-                温度 = gr.Slider(0.0, 1.0, value=0.7, step=0.1, label="创造性")
-                记忆轮数 = gr.Slider(1, 12, value=5, step=1, label="记忆轮数")
-                上下文限制 = gr.Slider(512, 上下文窗口, value=2048, step=128, label=f"上下文上限(≤{上下文窗口})")
-    # 自动高度脚本
-    gr.HTML(autosize_js)
-    # 交互逻辑
-    def 用户提交(文本, 历史):
-        文本 = (文本 or "").strip()
-        if not 文本:
-            return "", 历史
-        return "", 历史 + [[文本, None]]
-    def 机器人应答(历史, 回复长度, 温度, 记忆轮数, 上下文限制):
-        if not 历史 or 历史[-1][1] is not None:
-            return 历史
-        用户消息 = 历史[-1][0]
-        历史[-1][1] = ""
-        for 段落 in 流式回复(
             用户消息=用户消息,
-            历史=历史[:-1],
-            回复长度=int(回复长度),
-            温度=float(温度),
-            记忆轮数=int(记忆轮数),
-            上下文tokens=int(上下文限制),
         ):
-            历史[-1][1] = 段落
-            yield 历史
-        历史管理.保存(历史, "默认会话")
-    提交事件 = 消息.submit(
         用户提交, [消息, 聊天框], [消息, 聊天框], queue=False
     ).then(
-        机器人应答, [聊天框, 回复长度, 温度, 记忆轮数, 上下文限制], 聊天框
     )
-    点击事件 = 发送.click(
         用户提交, [消息, 聊天框], [消息, 聊天框], queue=False
     ).then(
-        机器人应答, [聊天框, 回复长度, 温度, 记忆轮数, 上下文限制], 聊天框
     )
-    停止.click(fn=None, inputs=None, outputs=None, cancels=[提交事件, 点击事件])
     清空.click(lambda: [], None, 聊天框)
     撤销.click(lambda h: h[:-1] if h else h, 聊天框, 聊天框)
-    def 重试一轮(历史):
-        if not 历史:
-            return 历史
-        最后用户 = 历史[-1][0]
-        return 历史[:-1] + [[最后用户, None]]
     重试.click(重试一轮, 聊天框, 聊天框).then(
-        机器人应答, [聊天框, 回复长度, 温度, 记忆轮数, 上下文限制], 聊天框
     )
     # 自动保存
-    聊天框.change(lambda h: 历史管理.保存(h, "默认会话") if h else None, 聊天框, None)
 if __name__ == "__main__":
     if 模型:
         print("🎉 启动服务...")
-        demo.queue(max_size=12).launch(server_name="0.0.0.0", server_port=7860, share=False)
     else:
         print("❌ 无法启动")

 import os, json, gc, datetime
 from pathlib import Path
+from typing import List, Tuple
 # 性能与日志
 os.environ["OMP_NUM_THREADS"] = "2"
 模型本地目录 = "./phi4_model"
 历史目录 = "./chat_history"
+系统提示默认 = "你是一个友好的中文 AI 助手，请清晰、简洁地回答。"
 结束标记 = "<|end|>"
+上下文窗口 = 4096   # 估计值
+默认回复长度 = 300
 # ================ 工具函数 ================
 def 确保目录():
         return os.path.join(历史目录, f"{会话}.json")
     @staticmethod
+    def 保存(历史: List[List[str]], 会话="默认会话", 元数据: dict = None):
+        data = {"history": 历史, "meta": 元数据 or {}, "time": datetime.datetime.now().isoformat()}
         with open(历史管理.路径(会话), "w", encoding="utf-8") as f:
             json.dump(data, f, ensure_ascii=False)
     @staticmethod
+    def 加载(会话="默认会话") -> Tuple[List[List[str]], dict]:
         p = 历史管理.路径(会话)
         if os.path.exists(p):
             with open(p, "r", encoding="utf-8") as f:
+                js = json.load(f)
+                return js.get("history", []), js.get("meta", {})
+        return [], {}
+    @staticmethod
+    def 列表() -> List[str]:
+        return sorted([p.stem for p in Path(历史目录).glob("*.json")], reverse=True)
+# ORT GenAI 兼容
 def 设定长度参数(params: "og.GeneratorParams", 最大长度: int) -> bool:
     if hasattr(params, "set_length_options"):
         params.set_length_options(max_length=int(最大长度))
     return False
 def 设定搜索参数(params: "og.GeneratorParams",
+             采样: bool, 温度: float, top_p: float, top_k: int, 重复惩罚: float,
+             最大长度_if_needed: int | None):
     kwargs = dict(
         do_sample=bool(采样),
         temperature=float(温度),
     try:
         params.set_search_options(**kwargs)
     except TypeError:
         kwargs.pop("top_k", None)
         kwargs.pop("repetition_penalty", None)
         params.set_search_options(**kwargs)
 print("🚀 初始化中...")
 try:
     模型路径 = 下载模型()
     try:
         import onnxruntime as ort
         ort.set_default_logger_severity(3)
     分词器 = None
 # ================ 生成（流式） ================
+def 流式回复(用户消息: str, 历史: List[List[str]],
+         回复长度: int, 温度: float,
+         记忆轮数: int, 上下文tokens: int):
     if not 模型 or not 分词器:
+        yield "❌ 模型未加载，请稍后重试", 0
         return
     try:
         if 记忆轮数 > 0 and len(历史) > 记忆轮数:
             历史 = 历史[-记忆轮数:]
+        提示 = 构建模板(系统提示默认, 历史, 用户消息)
         输入ID = 分词器.encode(提示)
         输入ID = 按窗口裁剪(输入ID, 回复长度, min(上下文tokens, 上下文窗口))
         流 = 分词器.create_stream()
         回复 = ""
+        t = 0
         while not 生成器.is_done():
             生成器.compute_logits()
             生成器.generate_next_token()
             片段 = 流.decode(新)
             if not 片段:
                 continue
             回复 += 片段
+            t += 1
             if 结束标记 in 回复:
                 回复 = 回复.split(结束标记)[0].rstrip()
+                yield 回复, t
                 break
+            if t % 6 == 0:
+                yield 回复, t
         else:
+            yield 回复.strip(), t
         del 生成器, params
         gc.collect()
     except Exception as e:
+        yield f"❌ 生成错误: {str(e)}", 0
+# ================== UI（全功能 + 自适应） ==================
 css = """
+/* 页面：顶部标题 + 选项卡 +（聊天页：聊天+输入区网格） */
+html, body { height: 100%; }
+.gradio-container { max-width: 1100px !important; margin: 0 auto; }
+/* 顶部标题条 */
+#app_hdr {
+  background: linear-gradient(135deg, #6d28d9 0%, #ec4899 100%);
+  color: #fff; padding: 14px 16px; border-radius: 12px;
+  box-shadow: 0 4px 20px rgba(109,40,217,.25);
 }
+#app_hdr h1 { margin: 0; font-size: 20px; }
+#app_hdr p { margin: 4px 0 0; font-size: 12px; opacity: .95; }
+/* 聊天页布局：自适应高度，输入区固定在底部，不会被遮挡 */
+#chat_layout {
+  height: calc(100dvh - 160px); /* 留出标题和tabs空间 */
+  display: grid; grid-template-rows: 1fr auto; gap: 8px;
 }
+#chat_scroll {
+  min-height: 0; overflow: auto;
+  background: #fff; border-radius: 10px;
+  box-shadow: 0 2px 10px rgba(0,0,0,.06);
+  padding: 6px;
 }
+#input_bar {
+  background: #fff; border-radius: 10px;
+  box-shadow: 0 2px 10px rgba(0,0,0,.06);
   padding: 8px;
 }
+/* 小屏优化 */
 @media (max-width: 640px) {
+  #app_hdr h1 { font-size: 18px; }
+  #app_hdr p { font-size: 11px; }
+  #chat_layout { height: calc(100dvh - 150px); }
 }
 """
+# 初始历史
+初始历史, 初始元数据 = 历史管理.加载("默认会话")
 with gr.Blocks(theme=gr.themes.Soft(), css=css) as demo:
+    会话ID = gr.State("默认会话")
+    系统提示状态 = gr.State(系统提示默认)
+    # 顶部
+    with gr.Column(elem_id="app_hdr"):
+        gr.Markdown("### 💬 Phi-4 中文助手")
+        gr.Markdown("流式生成 · 自动保存 · 多会话 · 上下文可调 · 继续/停止 · 导入导出")
+    with gr.Tabs():
+        # ========= 聊天 Tab =========
+        with gr.Tab("💬 聊天"):
+            with gr.Column(elem_id="chat_layout"):
+                with gr.Column(elem_id="chat_scroll"):
+                    聊���框 = gr.Chatbot(
+                        value=初始历史,
+                        type="tuples",             # 与 [[user, assistant], ...] 兼容
+                        show_copy_button=True,
+                        height="100%"              # 由外层容器控制实际高度
+                    )
+                with gr.Column(elem_id="input_bar"):
+                    with gr.Row():
+                        消息 = gr.Textbox(
+                            placeholder="输入你的消息…（Enter 发送，Shift+Enter 换行）",
+                            scale=8, lines=1, max_lines=4, container=False
+                        )
+                        发送 = gr.Button("发送", variant="primary", scale=1)
+                    with gr.Row():
+                        清空 = gr.Button("🗑️ 清空", size="sm")
+                        撤销 = gr.Button("↩️ 撤销", size="sm")
+                        重试 = gr.Button("🔄 重试", size="sm")
+                        继续 = gr.Button("⏭️ 继续", size="sm")
+                        停止 = gr.Button("⏹️ 停止", size="sm")
+                    token计数 = gr.Markdown("Tokens: 0")
+        # ========= 会话与设置 Tab =========
+        with gr.Tab("⚙️ 会话与设置"):
             with gr.Row():
+                with gr.Column(scale=1):
+                    gr.Markdown("#### 🎯 预设")
+                    预设精准 = gr.Button("📏 精准", size="sm")
+                    预设平衡 = gr.Button("📘 平衡", size="sm")
+                    预设创意 = gr.Button("🎨 创意", size="sm")
+                    gr.Markdown("#### 💬 系统提示词")
+                    系统提示框 = gr.Textbox(
+                        label="系统提示词（影响风格）",
+                        value=系统提示默认, lines=3
+                    )
+                with gr.Column(scale=2):
+                    gr.Markdown("#### 🔧 生成参数")
+                    with gr.Row():
+                        最大生成长度 = gr.Slider(50, 1024, value=默认回复长度, step=10, label="📝 最大生成长度 (tokens)")
+                        温度 = gr.Slider(0.0, 1.2, value=0.7, step=0.1, label="🌡️ 温度")
+                    with gr.Row():
+                        top_p = gr.Slider(0.1, 1.0, value=0.9, step=0.05, label="🎲 Top-p")
+                        top_k = gr.Slider(1, 100, value=40, step=1, label="🔝 Top-k")
+                    with gr.Row():
+                        记忆轮数 = gr.Slider(1, 12, value=6, step=1, label="🧠 记忆轮数（保留最近N轮）")
+                        上下文限制 = gr.Slider(512, 上下文窗口, value=上下文窗口, step=64, label=f"📚 上下文上限 (≤{上下文窗口})")
+            gr.Markdown("#### 💾 会话管理")
             with gr.Row():
+                会话列表 = gr.Dropdown(
+                    label="会话列表", choices=(历史管理.列表() or ["默认会话"]),
+                    value="默认会话", interactive=True
+                )
+                加载 = gr.Button("📂 加载", size="sm")
+                保存 = gr.Button("💾 保存", size="sm")
+                新建 = gr.Button("➕ 新建", size="sm")
             with gr.Row():
+                导入文件 = gr.File(label="导入JSON", file_types=[".json"])
+                导入 = gr.Button("⬆️ 导入", size="sm")
+                导出 = gr.Button("⬇️ 导出当前会话", size="sm")
+                导出文件 = gr.File(label="导出文件", interactive=False)
+    # ========= 逻�� =========
+    # 预设
+    def 用预设(模式):
+        if 模式 == "精准":
+            return 200, 0.2, 0.85, 20
+        if 模式 == "创意":
+            return 500, 0.9, 0.95, 60
+        return 300, 0.7, 0.9, 40  # 平衡
+    预设精准.click(lambda: 用预设("精准"), outputs=[最大生成长度, 温度, top_p, top_k])
+    预设平衡.click(lambda: 用预设("平衡"), outputs=[最大生成长度, 温度, top_p, top_k])
+    预设创意.click(lambda: 用预设("创意"), outputs=[最大生成长度, 温度, top_p, top_k])
+    # 系统提示词
+    def 更新系统提示(s):
+        return s.strip() if s.strip() else 系统提示默认
+    系统提示框.change(更新系统提示, 系统提示框, 系统提示状态)
+    # 基础交互
+    def 用户提交(msg, hist):
+        msg = (msg or "").strip()
+        if not msg:
+            return "", hist
+        return "", hist + [[msg, None]]
+    def 机器人应答(hist, sys_prompt_state, max_len, temp, tp, tk, keep_rounds, ctx_limit, sid):
+        # 临时把系统提示覆盖为用户设置的值
+        global 系统提示默认
+        系统提示默认 = sys_prompt_state
+        if not hist or hist[-1][1] is not None:
+            return hist, gr.update(value="Tokens: 0")
+        用户消息 = hist[-1][0]
+        hist[-1][1] = ""
+        latest = ""
+        for latest, t in 流式回复(
             用户消息=用户消息,
+            历史=hist[:-1],
+            回复长度=int(max_len),
+            温度=float(temp),
+            记忆轮数=int(keep_rounds),
+            上下文tokens=int(ctx_limit),
         ):
+            hist[-1][1] = latest
+            yield hist, gr.update(value=f"Tokens: {t}")
+        历史管理.保存(hist, sid, {"system_prompt": sys_prompt_state})
+    # 发送
+    提交_evt = 消息.submit(
         用户提交, [消息, 聊天框], [消息, 聊天框], queue=False
     ).then(
+        机器人应答, [聊天框, 系统提示状态, 最大生成长度, 温度, top_p, top_k, 记忆轮数, 上下文限制, 会话ID],
+        [聊天框, token计数]
     )
+    点击_evt = 发送.click(
         用户提交, [消息, 聊天框], [消息, 聊天框], queue=False
     ).then(
+        机器人应答, [聊天框, 系统提示状态, 最大生成长度, 温度, top_p, top_k, 记忆轮数, 上下文限制, 会话ID],
+        [聊天框, token计数]
+    )
+    # 继续
+    def 继续输出(hist):
+        if not hist:
+            return hist
+        return hist + [["请从上句继续输出。", None]]
+    继续.click(继续输出, 聊天框, 聊天框).then(
+        机器人应答, [聊天框, 系统提示状态, 最大生成长度, 温度, top_p, top_k, 记忆轮数, 上下文限制, 会话ID],
+        [聊天框, token计数]
     )
+    # 停止（取消队列中事件）
+    停止.click(fn=None, inputs=None, outputs=None, cancels=[提交_evt, 点击_evt])
+    # 清空/撤销/重试
     清空.click(lambda: [], None, 聊天框)
     撤销.click(lambda h: h[:-1] if h else h, 聊天框, 聊天框)
+    def 重试一轮(h):
+        if not h: return h
+        return h[:-1] + [[h[-1][0], None]]
     重试.click(重试一轮, 聊天框, 聊天框).then(
+        机器人应答, [聊天框, 系统提示状态, 最大生成长度, 温度, top_p, top_k, 记忆轮数, 上下文限制, 会话ID],
+        [聊天框, token计数]
     )
+    # 会话管理
+    def 保存当前(hist, sid, sys_prompt):
+        历史管理.保存(hist, sid, {"system_prompt": sys_prompt})
+        return gr.update(choices=历史管理.列表())
+    保存.click(保存当前, [聊天框, 会话ID, 系统提示状态], 会话列表)
+    def 加载会话(sid):
+        h, meta = 历史管理.加载(sid)
+        sp = meta.get("system_prompt", 系统提示默认)
+        return h, sid, sp
+    加载.click(加载会话, 会话列表, [聊天框, 会话ID, 系统提示框])
+    def 新建会话():
+        sid = f"会话_{datetime.datetime.now().strftime('%Y%m%d_%H%M%S')}"
+        历史管理.保存([], sid, {"system_prompt": 系统提示默认})
+        return [], sid, gr.update(choices=历史管理.列表(), value=sid), 系统提示默认, gr.update(value=系统提示默认)
+    新建.click(新建会话, outputs=[聊天框, 会话ID, 会话列表, 系统提示状态, 系统提示框])
+    # 导入 / 导出
+    def 导出(hist, sid):
+        历史管理.保存(hist, sid, {"system_prompt": 系统提示状态.value})
+        return 历史管理.路径(sid)
+    导出.click(导出, [聊天框, 会话ID], 导出文件)
+    def 导入(file, sid):
+        if file is None:
+            return gr.update(), gr.update()
+        try:
+            with open(file.name, "r", encoding="utf-8") as f:
+                js = json.load(f)
+            h = js.get("history", [])
+            meta = js.get("meta", {})
+            sp = meta.get("system_prompt", 系统提示默认)
+            历史管理.保存(h, sid, {"system_prompt": sp})
+            return h, sp
+        except Exception as e:
+            return gr.update(), gr.update(value=f"导入失败: {e}")
+    导入.click(导入, [导入文件, 会话ID], [聊天框, 系统提示框])
     # 自动保存
+    聊天框.change(lambda h, sid, sp: 历史管理.保存(h, sid, {"system_prompt": sp}) if h else None,
+               [聊天框, 会话ID, 系统提示状态], None)
+    # 首次加载：保证默认会话存在 + 列表更新
+    def 初始化():
+        if "默认会话" not in 历史管理.列表():
+            历史管理.保存(初始历史 or [], "默认会话", {"system_prompt": 系统提示默认})
+        return gr.update(choices=历史管理.列表(), value="默认会话")
+    demo.load(初始化, outputs=会话列表)
 if __name__ == "__main__":
     if 模型:
         print("🎉 启动服务...")
+        demo.queue(max_size=16).launch(server_name="0.0.0.0", server_port=7860, share=False)
     else:
         print("❌ 无法启动")