chanpinhsd/CHANGELOG.md
lidf f61c255b9d feat: v2.1 BYOK + 自动流水线
- 统一为 DASHSCOPE_API_KEY(百炼 Key 通吃 LLM + Embedding)
- import-voc 后自动触发 UDE 转写 + 向量化(后台 asyncio task)
- 新增 GET /pipeline-status 查询流水线进度
- run_clustering 变纯 CPU(向量已预计算)
- 新增独立 run_vectorization 函数
- 修复 Python 3.9 类型注解兼容性
2026-04-07 23:09:11 +08:00

2.0 KiB
Raw Blame History

更新日志 (Changelog)

v2.1.0 (2026-04-07)

🚀 功能 (Features)

  • BYOK自带弹药模式:合伙人通过 X-DashScope-Key Header 传入百炼 Key服务器不承担任何 Token 成本。百炼 Key 一个通吃 LLM 推理 + Embedding 向量化。
  • 自动流水线import-voc 完成后自动异步触发 UDE 转写 + 向量化,无需 CoPaw Agent 逐步编排。
  • GET /pipeline-status:新增流水线进度查询接口,支持 CoPaw 轮询。
  • 聚类零调用/ude/cluster 变为纯 CPU 操作(毫秒级),向量已在流水线中预计算。

🛠️ 重构与优化 (Refactor & Optimization)

  • BAILIAN_API_KEY 废弃,统一为 DASHSCOPE_API_KEY(两把钥匙取代三把)。
  • 新增 run_vectorization 独立函数,从 run_clustering 中拆出向量化逻辑。
  • _get_llm_client 默认直连百炼 API移除 LiteLLM 代理依赖。

v2.0.0 (2026-04-07)

🚀 功能 (Features)

  • 独立后端(阿里云闭环):不再跨云依赖 VOC 数据库,数据自包含,进一步提高系统的运行稳定性和隔离性。
  • VOC 数据导入 (import-voc):新增通过 VOC 公网 API 拉取评论数据的方法,并落盘存储于本项目的独立 SQLite 中。
  • 案例与评论全解耦:移除旧版 get_voc_conn() 的跨云挂载,ude_extract 等逻辑现已直读本地 comments 数据库表。

🛠️ 重构与优化 (Refactor & Optimization)

  • 依赖管理:新增了对 httpx 的依赖,用来请求 REST API 拉取 VOC 数据。
  • 数据库设计调整:重新规整 case_card 及新建本地的 comments 表结构。
  • 环境配置 (.env):移除 VOC_DATA_DIR 配置项,引入控制导入链路的 VOC_API_BASE,消除本地文件系统的强依赖。

🐞 故障排查 (Bug Fix / Diagnostics)

  • VOC 服务联动问题:排查并定位由于 腾讯云 CDN 代理拦截 PUT 方法导致的 CoPaw VOC 数据写入受阻问题。为 VOC 数据采集的通信协议指明“直连”规范。