- 统一为 DASHSCOPE_API_KEY(百炼 Key 通吃 LLM + Embedding) - import-voc 后自动触发 UDE 转写 + 向量化(后台 asyncio task) - 新增 GET /pipeline-status 查询流水线进度 - run_clustering 变纯 CPU(向量已预计算) - 新增独立 run_vectorization 函数 - 修复 Python 3.9 类型注解兼容性
2.0 KiB
2.0 KiB
更新日志 (Changelog)
v2.1.0 (2026-04-07)
🚀 功能 (Features)
- BYOK(自带弹药)模式:合伙人通过
X-DashScope-KeyHeader 传入百炼 Key,服务器不承担任何 Token 成本。百炼 Key 一个通吃 LLM 推理 + Embedding 向量化。 - 自动流水线:
import-voc完成后自动异步触发 UDE 转写 + 向量化,无需 CoPaw Agent 逐步编排。 GET /pipeline-status:新增流水线进度查询接口,支持 CoPaw 轮询。- 聚类零调用:
/ude/cluster变为纯 CPU 操作(毫秒级),向量已在流水线中预计算。
🛠️ 重构与优化 (Refactor & Optimization)
BAILIAN_API_KEY废弃,统一为DASHSCOPE_API_KEY(两把钥匙取代三把)。- 新增
run_vectorization独立函数,从run_clustering中拆出向量化逻辑。 _get_llm_client默认直连百炼 API,移除 LiteLLM 代理依赖。
v2.0.0 (2026-04-07)
🚀 功能 (Features)
- 独立后端(阿里云闭环):不再跨云依赖 VOC 数据库,数据自包含,进一步提高系统的运行稳定性和隔离性。
- VOC 数据导入 (import-voc):新增通过 VOC 公网 API 拉取评论数据的方法,并落盘存储于本项目的独立 SQLite 中。
- 案例与评论全解耦:移除旧版
get_voc_conn()的跨云挂载,ude_extract等逻辑现已直读本地comments数据库表。
🛠️ 重构与优化 (Refactor & Optimization)
- 依赖管理:新增了对
httpx的依赖,用来请求 REST API 拉取 VOC 数据。 - 数据库设计调整:重新规整
case_card及新建本地的comments表结构。 - 环境配置 (.env):移除
VOC_DATA_DIR配置项,引入控制导入链路的VOC_API_BASE,消除本地文件系统的强依赖。
🐞 故障排查 (Bug Fix / Diagnostics)
- VOC 服务联动问题:排查并定位由于 腾讯云 CDN 代理拦截 PUT 方法导致的 CoPaw VOC 数据写入受阻问题。为 VOC 数据采集的通信协议指明“直连”规范。