- 统一为 DASHSCOPE_API_KEY(百炼 Key 通吃 LLM + Embedding) - import-voc 后自动触发 UDE 转写 + 向量化(后台 asyncio task) - 新增 GET /pipeline-status 查询流水线进度 - run_clustering 变纯 CPU(向量已预计算) - 新增独立 run_vectorization 函数 - 修复 Python 3.9 类型注解兼容性
30 lines
2.0 KiB
Markdown
30 lines
2.0 KiB
Markdown
# 更新日志 (Changelog)
|
||
|
||
## v2.1.0 (2026-04-07)
|
||
|
||
### 🚀 功能 (Features)
|
||
- **BYOK(自带弹药)模式**:合伙人通过 `X-DashScope-Key` Header 传入百炼 Key,服务器不承担任何 Token 成本。百炼 Key 一个通吃 LLM 推理 + Embedding 向量化。
|
||
- **自动流水线**:`import-voc` 完成后自动异步触发 UDE 转写 + 向量化,无需 CoPaw Agent 逐步编排。
|
||
- **`GET /pipeline-status`**:新增流水线进度查询接口,支持 CoPaw 轮询。
|
||
- **聚类零调用**:`/ude/cluster` 变为纯 CPU 操作(毫秒级),向量已在流水线中预计算。
|
||
|
||
### 🛠️ 重构与优化 (Refactor & Optimization)
|
||
- ~~BAILIAN_API_KEY~~ 废弃,统一为 `DASHSCOPE_API_KEY`(两把钥匙取代三把)。
|
||
- 新增 `run_vectorization` 独立函数,从 `run_clustering` 中拆出向量化逻辑。
|
||
- `_get_llm_client` 默认直连百炼 API,移除 LiteLLM 代理依赖。
|
||
|
||
## v2.0.0 (2026-04-07)
|
||
|
||
### 🚀 功能 (Features)
|
||
- **独立后端(阿里云闭环)**:不再跨云依赖 VOC 数据库,数据自包含,进一步提高系统的运行稳定性和隔离性。
|
||
- **VOC 数据导入 (import-voc)**:新增通过 VOC 公网 API 拉取评论数据的方法,并落盘存储于本项目的独立 SQLite 中。
|
||
- **案例与评论全解耦**:移除旧版 `get_voc_conn()` 的跨云挂载,`ude_extract` 等逻辑现已直读本地 `comments` 数据库表。
|
||
|
||
### 🛠️ 重构与优化 (Refactor & Optimization)
|
||
- **依赖管理**:新增了对 `httpx` 的依赖,用来请求 REST API 拉取 VOC 数据。
|
||
- **数据库设计调整**:重新规整 `case_card` 及新建本地的 `comments` 表结构。
|
||
- **环境配置 (.env)**:移除 `VOC_DATA_DIR` 配置项,引入控制导入链路的 `VOC_API_BASE`,消除本地文件系统的强依赖。
|
||
|
||
### 🐞 故障排查 (Bug Fix / Diagnostics)
|
||
- **VOC 服务联动问题**:排查并定位由于 腾讯云 CDN 代理拦截 PUT 方法导致的 CoPaw VOC 数据写入受阻问题。为 VOC 数据采集的通信协议指明“直连”规范。
|