doctorAI/docs/SPEC_deepview_metadata_scoping_v2.md
2026-04-12 13:45:59 +08:00

2.6 KiB
Raw Blame History

SPEC_deepview_metadata_scoping_v2: Single-Stage Auto-Roles & Data Isolation

1. 核心设计理念

本 SPEC 定义了 deepview-agent 在面诊场景下的“极简交互”与“数据边界隔离”两大设计原则。

1.1 一镜到底与角色天然反推 (Single-Stage & LLM Auto-Roles)

  • 痛点:医疗场景下医生争分夺秒,不能提供复杂表单填写;让助理听录音指定角色存在主观偏见且增加负担。
  • 解法:在面诊流转前(短按录音/长按上传时),唯一强制交互仅为“选择/录入本次面诊客户 ID”。录音一旦上云ASR分离说话人为 Speaker_X和 LLM内容战略分析自闭环进行。
  • 神来之笔:在大模型的 Prompt 中,不需要人类干预,通过提供 <Doctor_Profile><Client_Profile> 两个先验事实文档,让 LLM 根据长文本语境谁在做科普、谁在表现疼痛抗拒100% 天然反推出各 Speaker 所对应的真名角色。

1.2 资产库公域化,实战卷宗私有化 (Client Public, Session Private)

针对“一个客户看多个同院医生”的机构边界隔离:

  • 公共履历资产 (Client Profiles)
    • storage/clients/{clientId}/profile.md 是机构公共资产库。
    • 所有医生的面诊洞察均在此累加。大模型脱敏记录“客户性格”、“痛感耐受度”供全院参考。
  • 私下面诊防壁 (Session Isolation)
    • 面诊原声录音 ASR、深打面诊生成报表通过 user_id MindPass token 里的 JWT sub被数据库强隔离。
    • 只有主诊医生 (当前 account) 拥有拉取该报表 (deepview_reports_v2) 和该期录音溯源的权限,保障医疗隐私与个人业务壁垒。

2. 交互流转映射

  1. 短按(实时面诊)
    • 唤起【客户选择器】半屏弹窗
    • 用户检索/输入(例如:李女士 尾号8812点击开始
    • 面板回缩,立即激活麦克风进入常驻录音流态。结束时一键送云。
  2. 长按(归档上传)
    • 唤起【客户选择器】半屏弹窗
    • 确认客户后,调取原生相册文件选择器。
    • 文件选中后直接上兵云端进行转写推理闭环。

3. 技术约束与 Prompt 保障

_handleReportGenerate 中,系统会拼接两份不可变的 DB 文件作为 Context然后发出以下硬约束指令

请自动根据对话语境推断哪位发声者是面诊医生(名医建档:[医师库]),哪位是客户(客户建档:[客户库])。切勿向我请示或询问,直接在最终的面诊战术建议和信任度量中以真实姓名行文替代这些无感情的 Speaker。