# Deepview 商业顾问同步会议 **与罗波 · 2026-04-14** **会议目的**:同步《深维·面诊沟通X光片》智能体的阶段性产品设计进展,邀请罗波以商业顾问视角,就产品形态、市场切入策略与商业叙事给出反馈。 --- ## 当前产品全貌(设计进展综述) ### 一句话定义 **深维是一款面向美容医疗场景的 AI 面诊助理:医生按一下录音,就能拿到一份面诊 X 光片;输上客户的名字,就能拿到一份完整的客户全生命周期档案。** --- ### 一、已完成交付的核心能力 #### 1. 实时录音管线(Phase 1 & 2 已跑通) - **Web 前台录音**(已完成):手机/电脑打开 Deepview,点击录音按钮,结束后自动触发 OSS 上传 + DashScope Paraformer V2 说话人分离 ASR,2~3 分钟后生成 X 光片报告,无需任何人工干预。 - **Android 后台保活录音**(已完成):已完成 Tauri Android 打包,从 MindOS 迁移了前台服务三件套(`RecordingForegroundService.kt`)。手机锁屏放进口袋,可连续录制 4 小时以上,录音数据不掉、不丢、不断。 - **统一管线设计**:无论来源是手动上传文件、Web 前台录音、还是 Android 后台录音,都统一汇入 `runRealPipeline(file)` 这一个入口,后端永远只看到 一个 OSS key + 一个文件名。 ``` 前台录音 (Web MediaRecorder) ┐ 后台录音 (Android RecordingService) ├→ 统一产出: File 对象 → OSS → ASR → asr.md → 报告 手动上传 (input[type=file]) ┘ ``` #### 2. AI 分析管线(两段式 + 双上下文) **单次面诊 → X 光片报告(Recording 模式)** - Stage 1: Hermes AI 军师读取本次 `asr.md`,生成五模块结构化报告草稿(接纳度、体征信号、信任断点、雷达评分、行动处方) - Stage 2: Qwen 接力将 Markdown 转为严格 JSON,前端强类型渲染,防止 AI 偷懒省字段 **全景档案 → 客户托付档案(Client 模式)** - Agent 读取该客户所有历史录音、已有 profile 档案 - 生成完整的客户生命周期洞察:LTV 估算、拒因池分析、引荐关系图谱、战略破冰方案 **双上下文切换(核心架构创新)**: ``` /report/rep_xxx → contextId = "recording:xxx" → 单次战术复盘 /client/cli_xxx → contextId = "client:xxx" → 全景战略洞察 ``` 前端只传一个 contextId,后端自动决定加载哪些文件,前端不参与编排。 #### 3. Inbox 惰性归档(Lazy Binding) - 医生录完音或上传完照片,数据落入 `inbox/{reportId}/`,完全不需要提前选客户、建档、填表 - 报告生成后,医生点一次"归档"即将本次完整数据包(asr.md + report + 音频)原子迁移到 `clients/{clientId}/history/` - 这是一个"先有价值,后有治理"的体验设计,先让 AI 裸推演,事后再绑定关系 #### 4. Markdown-First 物理落盘与来源分级(防幻觉架构) 三级证据链,层级越低越可信: | 级别 | 文件 | 含义 | 不可变性 | |------|------|------|---------| | L0 | `asr.md` | 人类原声客观转写,不含 AI 推断 | ✅ 一旦生成不可修改 | | L1 | `report_draft.md` | AI 基于单次录音的一阶分析摘要 | 可重新生成,但有标记 | | L2 | `profile.md` | AI 跨多次录音的聚合客户档案 | 可更新,但优先级最低 | 设计核心:Agent 下次打开客户档案时,能明确区分哪句话来自医生原话(L0),哪句话是 AI 自己推断的(L2),杜绝"幻觉叠加幻觉"的复利效应。 #### 5. Prosumer-First 数据沙箱(个人生产力联邦) - 物理隔离边界从"公司"下沉到"个人账号(userId)" - 李大夫的客户档案,与王主任没有任何交集,底层文件系统级隔离 - 零多租户 RAG 污染,零权限管理负担,彻底消除传统 CRM 的"管理爹味" #### 6. 三元知识域架构(已设计,待实现) 面向多机构 SaaS 场景的知识隔离架构: ``` 平台域 platform/wiki/ → 运维写,所有用户只读 (底线合规) 机构域 orgs/{orgId}/wiki/ → 机构管理员写,本院用户只读 (RFM规则/话术/定价) 个人域 users/{userId}/ → 用户独占读写 (客户档案/录音/个人画像) ``` 机构的差异化方法论(RFM 分级、话术规范、定价表)作为"判规"注入 Agent,与原始录音这个"答卷"绝对隔离,避免知识污染。 #### 7. ChatBox 上下文追问(已设计,待前端接入) - 后端 SSE 管线已完全就绪(7 个封闭 SSE 事件,与馨总智能体同构) - 当前 ChatBox 是 Mock,待接入真实 API 后,医生在 X 光片页面可直接追问:"这次她为什么拒绝了乔雅登?",AI 实时流式回答,完全基于本次录音上下文 --- ### 二、整体架构示意 ``` 医生的动作 平台基础设施 AI 输出 短按→录音 OSS 直传(不经后端 X 光片报告 长按→上传图片/文件 → 节省带宽) → (五模块结构化) ↓ DashScope ASR 客户托付档案 Hermes AI 军师 → (全景洞察 + 破冰策略) LiteLLM Gateway (gemini-pro-vertex) 追问式对话 → (ChatBox 实时流) ``` --- ## 会议议题 ### 议题 1:核心商业叙事 **主题**:用"高价值输出换取低动作配合"的飞轮,去替代传统 CRM 的"填表换数据"逻辑 **要点**:医生作为我们的客户,不应该被"你需要先做什么才能获得什么"。 - 医生只需**点开录音**(最低摩擦力的一个动作),就能换回一份高质量的面诊洞察——接纳度雷达、信任断点、下次破冰策略 - 医生只需**输入客户名字**(极简的一个建档),就能立刻调出该客户从第一次面诊到今天的全景生命周期档案——拒因演变、转介绍关系图、LTV 估算 - 系统不对医生提"管理要求",只用超预期的输出去诱导他们自然配合 **向罗波提问**: - 这种"不条件前置、直接给价值"的产品逻辑,对于美容医疗诊所的医生群体,冷启动时的破冰能力和推广节奏应该怎么设计? - 我们在商业宣传上,这个核心正反馈飞轮该怎么包装? --- ### 议题 2:GTM 路径选择 **主题**:以"个人超能助理"切入,用 B2C 极简架构包抄 B2B 护城河 **要点**: - 现在的系统就是一个"属于医生个人"的超能助理,数据完全私域化 - 没有装 IT、没有部门权限树、没有管理员审批,直接扫码登录就用 - 等医生产生足够的工具依赖后,通过"授权联邦"上移:医生主动授权特定档案给科室/诊所管理层,换取企业版订阅 **向罗波提问**: - 在医疗/医美赛道,这种"先武装一线医师/医助"、再从个人工具演进成团队工具的 PLG 增长路径,你认为走得通吗? - 诊所管理层对"数据在员工手里而不在机构手里"这件事,阻力有多大?商业话术上该怎么提前破解这个卡点? --- ### 议题 3:AI 可信度 — 医疗场景的差异化壁垒 **主题**:用"证据链溯源架构"解决医疗领域对 AI 的信任危机 **要点**: - 我们在底层做了严格的三级证据分层(L0 原始录音文本→L1 单次报告→L2 跨次档案),防止 AI 幻觉叠加幻觉 - 医生随时可以下钻:这一句结论,具体来自哪次录音的哪段原话? - 系统强制区分"人类说的话"和"AI 推断出来的话",并在档案里做好标注 **背景补充**:这不仅是技术架构,也是一个反向竞争壁垒——市面上大多数 AI 工具把 AI 的推断和原始事实"混为一谈",等事实和推断混在一起,档案的可信度就螺旋下降。我们的设计从根本上切断了这条路。 **向罗波提问**: - 把"可溯源性"和"防幻觉架构"作为面向医疗客户的核心卖点,杀伤力足够吗?还是太技术化了,需要翻译成更通俗的说法? - 医疗机构在采购 AI 工具时,除了"幻觉"风险,还在意哪些合规或信任维度? --- ### 议题 4:MVP 形态与种子用户策略 **主题**:当前底座已跑通,下一步如何快速找到第一批种子机构 **当前已验证的技术底座**: - ✅ Web 端录音全流程(录音→ASR→报告→ChatBox 追问) - ✅ Android 壳打包完成,支持背景保活录制 - ✅ 客户档案管线(归档→全景档案生成) - ✅ 数据私域沙箱(Prosumer-First 隔离) - ⬜ 三元知识域(多机构 SaaS 隔离,待实现) - ⬜ ChatBox 真实 SSE 接入(待前端接入,后端已就绪) **向罗波提问**: - 基于当前已验证的闭环,拿去找第一批种子诊所做灰度,MVP 应该精简打磨到什么程度? - 是先聚焦在"录音→X光片"这一个最亮眼的功能点上,还是必须把"长期客户档案"一起讲? - 你认为种子用户在哪个圈子里更好找:单店美容诊所、连锁医美机构、还是独立医生执业(个体医美顾问)? --- ## 备忘 > 这场会议不在于汇报代码写了多少行。核心目标是:用以上四个产品设计事实为弹药,向罗波确认我们的商业叙事是否打动人,并挖掘出最适合 Deepview 走向市场的 GTM 策略。