产品方案文档
AI 评分报告改版
把"人肉找不同"变成"3 秒看懂最大问题"——在现有评分体系上增量优化,只改 AI 点评和改进建议。
01
问题背景
AI 教练评分报告让用户"看了几分钟都看不懂哪里有问题"。
典型案例
医疗销售场景 · 学员完整独白 vs AI 全文重写
学员发言
这种潮湿温暖的环境特别容易滋生真菌,所以瘙痒会比较剧烈。我给您推荐两款药搭配使用,一个是止痒的外用喷剂,可以快速缓解您的瘙痒症状,另一个是抗真菌的药膏,从根本上杀灭真菌。这两款药一个治标一个治本,配合使用效果最好。您平时一定要注意保持脚部干燥,穿透气性好的鞋子,袜子最好选纯棉的,洗完脚要擦干特别是脚趾缝,这样真菌就不容易再长了。
AI 改进建议
这种潮湿温暖的环境确实容易滋生真菌,所以您可能会感到瘙痒比较剧烈。我给您推荐两款药物搭配使用,一个是止痒的外用喷剂,可以快速缓解您的瘙痒症状,另一个是抗真菌的药膏,从根本上杀灭真菌。这两款药物一个治标一个治本,配合使用效果最好。您平时一定要注意保持脚部干燥,穿透气性好的鞋子,袜子最好选择纯棉的,洗完脚要擦干特别是脚趾缝,这样真菌就不容易再生长了。
公司内部反馈
这种改进建议能不能直观一点,不行只把差异化或者需要改进的地方体现出来?看几分钟看的头晕眼花都不一定看出来到底哪里需要改进。
公司内部反馈
首先是点评策略的问题——针对这种不太合理的长文本表达,本身就不符合真实的对话场景,显得机械和背课本的感觉,这种表达本身是值得批评的,而不是 AI 给出一个逐句调整修改的版本。其次是 UI 展现——如果是整段话里有哪句表达有问题,AI 可以划红线标记出来,然后给出点评和改进建议,而不是像现在这样平铺出来。
01.2
根因分析
核心问题
AI 把沟通训练当成了作文润色
系统默认信息越完整越好、内容越长越好、表达越严谨越好,因此 AI 逐句润色、改写措辞、优化文本完整性——本质上是在批改作文,而不是训练真人沟通。
隐性偏差
背稿式表达得分反而更高
学员输出越长,AI 越容易识别产品知识、话术结构、专业词汇从而给出较高评价。但真实沟通中短句、追问、确认——内容量更少——反而得低分,评分体系在惩罚正确行为。
真实沟通的核心是对话行为——是否让对方有回应空间、是否追问、是否有互动节奏、是否像真人交流——而不是文本内容的完整度。
01.3
四层问题拆解
建议策略
全文改写式建议,不可执行
AI 给的是"最终答案"——一整段改写后的话术,而不是"交流技巧"。用户无法快速学习、立即模仿。且完整示范话术引导学员继续"背稿"。
信息架构
所有问题平铺,无优先级
"未使用礼貌用语"和"连续输出 60 秒没有互动"视觉权重相同。缺少致命问题前置,用户无法 3 秒定位最大问题。
01.4
代码验证
当前代码确认了上述问题的存在:
- 学员发言和改进建议
(StudentStatement.vue)— 两段纯文本平铺,无 diff 标记或高亮 - 标准要点 vs 学员匹配
(KeyPointComponent.vue)— 并排展示,无差异高亮 - 逐句评分+点评
(SentenceList.vue)— 纯文本输出 - 对话标签页
(index.vue)— 长列表滚动,所有问题权重相同
02
核心转变:从"评分器"到"教练"
不是加功能补丁,是改 AI 的角色定位。当前的 AI 是"评分器"——先给分,再解释为什么这个分。改版后的 AI 是"教练"——先告诉学员最关键的问题和练习方向,评分细节在另一个页面按需查看。
当前:评分器
练习结束 → 跳转评分报告页 → 雷达图 + 全文点评 + 全文改写建议
信息流:评分驱动,先看数字,再被动阅读大量文本
→
改版:教练
练习结束 → 教练复盘页(report-chat)→ 等报告生成 → 评分报告页(report-complete)
信息流:教练驱动,3 秒知道练什么,详情在另一个页面
02.1
改动范围
本次改版只动两个地方,其余组件不动。
不动:综合评价(得分曲线)
(ReportScore)、能力雷达图(RadarChart)、总分、KeyPoint 匹配、能力维度评分、学员发言原文——这些是客观评分数据,保留原样。
改
AI 点评
(AiComment)当前:一大段文字总评。改版:一句核心结论 + 问题优先级排序(致命问题/需关注/可优化)。
改
改进建议
(StudentStatement)当前:完整话术重写("建议改良话术"整段)。改版:砍掉全文改写,改为交流策略 + 示范开头。
改动范围极小:只改 2 个组件的展示逻辑 + AI prompt 输出格式。不新增数据字段,不新增评分维度,不新增检测逻辑。综合评价和能力雷达完全不动。
02.2
AI 点评改版
(AiComment)当前 AI 总评是一大段文字,用户不会读。改为一句核心结论 + 问题优先级排序。
当前
综合评价您的表现,整体话术较为完整,产品知识覆盖全面。但在互动节奏方面有待提升,建议增加停顿和确认环节,让客户有参与感。同时部分表达可以更加简洁,避免一次性输出过多信息……
→ 一大段文字,用户不会读
→
改版
核心结论
内容覆盖全面,但长篇独白是最大问题,需重点练习互动节奏。
问题优先级
致命问题 长篇独白,缺少互动
需关注 缺少确认环节
可优化 部分用词可精炼
→ 一眼扫完核心结论 + 问题优先级
优先级定义
| 优先级 | 含义 | 展示方式 | 示例 |
|---|---|---|---|
| 致命问题 | 严重影响沟通效果的行为问题 | 独立卡片置顶 | 长篇独白、零互动 |
| 需关注 | 明显影响表达自然度的问题 | 默认展开 | 背稿感、缺少确认 |
| 可优化 | 措辞/用词层面的细节问题 | 默认折叠 | 用词不够专业 |
优先级由 AI prompt 判断。prompt 要求 AI 对每个问题标注严重程度(致命问题 / 需关注 / 可优化)。前端只消费 severity 字段渲染。新增问题类型只需调整 prompt,前端零改动。
02.3
改进建议改版
(StudentStatement)当前 AI 给的是"最终答案"——一整段改写后的话术。改为交流策略 + 示范开头,不给完整话术。
当前:全文改写
"建议改良话术:您提到的情况确实比较常见,这种潮湿温暖的环境特别容易滋生真菌,所以瘙痒会比较剧烈。我给您推荐两款药搭配使用……"
→ 又是一整段,和原文几乎一样,人肉找不同
→
改版:交流策略
1 先确认症状
2 等对方回应
3 再推荐方案
示范开头:"您这种情况夏天会更严重吗?"
→ 交流结构 + 第一步示范,不给完整话术
不给完整示范话术。给完整话术又回到"背稿"模式。只给交流结构 + 第一步示范,让学员自己练完后续步骤。
展示位置
改进建议从评分报告页(report-complete)移到教练复盘页(report-chat)。练习结束后学员在对话流里直接看到教练复盘(L1 核心指导 + L2 改进建议),可以追问。评分报告页不再展示全文改写。
1
练习结束 → 进入教练复盘页
(report-chat)AI 教练复盘消息:核心问题 + 交流策略 + 示范开头。学员可以追问。
↓
2
等待评分报告生成
学员在 chat 里继续看教练复盘、追问。报告生成需要时间。
↓
3
点击跳转评分报告页
(report-complete)只展示精简评分——核心结论 + 优先级 + 雷达图(不动)。不再展示全文改写。
02.4
MVP 改动清单
最小可行改动:改 AI prompt 输出格式 + 砍 2 个组件的冗余展示。零新增数据字段,零后端改动。
MVP 原则:不新增 API 字段,不新增检测逻辑,不新增评分维度。只做两件事:(1) 调整 AI prompt 输出格式(核心结论 + 优先级 + 策略建议);(2) 评分报告页砍全文改写、砍长文本总评。综合评价和能力雷达完全不动。老数据自动降级展示。
| 改动项 | 页面 | 组件 | 具体内容 |
|---|---|---|---|
| Prompt 调整 | 后端 | AI 评分 prompt | 新增"核心结论 + 问题优先级 + 交流策略"输出指令 |
| 教练复盘消息 | 教练复盘页 (report-chat) | 对话流 | 练习结束自动推送 L1 核心指导 + L2 策略建议消息卡片 |
| AI 总评精简 | 评分报告页 (report-complete) | AI 点评 (AiComment) | 砍长文本,改为一句核心结论 + 问题优先级排序(致命问题 / 需关注 / 可优化) |
| 全文改写建议 | 评分报告页 (report-complete) | 改进建议 (StudentStatement) | 砍掉全文改写。改为"在 chat 中查看改进建议"入口 |
| 问题优先级 | 教练复盘页 (report-chat) | 复盘消息 | 按 severity 字段排序+分组。无 severity 时保持原序 |
数据兼容策略
| 场景 | 处理方式 |
|---|---|
| 新数据(prompt 已改) | 教练复盘页展示教练复盘消息;评分报告页展示精简 AI 点评(核心结论 + 优先级) |
| 老数据(prompt 未改) | 教练复盘页无教练复盘消息,与当前体验一致;评分报告页展示原格式 |
| 混合数据(部分字段有值) | 按字段是否存在逐层降级:有核心结论→显示,无→显示原 AI 总评;有 severity→排序,无→原序 |
02.5
迭代路线
MVP 优先验证教练角色是否有效。Phase 1 只改 prompt + 评分报告页砍 2 个组件 + 教练复盘页加消息,不新增检测逻辑和评分维度。先验证"教练复盘"比"评分器点评"是否真的更好用,再决定 Phase 2/3。
Phase 1 · MVP
教练复盘 + 减法
· 调整 AI prompt 输出格式
· 教练复盘页加教练复盘消息
· 评分报告页砍全文改写
· 评分报告页砍长文本总评
· 综合评价/雷达图不动
零新增字段 · 零后端改动
· 教练复盘页加教练复盘消息
· 评分报告页砍全文改写
· 评分报告页砍长文本总评
· 综合评价/雷达图不动
零新增字段 · 零后端改动
Phase 2 · 增量
行为检测 + 标注
· 学员发言局部标注
· 行为异常检测信号层
· 交流自然度维度
· 致命问题告警卡片
新增 API 字段 · 前端标注组件
· 行为异常检测信号层
· 交流自然度维度
· 致命问题告警卡片
新增 API 字段 · 前端标注组件
Phase 3 · 完善
可配规则 + 场景适配
· 行为检测规则可配置
· 场景类型自动适配优先级
· 自然度维度融入雷达图
· 历史报告趋势对比
后端规则引擎 · 配置面板
· 场景类型自动适配优先级
· 自然度维度融入雷达图
· 历史报告趋势对比
后端规则引擎 · 配置面板