AI 评分报告改版方案

产品方案文档

AI 评分报告改版

把"人肉找不同"变成"3 秒看懂最大问题"——在现有评分体系上增量优化，只改 AI 点评和改进建议。

问题背景

AI 教练评分报告让用户"看了几分钟都看不懂哪里有问题"。

典型案例医疗销售场景 · 学员完整独白 vs AI 全文重写

学员发言

这种潮湿温暖的环境特别容易滋生真菌，所以瘙痒会比较剧烈。我给您推荐两款药搭配使用，一个是止痒的外用喷剂，可以快速缓解您的瘙痒症状，另一个是抗真菌的药膏，从根本上杀灭真菌。这两款药一个治标一个治本，配合使用效果最好。您平时一定要注意保持脚部干燥，穿透气性好的鞋子，袜子最好选纯棉的，洗完脚要擦干特别是脚趾缝，这样真菌就不容易再长了。

AI 改进建议

这种潮湿温暖的环境确实容易滋生真菌，所以您可能会感到瘙痒比较剧烈。我给您推荐两款药物搭配使用，一个是止痒的外用喷剂，可以快速缓解您的瘙痒症状，另一个是抗真菌的药膏，从根本上杀灭真菌。这两款药物一个治标一个治本，配合使用效果最好。您平时一定要注意保持脚部干燥，穿透气性好的鞋子，袜子最好选择纯棉的，洗完脚要擦干特别是脚趾缝，这样真菌就不容易再生长了。

公司内部反馈

这种改进建议能不能直观一点，不行只把差异化或者需要改进的地方体现出来？看几分钟看的头晕眼花都不一定看出来到底哪里需要改进。

公司内部反馈

首先是点评策略的问题——针对这种不太合理的长文本表达，本身就不符合真实的对话场景，显得机械和背课本的感觉，这种表达本身是值得批评的，而不是 AI 给出一个逐句调整修改的版本。其次是 UI 展现——如果是整段话里有哪句表达有问题，AI 可以划红线标记出来，然后给出点评和改进建议，而不是像现在这样平铺出来。

01.2

根因分析

核心问题

AI 把沟通训练当成了作文润色

系统默认信息越完整越好、内容越长越好、表达越严谨越好，因此 AI 逐句润色、改写措辞、优化文本完整性——本质上是在批改作文，而不是训练真人沟通。

隐性偏差

背稿式表达得分反而更高

学员输出越长，AI 越容易识别产品知识、话术结构、专业词汇从而给出较高评价。但真实沟通中短句、追问、确认——内容量更少——反而得低分，评分体系在惩罚正确行为。

真实沟通的核心是对话行为——是否让对方有回应空间、是否追问、是否有互动节奏、是否像真人交流——而不是文本内容的完整度。

01.3

四层问题拆解

建议策略

全文改写式建议，不可执行

AI 给的是"最终答案"——一整段改写后的话术，而不是"交流技巧"。用户无法快速学习、立即模仿。且完整示范话术引导学员继续"背稿"。

信息架构

所有问题平铺，无优先级

"未使用礼貌用语"和"连续输出 60 秒没有互动"视觉权重相同。缺少致命问题前置，用户无法 3 秒定位最大问题。

01.4

代码验证

当前代码确认了上述问题的存在：

学员发言和改进建议 (StudentStatement.vue) — 两段纯文本平铺，无 diff 标记或高亮
标准要点 vs 学员匹配 (KeyPointComponent.vue) — 并排展示，无差异高亮
逐句评分+点评 (SentenceList.vue) — 纯文本输出
对话标签页 (index.vue) — 长列表滚动，所有问题权重相同

核心转变：从"评分器"到"教练"

不是加功能补丁，是改 AI 的角色定位。当前的 AI 是"评分器"——先给分，再解释为什么这个分。改版后的 AI 是"教练"——先告诉学员最关键的问题和练习方向，评分细节在另一个页面按需查看。

当前：评分器

练习结束 → 跳转评分报告页 → 雷达图 + 全文点评 + 全文改写建议

信息流：评分驱动，先看数字，再被动阅读大量文本

→

改版：教练

练习结束 → 教练复盘页（report-chat）→ 等报告生成 → 评分报告页（report-complete）

信息流：教练驱动，3 秒知道练什么，详情在另一个页面

02.1

改动范围

本次改版只动两个地方，其余组件不动。

不动：综合评价（得分曲线）(ReportScore)、能力雷达图(RadarChart)、总分、KeyPoint 匹配、能力维度评分、学员发言原文——这些是客观评分数据，保留原样。

改

AI 点评 (AiComment)

当前：一大段文字总评。改版：一句核心结论 + 问题优先级排序（致命问题/需关注/可优化）。

改

改进建议 (StudentStatement)

当前：完整话术重写（"建议改良话术"整段）。改版：砍掉全文改写，改为交流策略 + 示范开头。

改动范围极小：只改 2 个组件的展示逻辑 + AI prompt 输出格式。不新增数据字段，不新增评分维度，不新增检测逻辑。综合评价和能力雷达完全不动。

02.2

AI 点评改版 (AiComment)

当前 AI 总评是一大段文字，用户不会读。改为一句核心结论 + 问题优先级排序。

当前

综合评价您的表现，整体话术较为完整，产品知识覆盖全面。但在互动节奏方面有待提升，建议增加停顿和确认环节，让客户有参与感。同时部分表达可以更加简洁，避免一次性输出过多信息……

→ 一大段文字，用户不会读

→

改版

核心结论

内容覆盖全面，但长篇独白是最大问题，需重点练习互动节奏。

问题优先级

致命问题长篇独白，缺少互动

需关注缺少确认环节

可优化部分用词可精炼

→ 一眼扫完核心结论 + 问题优先级

优先级定义

优先级	含义	展示方式	示例
致命问题	严重影响沟通效果的行为问题	独立卡片置顶	长篇独白、零互动
需关注	明显影响表达自然度的问题	默认展开	背稿感、缺少确认
可优化	措辞/用词层面的细节问题	默认折叠	用词不够专业

优先级由 AI prompt 判断。prompt 要求 AI 对每个问题标注严重程度（致命问题 / 需关注 / 可优化）。前端只消费 severity 字段渲染。新增问题类型只需调整 prompt，前端零改动。

02.3

改进建议改版 (StudentStatement)

当前 AI 给的是"最终答案"——一整段改写后的话术。改为交流策略 + 示范开头，不给完整话术。

当前：全文改写

"建议改良话术：您提到的情况确实比较常见，这种潮湿温暖的环境特别容易滋生真菌，所以瘙痒会比较剧烈。我给您推荐两款药搭配使用……"

→ 又是一整段，和原文几乎一样，人肉找不同

→

改版：交流策略

1 先确认症状

2 等对方回应

3 再推荐方案

示范开头："您这种情况夏天会更严重吗？"

→ 交流结构 + 第一步示范，不给完整话术

不给完整示范话术。给完整话术又回到"背稿"模式。只给交流结构 + 第一步示范，让学员自己练完后续步骤。

展示位置

改进建议从评分报告页(report-complete)移到教练复盘页(report-chat)。练习结束后学员在对话流里直接看到教练复盘（L1 核心指导 + L2 改进建议），可以追问。评分报告页不再展示全文改写。

练习结束 → 进入教练复盘页 (report-chat)

AI 教练复盘消息：核心问题 + 交流策略 + 示范开头。学员可以追问。

↓

等待评分报告生成

学员在 chat 里继续看教练复盘、追问。报告生成需要时间。

↓

点击跳转评分报告页 (report-complete)

只展示精简评分——核心结论 + 优先级 + 雷达图（不动）。不再展示全文改写。

02.4

MVP 改动清单

最小可行改动：改 AI prompt 输出格式 + 砍 2 个组件的冗余展示。零新增数据字段，零后端改动。

MVP 原则：不新增 API 字段，不新增检测逻辑，不新增评分维度。只做两件事：(1) 调整 AI prompt 输出格式（核心结论 + 优先级 + 策略建议）；(2) 评分报告页砍全文改写、砍长文本总评。综合评价和能力雷达完全不动。老数据自动降级展示。

改动项	页面	组件	具体内容
Prompt 调整	后端	AI 评分 prompt	新增"核心结论 + 问题优先级 + 交流策略"输出指令
教练复盘消息	教练复盘页 `(report-chat)`	对话流	练习结束自动推送 L1 核心指导 + L2 策略建议消息卡片
AI 总评精简	评分报告页 `(report-complete)`	AI 点评 `(AiComment)`	砍长文本，改为一句核心结论 + 问题优先级排序（致命问题 / 需关注 / 可优化）
全文改写建议	评分报告页 `(report-complete)`	改进建议 `(StudentStatement)`	砍掉全文改写。改为"在 chat 中查看改进建议"入口
问题优先级	教练复盘页 `(report-chat)`	复盘消息	按 severity 字段排序+分组。无 severity 时保持原序

数据兼容策略

场景	处理方式
新数据（prompt 已改）	教练复盘页展示教练复盘消息；评分报告页展示精简 AI 点评（核心结论 + 优先级）
老数据（prompt 未改）	教练复盘页无教练复盘消息，与当前体验一致；评分报告页展示原格式
混合数据（部分字段有值）	按字段是否存在逐层降级：有核心结论→显示，无→显示原 AI 总评；有 severity→排序，无→原序

02.5

迭代路线

MVP 优先验证教练角色是否有效。Phase 1 只改 prompt + 评分报告页砍 2 个组件 + 教练复盘页加消息，不新增检测逻辑和评分维度。先验证"教练复盘"比"评分器点评"是否真的更好用，再决定 Phase 2/3。

Phase 1 · MVP

教练复盘 + 减法

· 调整 AI prompt 输出格式
· 教练复盘页加教练复盘消息
· 评分报告页砍全文改写
· 评分报告页砍长文本总评
· 综合评价/雷达图不动

零新增字段 · 零后端改动

Phase 2 · 增量

行为检测 + 标注

· 学员发言局部标注
· 行为异常检测信号层
· 交流自然度维度
· 致命问题告警卡片

新增 API 字段 · 前端标注组件

Phase 3 · 完善

可配规则 + 场景适配

· 行为检测规则可配置
· 场景类型自动适配优先级
· 自然度维度融入雷达图
· 历史报告趋势对比

后端规则引擎 · 配置面板