Winnie Li
AI 状态感知语音助手移动端

灵犀 RTC: 易用性升级

2025.10 | 李姝源,鲍立赢,陈传林

灵犀移动端具备与文档深度结合的 AI 语音交互(RTC)能力,并在文档内设有高曝光的入口,但实际功能渗透率远低于预期。结合后台漏斗数据与用户访谈发现,大量用户进入功能后存在开口障碍。用户缺乏对 AI 能力的认知,导致 AI 核心价值无法传递。

设计团队于 2025 年 10 月主导了 RTC 功能的易用性升级。通过重构交互链路、引入场景化提示以及优化视觉破冰体验,系统性降低用户的认知负荷与开口门槛。新版上线后成功验证设计假设,核心转化指标实现明显增长,大幅提升了 AI 语音的业务渗透与用户活跃度。

01.问题洞察与指标定义

1

问题洞察

业务痛点: 高曝光下的高流失,入口明显,但大量用户点进来后不说话、直接退出。

用户洞察: 在 WAIC 展会进行线下功能试用时,发现用户点击“通话”入口后,普遍缺乏这是在跟 AI 通话的心智,不知需要等待接通,不知何时开口,不知怎么打断的连环困境。如何通过系统化的引导与多模态反馈,消除用户的开口恐惧,实现流畅的人机语音破冰是本次的设计命题。

接通盲区

接通等待状态不明确,进界面直接说话,缺乏等待接通的心智。

状态迷失

AI 的状态提示(听/思考/说)不在视觉焦点,用户无法感知 AI 进度,不了解何时该开口说话。

空白页恐惧

接通后面对麦克风,不知道 AI 能做什么,也不知道该问什么。(进入页面不说话的用户占比 78%)

2

指标确立

基于用户在语音通话中的行为路径,定义关键体验指标。

进入

未开口流失率

定位开口前的核心流失问题

开口

首轮激活率

衡量用户是否成功开始使用

持续对话

人均对话轮次

反映用户是否持续交互

再次使用

次日留存

验证是否转化为持续使用意愿

02.体验策略与设计落地

架构重塑:创作环境下的生产力工具

1

重构页面层级

早期界面模拟真实的通话场景,采用巨大语音泡泡占据屏幕 C 位,导致关键状态提示被挤到底部视觉盲区。

问题: 用户忽略系统状态;承载力触顶,无法为后续高阶能力腾出合理展示空间。

重塑策略: Y 轴折叠,舍弃低效大圆球,回归高效办公生产力本质,将界面重构内聚为三大功能模块:

  • 中间层 - 信息沉淀层:核心字幕展示区
  • 顶层 - 控制与感知层:状态感知展示与操作按钮
  • 底层 - 背景层:轻量模糊动态背景表状态

用户教育

1

沉浸式 Onboarding:核心价值前置透传

痛点: 用户缺乏「语音聊文档」心智预期,不知 AI 能干嘛。

策略: 首次接通时,用「语音 + 动效字幕」实现轻量化引导:

  • 建立通话心智:语言播报“像打电话一样和我聊文档吧...”,打破人机隔阂。
  • 场景曝光:精准透传文档总结、细节提问、模拟面试、翻译朗读、通话总结 5 大核心场景,用直观利益点激发开口欲望。
  • 防打扰机制:播报达 60% 即显露「跳过」按钮;结束后无缝过渡至通话主流程,做到引而不断。
2

能力显性化:从被动工具到主动服务

痛点: 改版前界面像传统文件管理器,面对繁杂的文档列表和孤立的录音键,用户不知能聊什么,发呆流失率极高。

策略: 打造沉浸式对话场,将核心价值前置,主动与用户破冰:

  • AI 主动开口:连接成功后 AI 主动开口,消除开场社交压力。
  • 核心能力可视化:创新引入动态功能卡片,将黑盒中的 AI 能力(用户高频场景)直接外露。
  • 强调掌控感:移除干扰列表,用波浪光晕与明确的系统状态提示占据 C 位,强化语音交互沉浸感。
3

连续问题引导

痛点: 用户不知道问啥,对话轮次不高。

策略: 每一轮对话结束后,会有继续提问引导:结尾的语音反问,还会有一个可点击的提问条,快速提问。根据对话内容,出现可以持续引导用户对话的可点击问题。

03.设计效果验证

上线后一周,核心指标均都显著提升,但是仍旧有一些用户首轮不说话。用户能够在连续对话引导下持续聊下去,引导问题点击率有 24%,有效提高了人均对话轮次。

零轮次流失率

78% 44%

人均对话轮次

1.59 4.51

次日留存

2.53% 7.55%
上一篇:WPS 灵犀 Web & PC Design