浅谈AIGC在客户服务中心的应用与实践
来源: 时间:2024-06-05
2023年是充满机遇和挑战的一年,AIGC的浪潮几乎席卷了每一个领域,客户服务作为人力密集且对话术需求较高的领域,首当其冲。时至今日,可以说关于AIGC的AICC应用和建设是每个用户体验中心的热点话题。理解并掌握大模型的商业化应用,已经不再是前沿的探索,而是关乎到企业生存发展和战略转型的命题,抓住技术变革的窗口,就有机会实现商业价值的重塑。
半年前,很多企业还在观望的时候,鲸灵就已入局。作为一家云智能企业,紧跟科技的脚步,在年底成功上线了私域业内的第一个客服GPT机器人;随后,座席辅助工具上线了AI会话摘要,而AI知识推荐的第一个版本也即将上线。回过头来看,之前对这个被“吹上天”的技术提出的担忧和顾虑,确实一步一个脚印地得到了验证,每一步都走得辛苦而又扎实。智慧客服项目兼具创新性和战略性的双重特点,是注定是曲折的。笔者作为业务部门PM,有幸历经十年的行业发展,在此给同行分享一些心得和经验。
一、心态先行,要相信前途是光明的。创新型项目必然缺乏成熟的方法论,经验丰富的人才稀缺,面对困难要灵活应变,在初衷不变的情况下,运用系统性的思维并以大局为重,改变原定的方案是常有的事,甚至可能做出的结果与预想不完全一致。战略型项目大多无法拿到短期、直接的收益,处在竞争压力大的环境下,PM要学会面对他人的质疑和自我怀疑,调整心态。在管理老板的期望之前,先做好自我管理。
二、坚守业务价值驱动。客户服务领域存在门槛低但天花板高的特点,也就是容易做得出来,但不容易做得好。以解决实际的业务场景为出发点,不秀技术,也不要担心问题小或者零散,根据服务全流程梳理每个环节的障碍和机会,逐步落地。以AI会话摘要的实践为例,原来在线客服需要从近180个三级类型中依靠人肉记忆、输入关键词检索出匹配的小结类型,再回顾会话内容发挥写作文能力打字记录聊天总结。根据我们的统计数据,这个环节平均耗时达到了35秒。现在,通过接入GPT能力理解会话上下文,我们可以自动匹配咨询小结并生成会话摘要推荐给客服,再经过人工判断校准。这种人机协同的方式将这个环节的平均用时缩短到了4.8秒,提效了14%。其中,GPT的时延为10秒,但预计通过调整技术方案可以将其缩短到3秒,届时将能进一步提效34%。
别小看这4.8秒的提升,要知道在线服务的响应速度本就是按秒计算的。经过客服人员的标注测试,GPT推荐的小结类型准确率约60%,摘要内容准确率高达98%,虽然还存在较大的优化空间,但这无疑是成功的第一步。一线的客服人员纷纷表示,“准确率比想象中的要高,体感上节省了很多时间”。而对于大家所熟知的AI情绪分析能力却没有提上优先级。客服作为情绪工作者,对客户的情绪天然具备高敏能力,他们更需要能够阻断问题发生和快速解决问题的流程、工具,而非单纯地提醒。笔者认为,服务工作者的情绪健康更值得企业管理层关注,将情绪分析用在对员工健康度的判断上。
三、项目投资成本巨大。这类项目的投入除了直观的人力资源占用、服务器等软硬件采买费用,还有隐形的试错成本以及难以度量的思考和沟通成本。
争取老板的支持,为项目开展创造有利条件,是PM的分内事。对于周期较长的项目,可以遵循MVP原则,快速推进项目并让老板看到阶段性成果,再分版本快速迭代。在GPT客服机器人的应用上,我们经历了质疑GPT、理解GPT到成为GPT的过程,从理解到成为付出了不少学费。企业试水AI大多要经历先与外部服务商合作再到自研的过程。最初,由于时间和成本的压力,我们选择了一家以非算法为核心业务的SAAS服务商,其AIGC智能客服产品向某平台的一些商家提供售前解答的能力。
接入前已得知GPT时延问题尚未解决,接入到自建平台后,很快暴露了各项问题,如当切流到1/3的售前咨询时就会偶尔宕机,并且难以对接业务系统,对于售中售后的场景无法拓展,且改造成本过高。客服门户作为企业面对用户的窗口和桥梁,服务产品的稳定性和易用性直接影响着品牌形象。为了达成提升用户体验和服务效率的业务目标,我们决定自研GPT机器人基建,以满足极速响应、高并发调用、贴合业务等需求。与此同时,运营人员加大了机器人服务日志的巡检力度,发现了更多问题,并持续探讨解决方案。在运营的监督下,一些有趣的案例以及AI的短板也得以暴露出来,比如:
客户:这个锅用开锅吗?
机器人:亲,这个锅可以用来煮开水哦~
客户:110斤多大码?
机器人:亲,110斤大约是多少公斤呢?
客户:商品页面写的是不支持七天无理由退货,是不是说不能退货啊?
机器人:亲,商品页面显示不支持七天无理由退货,确实不支持退货哦~
这几个是非常典型的案例,也是很常见的咨询场景。对于部分中文专有名词,国外的GPT明显出现理解障碍,比如“开锅”被理解成“煮开水”“斤”和“公斤”没有换算、“7天无理由”政策的解读歧义等。这些问题,都需要运营和技术人员协同解决,如增加提示词、QA,甚至需要更换GPT模型,高质量的中文语料至关重要。现阶段的AI仍然存在信息获取成本高、内容可靠程度低等难题,还容易“胡编乱造”,这在对容错性有着严格要求的服务场景中是不能被接受的。笔者所在的企业也是私域电商平台,微信生态环境下存在信息传播快的特点。核心用户是私域流量主,对出现其他平台、渠道名称极为敏感,所谓“好事不出门,坏事传千里”,任何一次错误都会产生十倍的负面影响。如何防控风险及内容合规是在真实落地时面对的首个考题。
四、AI依然需要人工干预。建设辅助人工的工具例如AI助手更靠谱一些。除了上文提到的AI会话摘要,AI知识推荐是一个值得考虑的选项。通过设计提示词为助手设定特定角色,强大的语义理解能力代替人脑快速检索,“甜妹”的口吻配合“高情商”润色,让服务更加个性化和灵动,不再千篇一律和死板。然而,随着测试工作的开展,激情和惊喜逐渐褪去,我们清晰地认识到,对于结构化程度较低、内容格式丰富的客服知识文档,文档的切分和解析、向量计算和检索,明显需要更深入地研究及投入。
五、在AI的建设上,勇气和实力两者都不可或缺。大模型时代,具备强大的学习能力才能掌握新技术和新概念。除了技术的迭代,业务运营人员也需要持续学习,积累专业知识。面对新技术,不仅要拥抱变化勇于尝试,在嵌入到核心业务流程时更要谨慎和理智。
一个项目的成功需要同时具备三个要素:充分的动机、强有力的行动、恰到好处的契机。PM要时刻关注内外部环境,保持敏锐洞察才能掌握先机,积极应对各种突发的矛盾,敢于决策。当然,认识自我是大前提,清楚当前企业自身所处的阶段和能力水平,不设定过高的目标、不做过于冒险的探索,在合理的范围内与客户达成价值共识。
半年前,很多企业还在观望的时候,鲸灵就已入局。作为一家云智能企业,紧跟科技的脚步,在年底成功上线了私域业内的第一个客服GPT机器人;随后,座席辅助工具上线了AI会话摘要,而AI知识推荐的第一个版本也即将上线。回过头来看,之前对这个被“吹上天”的技术提出的担忧和顾虑,确实一步一个脚印地得到了验证,每一步都走得辛苦而又扎实。智慧客服项目兼具创新性和战略性的双重特点,是注定是曲折的。笔者作为业务部门PM,有幸历经十年的行业发展,在此给同行分享一些心得和经验。
一、心态先行,要相信前途是光明的。创新型项目必然缺乏成熟的方法论,经验丰富的人才稀缺,面对困难要灵活应变,在初衷不变的情况下,运用系统性的思维并以大局为重,改变原定的方案是常有的事,甚至可能做出的结果与预想不完全一致。战略型项目大多无法拿到短期、直接的收益,处在竞争压力大的环境下,PM要学会面对他人的质疑和自我怀疑,调整心态。在管理老板的期望之前,先做好自我管理。
二、坚守业务价值驱动。客户服务领域存在门槛低但天花板高的特点,也就是容易做得出来,但不容易做得好。以解决实际的业务场景为出发点,不秀技术,也不要担心问题小或者零散,根据服务全流程梳理每个环节的障碍和机会,逐步落地。以AI会话摘要的实践为例,原来在线客服需要从近180个三级类型中依靠人肉记忆、输入关键词检索出匹配的小结类型,再回顾会话内容发挥写作文能力打字记录聊天总结。根据我们的统计数据,这个环节平均耗时达到了35秒。现在,通过接入GPT能力理解会话上下文,我们可以自动匹配咨询小结并生成会话摘要推荐给客服,再经过人工判断校准。这种人机协同的方式将这个环节的平均用时缩短到了4.8秒,提效了14%。其中,GPT的时延为10秒,但预计通过调整技术方案可以将其缩短到3秒,届时将能进一步提效34%。
别小看这4.8秒的提升,要知道在线服务的响应速度本就是按秒计算的。经过客服人员的标注测试,GPT推荐的小结类型准确率约60%,摘要内容准确率高达98%,虽然还存在较大的优化空间,但这无疑是成功的第一步。一线的客服人员纷纷表示,“准确率比想象中的要高,体感上节省了很多时间”。而对于大家所熟知的AI情绪分析能力却没有提上优先级。客服作为情绪工作者,对客户的情绪天然具备高敏能力,他们更需要能够阻断问题发生和快速解决问题的流程、工具,而非单纯地提醒。笔者认为,服务工作者的情绪健康更值得企业管理层关注,将情绪分析用在对员工健康度的判断上。
三、项目投资成本巨大。这类项目的投入除了直观的人力资源占用、服务器等软硬件采买费用,还有隐形的试错成本以及难以度量的思考和沟通成本。
争取老板的支持,为项目开展创造有利条件,是PM的分内事。对于周期较长的项目,可以遵循MVP原则,快速推进项目并让老板看到阶段性成果,再分版本快速迭代。在GPT客服机器人的应用上,我们经历了质疑GPT、理解GPT到成为GPT的过程,从理解到成为付出了不少学费。企业试水AI大多要经历先与外部服务商合作再到自研的过程。最初,由于时间和成本的压力,我们选择了一家以非算法为核心业务的SAAS服务商,其AIGC智能客服产品向某平台的一些商家提供售前解答的能力。
接入前已得知GPT时延问题尚未解决,接入到自建平台后,很快暴露了各项问题,如当切流到1/3的售前咨询时就会偶尔宕机,并且难以对接业务系统,对于售中售后的场景无法拓展,且改造成本过高。客服门户作为企业面对用户的窗口和桥梁,服务产品的稳定性和易用性直接影响着品牌形象。为了达成提升用户体验和服务效率的业务目标,我们决定自研GPT机器人基建,以满足极速响应、高并发调用、贴合业务等需求。与此同时,运营人员加大了机器人服务日志的巡检力度,发现了更多问题,并持续探讨解决方案。在运营的监督下,一些有趣的案例以及AI的短板也得以暴露出来,比如:
客户:这个锅用开锅吗?
机器人:亲,这个锅可以用来煮开水哦~
客户:110斤多大码?
机器人:亲,110斤大约是多少公斤呢?
客户:商品页面写的是不支持七天无理由退货,是不是说不能退货啊?
机器人:亲,商品页面显示不支持七天无理由退货,确实不支持退货哦~
这几个是非常典型的案例,也是很常见的咨询场景。对于部分中文专有名词,国外的GPT明显出现理解障碍,比如“开锅”被理解成“煮开水”“斤”和“公斤”没有换算、“7天无理由”政策的解读歧义等。这些问题,都需要运营和技术人员协同解决,如增加提示词、QA,甚至需要更换GPT模型,高质量的中文语料至关重要。现阶段的AI仍然存在信息获取成本高、内容可靠程度低等难题,还容易“胡编乱造”,这在对容错性有着严格要求的服务场景中是不能被接受的。笔者所在的企业也是私域电商平台,微信生态环境下存在信息传播快的特点。核心用户是私域流量主,对出现其他平台、渠道名称极为敏感,所谓“好事不出门,坏事传千里”,任何一次错误都会产生十倍的负面影响。如何防控风险及内容合规是在真实落地时面对的首个考题。
四、AI依然需要人工干预。建设辅助人工的工具例如AI助手更靠谱一些。除了上文提到的AI会话摘要,AI知识推荐是一个值得考虑的选项。通过设计提示词为助手设定特定角色,强大的语义理解能力代替人脑快速检索,“甜妹”的口吻配合“高情商”润色,让服务更加个性化和灵动,不再千篇一律和死板。然而,随着测试工作的开展,激情和惊喜逐渐褪去,我们清晰地认识到,对于结构化程度较低、内容格式丰富的客服知识文档,文档的切分和解析、向量计算和检索,明显需要更深入地研究及投入。
五、在AI的建设上,勇气和实力两者都不可或缺。大模型时代,具备强大的学习能力才能掌握新技术和新概念。除了技术的迭代,业务运营人员也需要持续学习,积累专业知识。面对新技术,不仅要拥抱变化勇于尝试,在嵌入到核心业务流程时更要谨慎和理智。
一个项目的成功需要同时具备三个要素:充分的动机、强有力的行动、恰到好处的契机。PM要时刻关注内外部环境,保持敏锐洞察才能掌握先机,积极应对各种突发的矛盾,敢于决策。当然,认识自我是大前提,清楚当前企业自身所处的阶段和能力水平,不设定过高的目标、不做过于冒险的探索,在合理的范围内与客户达成价值共识。