智能客服产品及原理分析
2020-04-21 11:33:26 2 举报
AI智能生成
目前市场客服产品分析,原理分析,技术边界说明
作者其他创作
大纲/内容
市场产品
智能客服机器人SDK平台
IBM wason
科大讯飞
阿里小蜜
微软小冰
网易七鱼
小i机器人(智臻智能)
Udesk
智齿科技
...
智能机器人客服
1.V5机器人
2.智齿客服
3.晓多机器智能机器人
4.百度夜莺
5.腾讯智能客服
6.阿里小蜜
2.智齿客服
3.晓多机器智能机器人
4.百度夜莺
5.腾讯智能客服
6.阿里小蜜
JIMI
京东
目前模式满意度排行
智能客服+人工
人工
纯机器
客服机器人原理
原理图解
关键技术
用户意图理解
知识库
相关产品
语音识别Automatic Speech Recognition
ASR
常用方法
隐马尔可夫模型
HMM
基于深度神经网络
端到端的方法
流程
语音输入
编码(特征向量)
解码(声学、语言处理)
文字输出
自然语言处理Natural Language Processing
NLP
主要技术
文本预处理
去噪音
词汇归一化
如“play”,“player”,“played”,“plays” 和 ”playing”是“play”的多种表示形式。虽然他们的含义不一样,但是上下文中是相似的,可以把这些各种形式的单词归一化。
文本特征工程核心步骤
词法分析
分词
实体识别
句法分析
分词
文本分类
主要目的是为了将文档(文章)的主题进行分类,比如说是属于经济类、体育类、文学类等等。
文本相似度处理
文本相似度通常也叫文本距离,指的是两个文本之间的距离。文本距离越小,相似度越高;距离越大,相似度越低。
如这件衣服多少钱,这衣服怎么卖,是根据这个相似度去判断,给出答案
应用场景:推荐、排序、智能客服以及自动阅卷等。解决之前只能靠关键词精准匹配问题,识别语义,扩大了应用的范围。
情感倾向分析
情感倾向分类
积极
中性
消极
观点抽取
抽取评价中的,服务好,这家店不错,都是观点
主要建立服务,内容评价体系
文本生成
...
目前难点
语言不规范
中华语言博大精深
错别字
新词
语音交互最核心的模块
智能对话平台
知识图谱数据库
图谱搜索更高效
知识图谱
知识图谱是一种基于图的数据结构,由节点(point)和边(Edge)组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”,知识图谱本质上是语义网络。
通俗定义:知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,因此知识图谱提供了从“关系”的角度去分析问题的能力。
关键技术
实体命名识别
关系抽取
实体统一
指代消解
比如说文本中的“他”其实指的就是“勒布朗詹姆斯”。所以指代消解要做的事情就是,找出这些代词,都指的是哪个实体。
存储
基于RDF
基于图数据库
金融行业的应用
反欺诈
不一致性验证
客户失联管理
知识推理
验证关系
语音合成(Text-To-Speech)
TTS
两种成熟的方法
拼接法
单位化语音
优点:语音合成的质量比较高。
缺点:数据量要求很大,数据库里必须有足够全的“音”。
缺点:数据量要求很大,数据库里必须有足够全的“音”。
参数法
根据统计模型来产生每时每刻的语音参数(包括基频、共振峰频率等),然后把这些参数转化为波形
优点:对数据的要求要小点。
缺点:质量比拼接法差一些。
缺点:质量比拼接法差一些。
其他方法
谷歌DeepMind提出的WaveNet方法
Deep Voice 3
VoiceLoop是Facebook提出的一种新的TTS神经网络,它能将文本转换为在室外采样的声音中的语音,且该网络架构比现有的网络架构简单。
技术边界
通用TTS
普遍通用,但期望不能过高
语音助手/滴滴/高德/智能音箱/机器人
个性化TTS
在用户预期不苛刻的场景,能“基本”满足商业化需求,但是效果没通用TTS那么好。但如果用户预期非常高的话,暂时是满足不了的。
科大讯飞
微量分贝(HEARD)这家致力于海量内容音频化
情感TTS
“情感意图识别”,“情感特征挖掘”、“情感数据”以及“情感声学技术”
当前瓶颈及机会
基础技术
端到端的技术变革
TTS前端,如:中文分词、注音、词性,都会提升tacotron性能;
后端,参数、拼接、wavenet都可以选用。
后端,参数、拼接、wavenet都可以选用。
端到端(End-to-End)的TTS建模方法,加上WaveNet 的声码器思想,是未来TTS的发展方向。
离线版本能否有在线版本的效果
目前做不到
数据缺乏
个性化TTS
数据量巨大
数据获取成本及周期长
人才缺乏
产品化难度
文案设计,非常重要。因为在语音交互场景,不能太长,用户没耐心和时间听完的。
可以加入背景音乐,掩盖杂音等细节瑕疵。
特殊场景,还有特别的需求,比如:远场场景和戴耳机场景相比,还是会有区别的。
中英文混合TTS,比如:用户想播首英语歌曲,困难在于:所有中文的发音当中,中文和英文合拍念出来是很难的,为什么呢?因为往往录音的人,录中文是一批人,录英文又是一批人。两种语言结合起来,再用机器学习学出来,声音就会变得非常怪。这方面,小雅音箱曾经花了很大的精力和成本去“死磕”解决。
可以加入背景音乐,掩盖杂音等细节瑕疵。
特殊场景,还有特别的需求,比如:远场场景和戴耳机场景相比,还是会有区别的。
中英文混合TTS,比如:用户想播首英语歌曲,困难在于:所有中文的发音当中,中文和英文合拍念出来是很难的,为什么呢?因为往往录音的人,录中文是一批人,录英文又是一批人。两种语言结合起来,再用机器学习学出来,声音就会变得非常怪。这方面,小雅音箱曾经花了很大的精力和成本去“死磕”解决。
商业化压力
个性化TTS、情感TTS会在各细分场景得到更大的应用,比如:知识付费、明星IP、智能硬件、车联网、实体/虚拟机器人等。
相关产品
讯飞配音app、讯飞朗读助手app、闪电配音等。
0 条评论
下一页