语音交互操作系统现状
2019-12-16 10:28:47 0 举报
AI智能生成
各个系统的特点优势缺陷进行了分析和描述
作者其他创作
大纲/内容
语音Skill
语音OS的应用
高频应用
睡前
助眠
故事
音乐
睡后
提醒
闹钟
天气
日程
笑话
新闻
厨房相关
菜谱
鸡尾酒制作
智能家居
灯泡
恒温器
语音交互低原因
GUI 交互的形式就如同一个树状结构,用户在一个垂直任务中点选下一级菜单,直至任务完成并跳出;
而 VUI 交互就相当于一个网状结构(语义网),用户在进行语音交互的同时,思维是跳跃的,因此会出现随进随出的交叉交互现象。
没有显示界面的情况下,用户缺乏了解这些 Skills 的介质
提高交互的办法
引入主动交互的机制,引导用户使用一些内容、娱乐属性的 Skill 是其中一种可行办法
多轮对话内容能够成为建立机器人图谱的良好基础
语音智能OS
概念
操作系统 OS
是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在「裸机」上的最基本的系统软件,如 Android, iOS, Linux, Windows 等常见的操作系统。操作系统是用户和计算机的接口,同时也是计算机硬件和其他软件的接口,其组成部分包括内核、驱动程序、接口库、外围。
语音操作系统 语音OS
是运行语音助手、应用服务(语音技能)等软件的基本技术框架,所有应用将在此基础上衍生并在之中运行,这些应用及其操作结果最终得以在人机语音交互的过程中呈现出来。
国内语音OS
百度 DureOS
应用于手机、电视、音箱、汽车、机器人等硬件设备
结构
小度智能设备开放平台
小度技能开放平台
核心对话系统
数据
亿级用户请求
十亿级知识图谱实例,语音调用和音频数据
千亿的网页和图片数据
技术
麦克风阵列
深度学习
自然语言处理技术
多轮对话技术
搜索技术
回声消除
语音唤醒
人像识别
内容
阿里 ALiGenie系统
结构
技术
声纹识别
省纹购
NLP中文对话引擎
音乐音频、家居控制、购物充值、儿童教育、技能市场等功能
将开放深度学习、自然语言处理、搜索/推荐算法、知识表示及推理问答系统等重要核心能力
腾讯小微
结构
硬件开放平台
麦克风阵列算法
唤醒系统
声纹分析
图像识别
Skill 开放平台
QQ音乐
企鹅FM
腾讯视频
天气、新闻、笑话
服务机器平台
物联
QQ物联
艾拉物联
机智云
科大讯飞
结构
开放平台
思必驰 DUI
以对话为核心、高可定制、一站式开发
可视化的编辑界面
全流程的定制化(包括唤醒词、语音模型、合成音的定制)
硬件接入、物联网领域
大数据平台
云知声
主要提供智能家居、智能车载、智慧医疗、智能教育等语音技术解决方案
i技术
语音识别
语音理解
语音合成
音频拼写
垂直场景
车载
电视
搜索
音乐
视频
购物
语音
音频转写
出门问问
产品
智能手表
问问魔镜 Ticmirror 车载后视镜
问问魔眼 Ticeye(ADAS)
虚拟个人助理
智能音响 Tichome
Rokid
智能家庭机器人
语音交互
机器人情感
图灵 TuringOS
语义技术为核心
结构
机器人开放平台
机器人OS
运动控制
视觉能力
人脸识别
物体识别
语音
识别
唤醒
消噪
OS Kids
场景方案
AIUI 开放平台
技能
语音识别,合成
语义识别
麦克风阵列
语音唤醒
方言识别
着重人机交互能力
0 条评论
下一页