《AI时代的设计师生存手册》图解
2022-11-25 14:41:36 15 举报
AI智能生成
AI时代的设计师生存手册
作者其他创作
大纲/内容
1956年8月达特茅斯会议
利用机器来模仿人类学习以及其他方面的智能
AI诞生
人工神经网络在,1951年马文·明斯基制造出第一台神经网络机
贝尔曼方程(也称动态规划方程,被认为是强化学习的雏形)
感知器模型(深度学习的雏形)
搜索式推理、自然语言处理、微世界等人工智能概念
人工智能拥有模仿智能的特征,懂得使用语言,懂得形成抽象概念并解决人类现存问题
亚瑟·塞缪尔(Arthur Samuel)在20世纪50年代中期国际象棋程序,程序的棋力已经可以挑战具有相当水平的业余爱好者
查理·罗森,首款具备移动能力的机器人Shakey,感知周围环境并创建路线规划;根据事实来推断隐藏含义;通过普通英语进行沟通
第一次发展高潮理论爆发期 1955—1974年
计算机运算能力遭遇瓶颈,无法解决指数型爆炸的复杂计算问题
常识和推理需要大量认识信息,计算机无法“看懂”和“听懂
人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理,但是无意识的技能和直觉却需要极大的运算能力
计算机无法解决莫拉维克悖论
无法解决部分涉及自动规划的逻辑问题
神经网络研究学者遭遇冷落
第一次寒冬1974—1980年
专家系统的诞生
智能可能需要建立在对分门别类的大量知识的多种处理方法之上
辛顿等研究人员提出反向传播算法实现了神经网络训练的突破
促进了未来自然语言、机器视觉的发展
机器需要有感知、移动、生存,与这个世界交互的能力
第二次发展高潮复兴期1980—1987年
大型计算机受到台式机和个人计算机理念的冲击影响
商业机构对人工智能的追捧逐渐冷落,泡沫破裂
计算机性能瓶颈仍然无法突破
缺乏海量数据训练机器
第二次寒冬1987—1993年
Schapire提出Boosting算法
支持向量机在以前许多神经网络模型不能解决的任务中取得了良好的效果
瓦普尼克和科尔特斯提出支持向量(SVM )
它是由一个随机子集的实例组成,并且每个节点都是从一系列随机子集中选择。
布雷曼博士提出了随机森林(RF)
第三次发展高潮现代机器学习的成型时期1993年至21世纪初
利用人工神经网络帮助进行可视化或分类
“逐层初始化”来有效克服训练难度
Hinton提出了神经网络Deep Learning算法
人工智能概念60周年,深度学习的联合综述
第四次发展高潮神经网络&AI应用的爆发21世纪初至今
1.人工智能发展历程
明斯基
Artificial Intelligence
智能机器来取代人类的认知功能和能力
AI阵营
恩格尔巴特
Intelligence Augmentation
将智能机器用来扩展人类的认知功能和能力
IA阵营
人工智能AI与智能增强IA
1960年,利克莱德提出了“人机共生”(Man-Machine Symbiosis)概念,被视为人机界面学的启蒙观点
人机交互阵营实现的各种技术例如视窗、鼠标、互联网,再到语音交互,基本停留在恩格尔巴特这个理论框架中。
1962年,恩格尔巴特《提升人类智能:一个概念性的框架》
1963年,伊凡·苏泽兰项目“画板”(Sketchpad)帮助图形、交互式计算向前大步迈进
1964年,恩格尔巴特发明的鼠标
1965年,伊凡·苏泽兰提出了虚拟现实
1968年,恩格尔巴特开发了世界上第一个标准化的编辑器NIB
1969年,第一次人机系统国际大会,《国际人机研究》创刊
1970年,人机交互研究中心:HUSAT,施乐Palo Alto研究中心
1973年,施乐Alto计算机,人机交互正式进入GUI时代
80年代,苹果、IBM、微软等大公司相继推出自己的图形界面系统
初代互联网GUI发展1960~1980年代
1973年,AT&T蜂窝网络,通过无线通道将终端和网络设备连起来
1983年,NASA开发了火星探测的虚拟环境视觉显示器VIVEDVR
1993年,苹果Newton带来触控屏、红外线、手写输入等交互功能
1997年,飞利浦公司推出数字化智能手机
2002年,手机和WAP技术逐渐成熟
2004年,Web 2.0成为主流,“应用软件构建在互联网”
2007年,苹果发布了iPhone和iOS
2008年,Google发布了开源移动操作平台Android
3G、4G、5G的发展
移动互联网GUI进化
1990年,VPL Research,面向民用市场推出了一系列VR设备
1992年,李开复演示了Casper的语音助理
1997年,室外移动增强现实系统Touring Machin
1999年,世界第一款AR开源工具ARToolKit问世
2000年,交互式语音应答(Interactive Voice Response,IVR)诞生
2006年,任天堂推出了Wii,通过运动传感器识别玩家手臂动作
拥有即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能
2009年,微软Xbox 360推出体感周边外设Kinect
2011年,苹果发布了语音助手Siri,随后几年语音交互时代来临
2012年,Google革命性产品Google Glass开始测试
Leap发布了体感控制器Leap Motion
手势控制臂环MYO腕带
2013年
2014年至今,VR热潮,柔性屏,AR Pokémon GO
多模态发展
2.人机交互发展历程
不确定因素时的推理、决策能力
知识表达能力
规划能力
学习能力
自然交流沟通能力
整合,实现目标的能力
强人工智能
专注于且只能解决特定领域问题的人工智能
弱人工智能
现阶段,机器学习,该算法可以使程序拥有自我学习和演变的能力
人工智能定义
互联网、移动设备和传感器的普及,产生及存储数据量急速剧增
数据
CPU/GPU→FPGA/ASIC/TPU
运算力的提升也起到了明显效果
算力
深度学习等算法的进化
算法
人工智能爆发原因
深度学习、知识图谱、迁移学习、自然语言处理
记忆思考能力
机器视觉、语音识别
输入感知能力
语音合成、通过信息载体传达信息
输出能力
基础能力
标注数据从而提高模型的准确性,通过挖掘标注数据之间的关系最后给出结果
信息检索、个性化推荐、预测、垃圾邮件侦测等
目前的深度学习应用几乎都属于监督学习
监督学习
从数据中自动提取出数据模式和结构,不断优化自身模型给出结果
应用场景多为数据挖掘、异常检测、用户聚类、新闻聚类等
非监督学习
少量的标注就能完成识别工作
半监督学习
动态的学习过程,没有明确的学习目标,结果没有精确衡量标准
输入是历史的状态、动作和对应奖励,要求输出的是当前状态下的最佳动作
强化学习
机器学习
3.人工智能现状
包括神经计算、模糊计算和进化计算,AlphaGo是计算智能的代表
计算智能
机器人、自动驾驶车
包括视觉、听觉、触觉等方向的传感器
感知智能
有主动思考和目的性推理的能力,并与人自然交互
认知智能
4.主要发展方向
一、人工智能发展
深度学习降低设计门槛
减少绘图/排版工作量
AI自动生成高质量逼真场景/人物、图片转换为代码
计算机视觉技术可将平面二维转立体三维
让AI接手繁杂专业的图文排版设计工作
通过神经网络设计图自动转换为代码
机器学习改变赛车底盘设计
大数据驱动情感化设计、时尚潮流、建筑设计
1.设计影响
安全性
效率,如实时性、减少流程
场景化给出解决方案
个性化
2.体验影响
二、AI对设计的影响
练习就能掌握的设计技法、可被程序化
重复性工作
有数据支撑、课模块化的设计
1.威胁领域
在短时间内完成复杂运算
长时间不厌其烦的做同一件事
记忆力好,积累的经验可以被随时调用
更公正客观的对待每件事
优势
欠缺点
2.AI优劣势
跨领域推理、抽象能力、思考能力、常识、审美、自我意识与情感
3.设计师擅长的能力
将经验转换为更多价值
掌握更多设计技能
结合AI进行思考和设计
深耕艺术设计
个性化设计
4.AI时代下设计师的机遇
三、AI对设计师的影响
生物凭借感知器官和经验接收信息的通道,例如人类有视觉、听觉、触觉、嗅觉和味觉5种模态
视觉、听觉、触觉、嗅觉和味觉获取外界信息的比例依次为83%、11%、3.5%、1.5%和1%。
模态”(Modality)
多模态交互指通过声音、肢体语言、信息载体、环境等多通道与计算机进行交流,模拟人与人的交互方式
GUI(Graphical User Interface,图形用户界面)
情感、肢体动作、手势
视觉
VUI(VoiceUser Interface,语音用户界面)
情绪、声纹
听觉
体感
触觉
嗅觉
文字/图片/音频/视频
信息载体
主要方式
1.多模态交互
分支主题
导航形式变化
功能/页面增加新的标识即可被语音助手搜索,本质是Deep Link
被语音助手调起的页面可以考虑将返回按钮直接改为回首页
被语音助手调起的页面有办法直接回到上一个应用/页面
语音助手
信息架构
人工智能促进信息扁平化,任何功能都可能是首页
模块化设计,原子设计
产品功能应该是可以瞬间被理解的,唤醒词应该是方便记忆和开口的
减少让用户费神思考和记忆的聚合页面,这样可以避免被语音助手或系统FEED唤醒时,展示的全是功能入口
考虑模块化设计,尽可能采用不同入口和页面管理设计对象
常用功能允许被系统FEED集成,方便用户第一时间使用
避免常用功能与其他功能的耦合,降低系统FEED的结构复杂性和操作成本
操作性的功能例如设置闹钟,要考虑页面的信息展示和操作流程,也需要考虑语音输入的操作流程
注意点
信息流设计
身份信息、健康数据、兴趣爱好、工作信息、财产数据、信用度、消费信息、社交圈子、活动范围9大类。
用户特征数据
下一代人工助理
AR组件
语音识别和对话组件
身份验证模块
新的组件
柔性屏
手机的新形态
2.移动产品交互
考虑多模态交互
社交距离以及公共距离(大于120厘米)应保持沉默状态
远位亲密距离以及个人距离(16~120厘米)应处于已激活状态,随时可以与用户进行交互
近位亲密距离(0~15厘米)时的信息交换应该是毫无保留的
根据空间定位做出响应
考虑情景理解
共通点
遵循的现实规则,扎根于现实
建立规则
光线、声音、触觉反馈、运动设计
用正确的元素构建适合的世界
360全景视频,以人为中心或者以物为中心
环顾方式
字体的大小、对比度、间距等
深度
阅读距离
屏幕中间放置一个固定焦点来做视觉辅助
凝视交互
虚拟界面XR
3.三维空间交互设计
场景化设计
安静的提供服务
待机耗电、待机时可关闭器件、待机时的噪音、电源重启时设备是否重启等问题也需要考虑
4.智能硬件
理解为一个应用,如“我要听新闻”
技能skill
某个应用的功能或者流程,主要满足用户的请求或目的
由词槽(参数)和槽位(参数数量)决定的
意图intent
某个领域内词汇的集合,是用户与技能交互过程中的一个重要概念
词典dictionary
词槽可以理解为一句话中所包含的参数是什么
槽位是指这句话里有多少个参数
词槽slot
同一个意图有不同表达方式
泛化generalize
用来进行模糊搜索和匹配
通配符wildcard character
语音直接转换成文字
自动语音识别技术ASR
术语
NLU(自然语言理解)为核心的语音平台能力如何
完全匹配还是模糊匹配?
支持语言程度如何?
是否需要手动采集词典?
是否支持客户端和服务端自定义参数的传输?
是否支持意图的自定义排序?
是否支持表达方式的自定义排序?
是否支持声纹识别?
语音智能平台能力
1.明确服务对象的特征,再定义语音产品的形象、动作;
2.明确产品的目的;
多种形式告知用户系统暂时无法理解用户的意思
将听不懂的语句传给第三方搜索功能
将听不懂的语句传给第三方闲聊机器人
3.建立兜底方案,如告知无法理解、查询信息、闲聊,且应互斥;
4.提供垂直领域相关词典,考虑同义词、多音字等,并动态更新
5.根据全局意图设计使用场景,理解意图
保持互动简短,避免重复的短语。
写出人们是如何交谈的,而不是如何阅读和写作的。
当用户需要提供信息,则给出相应的指示。
不要假设用户知道该做什么。
向用户提问时,一次只问一个问题。
让用户做选择时,一次提供不超过三个选择。
学会使用话轮转换(Turn-taking)。
6.撰写脚本;
7.将脚本转化为决策树。
设计步骤
词槽、槽位设计
泛化能力
全局意图设计
主要内容
设计“执行词典”和“设备词典”
设计“执行设备”的词槽为“执行”+“设备”
增加泛化能力,即“语气词典”
增加意图槽位,“执行”、“设备”为必选槽位,“语气”为可选槽位,可以通过多轮对话的方式补全必选槽位;
谨慎考虑是否增加通配符机制,因为它会影响必选槽位和逻辑
确认表达方式的排序,把更模糊,槽位更少的表达方式放靠后的位置
案例·开关设备
意图设计
听懂用户的话
5.语音交互
人与不同对象交流信息方式
环境理解
安静
安全后门
准确即时
自我学习与修正
礼貌
人格设定
人工智能设计八原则
共享数据供系统,产品之间的数据互补,隐私数据保护
记忆
如何将数据转化为有用的信息加以利用
思考
简化流程/行动
预设下一步操作
根据当前环境和记忆,设计流程
设置分支需求/流程;
结合语音设计
行动
人工智能的理解
互联网早期依靠GUI积累大量资源;统一一套内容,有利于AI助手发展
必要性
导航等视觉转化为触觉和主题引导
可感知性
创建不同方式呈现的内容,布局简单
适应性
可导航性
准则
GUI→VUI
6.设计一款人工智能产品
智慧城市
新零售
家的设计
7.未来的设计
外框
四、AI时代的交互设计
AI时代的设计师生存手册
0 条评论
回复 删除
下一页