生成式Al的应用路线图 | 图4
2024-08-13 12:07:36 0 举报
生成式AI的应用路线图 | 图2展示了生成式AI在不同领域的应用前景和潜在价值。这份路线图强调了生成式AI在各个行业的广泛应用,如图像生成、文本创作、语音识别等。其中,特别提到了GANs在图像生成中的应用,它能够合成高度逼真的图像,为内容创作和游戏设计带来了革命性的改变。此外,路线图还强调了NLG在文本创作中的重要性,如自动生成新闻报道、小说和评论,为内容创作者提供了高效的工具。在语音识别方面,TTS的应用使人机交流变得更加自然和高效。这份路线图还预测了生成式AI在未来的发展,包括其在人工智能、机器学习和深度学习等领域的应用潜力。
作者其他创作
大纲/内容
Al识图/Al玩游戏
智能多模态计算平台
D-ID
视频的风格化
生成初步的视频/动画故事线
新教育平台
初步的3D对象和场景生成
新营销平台
3D贴图/材质生成
2023.06.12 中文版 | SeedV 实验室 seedV.cn | 许可协议 CC BY 4.0
GET3D
多模态生成式Al
ColossalAl
口型/表情/姿态/动画序列匹配
初步的思维链可控
初步的多模态人机交互
对生成内容的可控性
初步的3D风格化
多模态数据库
工业级3D对象和场景生成适用游戏/传媒/影视等专业工作流
Mootion (SeedV)
图像/视频/交互/游戏/环境的语义理解
参数化的3D对象/场景创建
Mootion(Seedv)
Adobe Firefly
工业级字体/标识/图文/游戏美术等
智能多模态数据库
数字/虚拟世界的规则设计
【注】Mootion是SeedV实验室正在研发的以生成式AI为核心的普惠内容创建工具生成式Al
【注】本系列应用路线图是SeedV实验室产品战略团队在调研、分析基础上创建的
当前状态
多模态动态内容生成
复杂场景的布局设计
虚拟人
消费级字体/标识/图文(营销/自媒体/社交/教育等)
多模态内容平台/商业平台
DreamStudio
Runway GEN 2
新内容平台
多模态搜索引擎
Runway
多模态训练数据集
图片/文字的风格化
不可控
New Bing
TANGO
简单场景的布局设计
文字或图片的Al创作社区
未来数字世界
核心能力:跨模态的迁移、融合、生成
下一代大众社交平台
规则或原理可控
多模态学习和推理加速
多模态静态内容生成
多模态基础架构
Objaverse
DreamFusion
Kapwing
Skybox Al
生成关键帧可控的视频片段
Runway GEN 1
视频素材检索/推荐
ChatGPT/GPT-4
Midjourney
Al自主讲解与展示商品/知识/设计方案等
作者:豆豆周末@ProcessOn 更多模板素材请关注豆豆周末个人主页(只提供优质素材)点击右下方 图标链接 进入豆豆周末@ProcessOn 个人主页 ➡️
生成式Al的应用路线图 | 图4 多模态AI的应用能力演进
跨模态感知/交互/控制
未来发展
基于图像/视频的3D重建
Spline Al
Character.Al
高质量3D对象和场景生成适用营销/自媒体/电商/教育等消费级工作流
Mobvoi Moyin
Shap-E
Luma
为现有内容平台(如抖音/YouTube/Roblox等)提供内容创作工具
复杂逻辑推理可控
情节可控的短视频生成/剪辑
MongoDB
情节可控的故事线/剧本生成
辅助视频剪辑
Recraft
情节可控的长视频生成/剪辑
专业水平的音乐创作
结构或局部逻辑可控
智能多模态人机交互
辅助场景布局
基于文本或语音的交互助手
概略方向可控
视频的自动配音/字幕/翻译
游戏关卡/脚本/规则设计
专业水准的Al艺术
0 条评论
下一页