生成式Al的应用路线图 | 图5
2024-08-13 12:08:17 0 举报
生成式AI的应用路线图 | 图2展示了生成式AI在不同领域的应用前景和潜在价值。这份路线图强调了生成式AI在各个行业的广泛应用,如图像生成、文本创作、语音识别等。其中,特别提到了GANs在图像生成中的应用,它能够合成高度逼真的图像,为内容创作和游戏设计带来了革命性的改变。此外,路线图还强调了NLG在文本创作中的重要性,如自动生成新闻报道、小说和评论,为内容创作者提供了高效的工具。在语音识别方面,TTS的应用使人机交流变得更加自然和高效。这份路线图还预测了生成式AI在未来的发展,包括其在人工智能、机器学习和深度学习等领域的应用潜力。
作者其他创作
大纲/内容
内容生成任务
深度定制化应用
通用大语言模型
基础模型示例
自有数据微调
B端私有部署或私域数据类服务
功能单元
传统模式
自有模型对齐
指基于文本、图像、语音、视频、3D、动画序列等模态中的两种或多种,完成生成、语义理解、逻辑推理等任务的Al模型
CoT简单推理任务
Al as OS
跨模态对齐
典型应用场景
Al as Copilot
text-embedding
跨模态知识迁移
跨文本、图像、视频等多模态语义的搜索或推理任务
自有数据的模型微调或模型对齐
典型应用场景和相关技术
向量数据库Vector DB
因为存在以下理论和应用难点,多模态Al模型的科研与应用远未成熟,还存在巨大发展空间
可控图片和视频生成
Copilot模式
text-to-command文本到指令类任务
虚拟角色
平台+插件模式
LangChain或类似的应用开发范式
text-to-code文本到代码类任务
应用
跨模态可控生成
动画序列、故事线的编码、可控生成、自动编辑
Al as OS模式
LLaMA等层出不穷的开源大模型参见:github/Hannibal046/Awesome-LLM
上下文记忆
Al会话平台
作者:豆豆周末@ProcessOn 更多模板素材请关注豆豆周末个人主页(只提供优质素材)点击右下方 图标链接 进入豆豆周末@ProcessOn 个人主页 ➡️
基于CLIP等范式的多模态混合表示、对齐、编码、知识迁移
生成式Al的应用路线图 | 图5 大模型技术与应用思考导图
部分通用大模型如GPT-4兼具一定的多模态能力
多模态信息的表示
HuggingGPT代表的开源模型链
文本、语音、视频到口型、表情、骨骼关键点、动画序列等的多模态同步
端到端的text-to-image或text-to-video
基于Diffusion的生成类模型
量化和可解释性
端到端的3D场景或对象渲染
2023.06.12 中文版 | SeedV 实验室 seedV.cn | 许可协议 CC BY 4.0
自动驾驶和机器人领域的跨模态感知与决策
ChatGPT Plugin串联的应用或服务链
用Vector Store扩展大模型的领域知识和上下文记忆
跨模态推理
平台类应用
作为插件的应用功能或服务
ControlNet为代表的Human-in-the-Loop式的条件控制生成
多模态理论和应用挑战
基于NeRF的信息场重建式3D生成模型
应用模式的演进
“提示工程”为核心的应用开发
工具链、思维链为核心的应用开发
C端应用
text-completion
多模态Al模型
应用开发范式
AutoGPT模式的推理型工具思维链
领域知识
智能功能
3D场景和对象的生成或重建
0 条评论
下一页