登录免费注册

首页  思维导图  详情

千帆大模型平台

2024-03-17 14:51:34   1  举报





AI智能生成

大模型平台

大数据；框架

作者其他创作

大纲/内容

数据服务

数据集

文本对话

标注

有标注：固定格式有问有答的数据

无标注：固定格式有问无答的数据

排序

有排序：固定格式，一个问题多个答案，答案有优先级

无排序：固定格式，一个问题，一个答案

范文本无标注

文本数据，无固定格式要求

query问题集

固定格式，只有问题无回答

数据标注

在线标注

针对问题标注标注答案，可以使用AI大模型自动生成答案

众测标注

百度众测团队进行标记

数据处理

对文本对话无标注数据集、query问题集数据集进行数据处理

数据回流

服务返回的结果保存回数据集

知识库

将问答文档到生成知识库

大模型训练

SFT

全量更新

全量更新在训练过程中对大模型的全部参数进行更新(不推荐)

消耗资源且效果不一定比LoRA好

LoRA

LoRA在固定预训练大模型本身的参数的基础上，在保留自注意力模块中原始权重矩阵的基础上，对权重矩阵进行低秩分解，训练过程中只更新低秩部分的参数

资源消耗较少

推荐5-10次迭代

RLHF训练

1、训练或基于一个已有的大模型（LM）

可以直接使用千帆大模型平台提供的通用语言大模型

2、集合问答数据训练一个奖励模型（RM）

使用含排序已标注数据集进行训练

3、用强化学习（RL）方法微调LM

使用query问题集数据，加奖励模型进行强化训练（LM）。生成强化后的模型

模型管理

模型仓库

我的模型和预制模型

模型评估

使用已标注数据集评估模型

模型压缩

通过量化、稀疏化等方法在尽量减少精度损失的前提下，降低AI加速卡资源占用，提高推理速度。

大模型服务

服务管理

可以基于预制、或者自己训练的模型服务API服务

在线测试

在线测试服务

应用接入

应用管理、api调用是基于应用的莫要调用

调用统计

统计服务调用量

prompet工程

Prompt模板

提示词模板

Prompt优化

提示词优化

Prompt万能公式

定义角色+北京描述+定目标+补充要求（附加：+例子）

插件应用

插件编排

关联插件增强回复

知识库插件

ChatFile插件

百度搜索插件

天气插件

域内知识搜索插件

自定义插件

 收藏

立即使用

JAVA学习体系

 收藏

立即使用

高可用部署方案

 收藏

立即使用

 收藏

立即使用

数据卡片匿名访问功能

职业：暂无













评论

0 条评论

下一页

为你推荐

查看更多



IA大模型安全监管平台

AI大模型架构图

AI大模型项目落地时间轴

大模型架构图

大语言模型架构

知识图谱与大模型融合案例_购车攻略平台

知识图谱与大模型融合案例_购车攻略平台

开放平台领域交互模型



图形选择

思维导图

主题

补充说明

AI生成





修改AI描述

去编辑

重新生成

提示 

关闭后当前内容将不会保存，是否继续？

取消

确定