gpt-知识库-一些图文整理
2024-08-14 11:39:00 0 举报
AI智能生成
gpt-知识库-设计图
作者其他创作
大纲/内容
AI运算
cpu
Central Processing Unit-中央处理器
电脑的心脏,管运算,管调度,管一切
单通道
gpu
Graphics Processing Unit-图形处理器
显卡的心脏,为运算而生
双向100车道
ai可以使用cpu或gpu运算,但是gpu的纯运算能力超出cpu数量级,所以大模型现都是用gpu运算
AIGC - AI Generated Content (AI生成内容 暂无版权概念)
UGC(User Generated Content)
PGC(Professional user Generated Content)
UGC(User Generated Content)
PGC(Professional user Generated Content)
机器学习&深度学习
第一阶段:传统机器学习(Machine Learnin)
第二阶段 V1:“深度学习”(Deep Learnin)
第二阶段 V2:Google Transformer 模型 2018年(GPT的T)
第一阶段:传统机器学习(Machine Learnin)
第二阶段 V1:“深度学习”(Deep Learnin)
第二阶段 V2:Google Transformer 模型 2018年(GPT的T)
机器学习
学习策略
模拟人脑工作原理的“符号学习”和“神经网络学习”
基于数学统计分析得机器学习
学习方法
归纳学习
演绎学习
类比学习
分析学习
学习方式
无监督学习(自学)
有监督学习(带老师指导)
强化学习(通过环境奖惩反馈进步)
深度学习
卷积网络(CNN - Convolutional Neural Networks)
循环神经网络(RNN - Recurrent Neural Networks)+递归神经网络(RNN - Recursive Neural Networks)
长短期记忆RNN(LSTM - Long short-term memory)
为了解决 LSTM/RNN 中的一些问题的解决办法加入Attention机制的Transformer框架。
深度学习在计算机视觉(CV、如图像识别)、自然语言处理(NLP)、自动驾驶、机器人控制 等方面比传统机器学习效果更好。
GPT发展之路
GPT1
2018年
1.17亿参数(训练数据)
GPT2
2019年
1.5B参数
GPT3
2020年
175B参数
Chat+GPT3.5
2022年11月
175B(1750亿)参数
同步发布了 Chat for GPT-3.5的对话聊天机器人,引爆全世界
语料采集截止时间为2020年5月
费用
(NVIDIA)的A100型号GPU一万张,目前京东A100的卡销售价格大约为人民币10万元
ChatGPT大概训练算力成本粗略预估为10亿人民币左右
对于ChatGPT公布的数据来看,一次大模型的训练大约需要1200万美元
chatgpt三阶段
阶段一:无监督学习(Unsupervised Learning)
阶段二:监督学习(Supervised Fine-Tune)
阶段三:强化学习(RL - Reinforcement Learning)
GPT4
2023年3月
N倍的参数
语料采集截止时间是2021年9月
chat&gpt简单原理说明
gpt
基于上文生成下一个单词,再把这个单词加入上文,生成下一个,如此往复。
(这也就是为什么ChatGPT 输出内容总是一个字一个字蹦出来的原因)
(这也就是为什么ChatGPT 输出内容总是一个字一个字蹦出来的原因)
Generative - 生成下一个词
Pre-trained - 文本预训练(互联网各种文字材料)
Transformer - 基于Transformer架构
Pre-trained - 文本预训练(互联网各种文字材料)
Transformer - 基于Transformer架构
chat
分析用户语义,并将连续对话组装成上下文传递给gpt,告诉gpt,你将这些作为已知条件,然后结合自己的认知,重新组织,告诉我答案
RLHF (Reinforcement Learning from Human Feedback 人类反馈强化学习)
ChatGLM(清华GPT)
鼎源万家方案
商用产品
dify
隐私数据最终会传给gpt
可以建立本地知识库
模型使用chatgpt
收费 功能较为完善 体检较好
体验链接 https://udify.app/chat/iye8tslgmSCIMt1p
钉钉
AI 助理(agent)
ai嵌入钉钉
安排日程
处理待办
工作概览
请假审批
创作与文案
智能绘图
...
个人助理
企业助理
助理市场
特点
连接钉钉用户数据
openapi接口
连接公网系统
连接用户系统
第三方 交通 住宿 购物系统
大模型
不如 gpt3.5?
价格
openai
AI assitant
openapi接口
连接公网系统
连接用户系统
第三方 交通 住宿 购物系统
how work
gpt4 turbo
gpts 应用商店
gpt PLUS
效果较好
限制过多
price
Gemini
用途设想
把保险协议作为知识库
1. 知识问答,比如次免赔额的定义
2. 做统计,比如对于次免赔额有多少种描述,后续方便做标准化
3. 面向客服的辅助工具,快速查询某个客户的保险协议
4. 做文本比对,比如同一个客户2023和2022保险协议的差异
文案工具机器人
结合知识库深度定制化
把代码库导入知识库
辅助编程
代码纠错?
快搜
注释生成?
gpt基础能力
提纲/文案写作
语言生成-交流能力
世界知识-自我学习
评论比较
角色扮演
开源方案
Langchain-Chatchat+自家知识库
支持模型
ChatGLM4模型 本地部署
gpt4
如需本地知识库库 必须要gpu
LangChain
≈chat
本地知识库
将我们多年沉淀的知识库导入,对gpt进行微调
导入越多数据,进行越多的训练才能越聪明
导入越多数据,进行越多的训练才能越聪明
支持多种格式
租用云服务器带A10NVIDIA显卡进行调研
月费用2-4k不等。 按需租用
月费用2-4k不等。 按需租用
gpt4-pdf-chatbot-langchain
仅主要支持pdf
langchain框架
gpt能力
效果不如gpt PLUS
本地知识库 无空间限制
0 条评论
下一页