gpt-知识库-一些图文整理
2024-08-14 11:39:00 0 举报
AI智能生成
gpt-知识库-设计图
作者其他创作
大纲/内容
Central Processing Unit-中央处理器
电脑的心脏,管运算,管调度,管一切
单通道
cpu
Graphics Processing Unit-图形处理器
显卡的心脏,为运算而生
双向100车道
gpu
ai可以使用cpu或gpu运算,但是gpu的纯运算能力超出cpu数量级,所以大模型现都是用gpu运算
AI运算
AIGC - AI Generated Content (AI生成内容 暂无版权概念)UGC(User Generated Content)PGC(Professional user Generated Content)
模拟人脑工作原理的“符号学习”和“神经网络学习”
基于数学统计分析得机器学习
学习策略
归纳学习
演绎学习
类比学习
分析学习
学习方法
无监督学习(自学)
有监督学习(带老师指导)
强化学习(通过环境奖惩反馈进步)
学习方式
机器学习
卷积网络(CNN - Convolutional Neural Networks)
循环神经网络(RNN - Recurrent Neural Networks)+递归神经网络(RNN - Recursive Neural Networks)
长短期记忆RNN(LSTM - Long short-term memory)
为了解决 LSTM/RNN 中的一些问题的解决办法加入Attention机制的Transformer框架。
深度学习在计算机视觉(CV、如图像识别)、自然语言处理(NLP)、自动驾驶、机器人控制 等方面比传统机器学习效果更好。
深度学习
机器学习&深度学习第一阶段:传统机器学习(Machine Learnin)第二阶段 V1:“深度学习”(Deep Learnin)第二阶段 V2:Google Transformer 模型 2018年(GPT的T)
2018年
1.17亿参数(训练数据)
GPT1
2019年
1.5B参数
GPT2
2020年
175B参数
GPT3
2022年11月
175B(1750亿)参数
同步发布了 Chat for GPT-3.5的对话聊天机器人,引爆全世界
语料采集截止时间为2020年5月
(NVIDIA)的A100型号GPU一万张,目前京东A100的卡销售价格大约为人民币10万元
ChatGPT大概训练算力成本粗略预估为10亿人民币左右
对于ChatGPT公布的数据来看,一次大模型的训练大约需要1200万美元
费用
阶段一:无监督学习(Unsupervised Learning)
阶段二:监督学习(Supervised Fine-Tune)
阶段三:强化学习(RL - Reinforcement Learning)
chatgpt三阶段
Chat+GPT3.5
2023年3月
N倍的参数
语料采集截止时间是2021年9月
GPT4
GPT发展之路
基于上文生成下一个单词,再把这个单词加入上文,生成下一个,如此往复。 (这也就是为什么ChatGPT 输出内容总是一个字一个字蹦出来的原因)
Generative - 生成下一个词Pre-trained - 文本预训练(互联网各种文字材料)Transformer - 基于Transformer架构
gpt
分析用户语义,并将连续对话组装成上下文传递给gpt,告诉gpt,你将这些作为已知条件,然后结合自己的认知,重新组织,告诉我答案
RLHF (Reinforcement Learning from Human Feedback 人类反馈强化学习)
chat
chat&gpt简单原理说明
ChatGLM(清华GPT)
隐私数据最终会传给gpt
可以建立本地知识库
模型使用chatgpt
收费 功能较为完善 体检较好
体验链接 https://udify.app/chat/iye8tslgmSCIMt1p
dify
安排日程
处理待办
工作概览
请假审批
创作与文案
智能绘图
...
个人助理
企业助理
助理市场
ai嵌入钉钉
连接钉钉用户数据
特点
连接公网系统
连接用户系统
第三方 交通 住宿 购物系统
openapi接口
AI 助理(agent)
不如 gpt3.5?
大模型
价格
钉钉
how work
AI assitant
gpt4 turbo
gpts 应用商店
效果较好
限制过多
gpt PLUS
price
openai
Gemini
商用产品
1. 知识问答,比如次免赔额的定义
2. 做统计,比如对于次免赔额有多少种描述,后续方便做标准化
3. 面向客服的辅助工具,快速查询某个客户的保险协议
4. 做文本比对,比如同一个客户2023和2022保险协议的差异
把保险协议作为知识库
结合知识库深度定制化
文案工具机器人
辅助编程
代码纠错?
快搜
注释生成?
把代码库导入知识库
提纲/文案写作
语言生成-交流能力
世界知识-自我学习
评论比较
角色扮演
gpt基础能力
用途设想
ChatGLM4模型 本地部署
如需本地知识库库 必须要gpu
gpt4
支持模型
≈chat
LangChain
将我们多年沉淀的知识库导入,对gpt进行微调导入越多数据,进行越多的训练才能越聪明
支持多种格式
本地知识库
租用云服务器带A10NVIDIA显卡进行调研月费用2-4k不等。 按需租用
Langchain-Chatchat+自家知识库
仅主要支持pdf
langchain框架
gpt能力
效果不如gpt PLUS
本地知识库 无空间限制
gpt4-pdf-chatbot-langchain
开源方案
鼎源万家方案
知识库-gpt
0 条评论
回复 删除
下一页