大模型发展
2025-02-11 09:10:58 9 举报
2024年到DeepSeek发布之前的大模型发展(自我认识-未必正确)
作者其他创作
大纲/内容
OpenAI 的 GPT-4模型-多模态
Meta 的 LLaMA模型
自然语言处理模型Word2Vec
1.75 万亿参数
2024
Google 的 BERT 模型
萌芽期
华为 盘古大模型
1991
1943
性能(参数、层数等)
2006~2019以Transformer为代表的全新神经网络模型阶段
深度信念网络
OpenAI DALL -E 2
6万左右参数
百万~千万参数
DeepSeek R1
ChatGLM 大模型
OpenAI 的 GPT-1模型
多模态
6710 亿参数
卷积神经网络LeNet-5
2022
感知机
OpenAI 的 GPT-5
OpenAI CLIP
历程
悟道 2.0
2017
2006
2020
CV 模型
卷积神经网络CNN
2020~至今以GPT为代表的预训练大模型阶段
1957
百度文言一心
字节跳动豆包(云雀)
3 亿参数
2023
反向传播算法
1986
1750 亿参数
OpenAI 的 GPT-3.5模型
迅猛发展期
5300 亿参数
1943~2006以CNN为代表的传统神经网络模型阶段
2018
阿里云 通义千问
LSTM长短期记忆网络
Meta 的 LLaMA - 3
沉淀期
OpenAI 的 GPT-3模型
15 亿参数
1980
2000 亿参数
商汤日日新大模型
2014
人工神经元的数学模型
Google 的 Switch Transformer 引入混合专家Moe(架构)
时间
2013
DeepSeek V3
自注意力机制的神经网络结构Transformer架构
OpenAI 的GPT - 4V
1998
语言模型
Google 的 LaMDA架构
GAN(对抗式生成网络)
腾讯混元大模型
科大讯飞 星火大模型
1.37 万亿参数
0 条评论
下一页