登录免费注册

首页  流程图  详情

大模型发展

2025-02-11 09:10:58   9  举报





2024年到DeepSeek发布之前的大模型发展（自我认识-未必正确）

大模型

作者其他创作

大纲/内容

OpenAI 的 GPT-4模型-多模态

Meta 的 LLaMA模型

自然语言处理模型Word2Vec

1.75 万亿参数

2024

Google 的 BERT 模型

萌芽期

华为盘古大模型

1991

1943

性能（参数、层数等）

2006~2019以Transformer为代表的全新神经网络模型阶段

深度信念网络

OpenAI DALL -E 2

6万左右参数

百万~千万参数

DeepSeek R1

ChatGLM 大模型

OpenAI 的 GPT-1模型

多模态

6710 亿参数

卷积神经网络LeNet-5

2022

感知机

OpenAI 的 GPT-5

OpenAI CLIP

历程

悟道 2.0

2017

2006

2020

CV 模型

卷积神经网络CNN

2020~至今以GPT为代表的预训练大模型阶段

1957

百度文言一心

字节跳动豆包（云雀）

3 亿参数

2023

反向传播算法

1986

1750 亿参数

OpenAI 的 GPT-3.5模型

迅猛发展期

5300 亿参数

1943~2006以CNN为代表的传统神经网络模型阶段

2018

阿里云通义千问

LSTM长短期记忆网络

Meta 的 LLaMA - 3

沉淀期

OpenAI 的 GPT-3模型

15 亿参数

1980

2000 亿参数

商汤日日新大模型

2014

人工神经元的数学模型

Google 的 Switch Transformer 引入混合专家Moe（架构）

时间

2013

DeepSeek V3

自注意力机制的神经网络结构Transformer架构

OpenAI 的GPT - 4V

1998

语言模型

Google 的 LaMDA架构

GAN（对抗式生成网络）

腾讯混元大模型

科大讯飞星火大模型

1.37 万亿参数

 收藏

立即使用

大模型技术调研工作思路

 收藏

立即使用

知识图谱处理流程

 收藏

立即使用

数据向量化

 收藏

立即使用

大模型发展

职业：java万能人













评论

0 条评论

下一页

为你推荐

查看更多



多模态-音视频大模型-大模型-MCP

多模态-音视频大模型-大模型-MCP

大模型知识问答框架RAG

大模型应用

如何学习大模型

大模型平台_架构图_AI大模型平台

大模型平台_架构图_AI大模型平台

电建--领域大模型

大模型可信应用构建策略

AI大模型技术架构_全景视图_架构图_大模型

AI大模型技术架构_全景视图_架构图_大模型

大模型AI应用知识体系_大模型

大模型AI应用知识体系_大模型

AIGC大模型应用技术