AI大模型汇总
2025-03-26 17:59:32 0 举报
AI智能生成
模型汇总
作者其他创作
大纲/内容
国外模型
OpenAI
GPT-3.5
GPT-4
特点:多模态支持,文本+图像输入
应用:ChatGPT Plus订阅制
GPT-4o(2024年发布)
Anthropic
Claude系列
Claude 3
Claude 3.5 Sonnet(对话能力前三)
Google
Gemini系列
Gemini Ultra(MMLU超越人类专家)
Gemini Pro(Bard基础模型)
Gemini Nano(移动端部署)
Meta
Llama系列
Llama 2(开源可商用)
Llama 3(1400亿参数)
Llama 3.2(多模态+语音交互)
Code Llama(代码生成专项)
GitHub/Microsoft/OpenAI
Copilot(编程辅助+办公集成)
国内模型
初创团队
百度
文心一言
特点:中文处理能力强
字节跳动
豆包
特点:AI搜索+多模态交互
科大讯飞
星火大模型
特点:语音识别与合成优势
阿里云
通义千问
特点:电商场景深度优化
智谱AI
智谱清言
特点:超长上下文处理(200万字)
华为
盘古大模型
腾讯
混元助手
昆仑万维
天工AI
月之暗面科技
Kimi k1.5
特点:多模态思考模型,SOTA级推理能力
技术突破:原创long2short算法,短思考模式超越GPT-4o 550%
Kimi
特点:复杂多轮对话能力
阶跃星辰
Step系列通用模型
特点:千亿参数规模,逻辑推理与复杂任务处理
技术突破:全球首个实现多模态视频生成开源(Step-Video-T2V),语音交互模型通过HSK6级测试
行业应用:金融财经(君弘灵犀大模型)、消费零售(茶百道智能巡检)
深度求索(DeepSeek)
DeepSeek-R1
特点:6710亿参数开源模型,性能对标OpenAI o1
技术突破:强化学习无监督微调,仅用2048颗H800芯片完成训练
成本优势:训练成本约600万美元(仅为国际同类模型1/10)
MiniMax(稀宇科技)
海螺AI
特点:全球首个支持400万token长文本的开源模型
技术突破:线性注意力机制突破Transformer架构,视频生成人物一致性达行业领先
S2V-01
特点:视频生成计算成本降低99%
库帕思科技
行业语料库
特点:覆盖金融/制造/教育等7大领域的垂直语料库
达观数据
曹植大模型
特点:专注文档智能处理,支持1000+格式解析
性能对比
对话能力:GPT-4o > Claude 3.5 > Gemini Pro
推理能力:GPT-4o > Claude 3.5 > Gemini Ultra
编程能力:Claude 3.5 > GPT-4o > GPT-4
上下文窗口:Gemini Ultra(32K)> Claude 3.5(100K)
专项模型
文生视频
Sora(OpenAI)
AtomoVideo(阿里)
EMO(阿里)
3D生成
Motionshop(阿里)
代码生成
Code Llama(Meta)
DeepSeek-Coder(国内)
0 条评论
下一页