AI技术 | Fine-tuning
2025-03-05 21:13:42 3 举报
AI智能生成
AI技术 | Fine-tuning 微调
作者其他创作
大纲/内容
定义:一个为预训练过的 LLM 调参的过程,从而具备完成特定任务或领域的工作。
主流的 Fine-tuning 方式
特征抽取 Feature Extraction / Repurposing
全量 fine-tuning
重要的Fine-tuning方法
监督的 Fine-tuning
基础的超参调整
迁移学习 Transfer Learning
多任务学习 Multi-task Learning
少量样本学习 Few-shot Learning
特定任务微调 Task-specific Fine-tuning
基础的超参调整 Basic Hyperparameter Tuning
RLHF(人工反馈强化学习 )
Reward Modeling:奖励式建模
PPO(Poximal Policy Optimization):近端策略优化
Comparative Ranking:对比排名
Preference Learning(Reinforcement Learning with Preference Feedback):用偏好反馈强化学习
PEFT(Parameter Efficient Fine-tuning):参数高效微调
LoRA 方法
训练流程
应用场景
自定义-生成特定的语言模式、术语、专用名词。
保证模型的数据合规标准
帮助我们减少标注数据的准备
参考文档
Fine-Tuning LLMs : Overview, Methods, and Best Practices
0 条评论
下一页