孟
孟国庆的博客
首页
文章
系列
分类
标签
关于
🏠
首页
📝
文章
📚
系列
📁
分类
🏷️
标签
👋
关于
首页
/
标签
/
SFT
🏷️
SFT
共 1 篇文章
GP
GPT完全指南(五):微调与对齐技术
3月5日
深入解析GPT模型的微调技术,包括SFT监督微调、RLHF人类反馈强化学习、DPO直接偏好优化等让AI"听话"的关键技术
ESC
🔍
输入关键词搜索