📄 GPT完全指南(五):微调与对齐技术 深入解析GPT模型的微调技术,包括SFT监督微调、RLHF人类反馈强化学习、DPO直接偏好优化等让AI"听话"的关键技术 2024年3月5日 技术 GPTRLHFSFT