📄 GPT完全指南(六):从零实现miniGPT 从零开始用PyTorch实现一个完整的GPT模型,包括分词器、模型架构、训练循环和文本生成的全部代码 2024年3月6日 技术 GPTPyTorch深度学习
📄 GPT完全指南(二):架构深度解析 深入剖析GPT的Decoder-only Transformer架构,包括注意力机制、位置编码、LayerNorm等核心组件 2024年3月2日 技术 GPTTransformer注意力机制
📄 深度学习完全指南(六):Transformer架构详解 从注意力机制到完整Transformer,深入理解这个改变NLP和CV的革命性架构 2024年2月6日 技术 深度学习Transformer注意力机制