深度学习
共 16 篇文章
GPT完全指南(六):从零实现miniGPT
从零开始用PyTorch实现一个完整的GPT模型,包括分词器、模型架构、训练循环和文本生成的全部代码
GPT完全指南(二):架构深度解析
深入剖析GPT的Decoder-only Transformer架构,包括注意力机制、位置编码、LayerNorm等核心组件
深度学习完全指南(十四):部署与工程化
从模型导出到生产部署,全面掌握ONNX、TensorRT、模型压缩与MLOps工程实践
深度学习完全指南(十三):深度学习框架对比与实战
PyTorch、TensorFlow、JAX三大框架深度对比,掌握各框架特点与最佳实践
深度学习完全指南(十二):模型训练与优化技巧
从优化器选择到学习率调度、正则化技术,全面掌握深度学习训练的核心技巧
深度学习完全指南(十一):强化学习基础
从马尔可夫决策过程到DQN、PPO,全面掌握强化学习的核心概念与算法实现
深度学习完全指南(十):自然语言处理应用
从文本分类到机器翻译、问答系统,全面掌握NLP的核心技术与实战应用
深度学习完全指南(九):计算机视觉应用
从图像分类到目标检测、语义分割、人脸识别,全面掌握计算机视觉的核心技术与实战应用
深度学习完全指南(八):大语言模型LLM
从GPT到LLaMA,全面理解大语言模型的架构、训练方法、涌现能力与对齐技术
深度学习完全指南(七):生成模型GAN/VAE/Diffusion
深入理解三大生成模型范式:GAN的对抗训练、VAE的变分推断、Diffusion的去噪扩散
深度学习完全指南(六):Transformer架构详解
从注意力机制到完整Transformer,深入理解这个改变NLP和CV的革命性架构
深度学习完全指南(五):循环神经网络RNN/LSTM/GRU
掌握序列建模的核心架构:从基础RNN到LSTM和GRU,理解时序数据处理的关键技术
深度学习完全指南(四):卷积神经网络CNN详解
从卷积操作到经典架构,全面掌握CNN在图像处理中的核心原理与实现
深度学习完全指南(三):神经网络基础与反向传播
深入理解神经网络的工作原理:从感知机到多层网络,掌握前向传播与反向传播算法
深度学习完全指南(二):数学基础
掌握深度学习必备的数学知识:线性代数、微积分、概率论与信息论的核心概念
深度学习完全指南(一):概述与发展历程
从感知机到大语言模型,全面了解深度学习的发展历史、核心概念和技术演进脉络