技术
共 27 篇文章
使用 Agent Skills 扩展 Claude 功能
介绍如何通过 Agent Skills 扩展 Claude 智能体的功能,实现模块化能力。
GPT完全指南(十):应用案例与最佳实践
探索GPT在实际应用中的案例,包括RAG系统、代码助手、内容创作、企业应用等,以及生产环境部署的最佳实践
GPT完全指南(九):GPT Agent开发
深入学习GPT Agent的开发技术,包括Function Calling、工具使用、LangChain框架、多Agent协作以及实战项目开发
GPT完全指南(八):Prompt Engineering实战
系统学习Prompt Engineering的核心技巧,包括Few-shot、Chain-of-Thought、ReAct等高级技术,以及结构化输出和实际应用案例
GPT完全指南(七):推理优化与部署
深入解析GPT模型的推理优化技术,包括KV Cache、量化、Flash Attention、Speculative Decoding以及vLLM、TensorRT-LLM等推理框架
GPT完全指南(六):从零实现miniGPT
从零开始用PyTorch实现一个完整的GPT模型,包括分词器、模型架构、训练循环和文本生成的全部代码
GPT完全指南(五):微调与对齐技术
深入解析GPT模型的微调技术,包括SFT监督微调、RLHF人类反馈强化学习、DPO直接偏好优化等让AI"听话"的关键技术
GPT完全指南(四):预训练技术详解
深入解析GPT预训练的核心技术,包括语言建模目标、大规模数据处理、分布式训练策略以及Scaling Laws
GPT完全指南(三):分词与词表构建
深入解析GPT的分词技术,包括BPE、WordPiece、SentencePiece算法原理与实现,以及如何从零构建高效词表
GPT完全指南(二):架构深度解析
深入剖析GPT的Decoder-only Transformer架构,包括注意力机制、位置编码、LayerNorm等核心组件
GPT完全指南(一):发展历程与核心思想
从GPT-1到GPT-4,深入理解大语言模型的发展脉络、核心思想与技术演进
深度学习完全指南(十四):部署与工程化
从模型导出到生产部署,全面掌握ONNX、TensorRT、模型压缩与MLOps工程实践
深度学习完全指南(十三):深度学习框架对比与实战
PyTorch、TensorFlow、JAX三大框架深度对比,掌握各框架特点与最佳实践
深度学习完全指南(十二):模型训练与优化技巧
从优化器选择到学习率调度、正则化技术,全面掌握深度学习训练的核心技巧
深度学习完全指南(十一):强化学习基础
从马尔可夫决策过程到DQN、PPO,全面掌握强化学习的核心概念与算法实现
深度学习完全指南(十):自然语言处理应用
从文本分类到机器翻译、问答系统,全面掌握NLP的核心技术与实战应用
深度学习完全指南(九):计算机视觉应用
从图像分类到目标检测、语义分割、人脸识别,全面掌握计算机视觉的核心技术与实战应用
深度学习完全指南(八):大语言模型LLM
从GPT到LLaMA,全面理解大语言模型的架构、训练方法、涌现能力与对齐技术
深度学习完全指南(七):生成模型GAN/VAE/Diffusion
深入理解三大生成模型范式:GAN的对抗训练、VAE的变分推断、Diffusion的去噪扩散
深度学习完全指南(六):Transformer架构详解
从注意力机制到完整Transformer,深入理解这个改变NLP和CV的革命性架构
深度学习完全指南(五):循环神经网络RNN/LSTM/GRU
掌握序列建模的核心架构:从基础RNN到LSTM和GRU,理解时序数据处理的关键技术
深度学习完全指南(四):卷积神经网络CNN详解
从卷积操作到经典架构,全面掌握CNN在图像处理中的核心原理与实现
深度学习完全指南(三):神经网络基础与反向传播
深入理解神经网络的工作原理:从感知机到多层网络,掌握前向传播与反向传播算法
深度学习完全指南(二):数学基础
掌握深度学习必备的数学知识:线性代数、微积分、概率论与信息论的核心概念
深度学习完全指南(一):概述与发展历程
从感知机到大语言模型,全面了解深度学习的发展历史、核心概念和技术演进脉络
开始使用 Astro 构建你的博客
学习如何使用 Astro 框架快速搭建一个现代化的个人博客,包括内容管理、样式配置等基础知识。
2024 年前端开发趋势展望
探讨 2024 年前端开发领域的新技术、新工具和新趋势。