AI 深度学习核心

从第一性原理搭建神经网络——感知机、反向传播、激活函数、优化器、正则化，最后造一个 mini 框架。

Mav

01CH. 01

感知机

感知机是神经网络的原子。掰开看里面就是权重、偏置和一个决策。

开始阅读→

02CH. 02

多层网络与前向传播

一个神经元画直线。堆起来，你能画任何东西。

开始阅读→

03CH. 03

从零实现反向传播

反向传播是让学习成为可能的算法。没有它，神经网络只是昂贵的随机数生成器。

开始阅读→

04CH. 04

激活函数

没有非线性，你的 100 层网络只是一个花哨的矩阵乘法。激活函数是让神经网络能画曲线的门。

开始阅读→

05CH. 05

损失函数

网络做了预测，真实值说不对。差多少？那个数就是 loss。选错 loss 函数，模型会优化完全错误的目标。

开始阅读→

06CH. 06

优化器

梯度下降告诉你往哪走。但走多远、走多快，它什么都没说。SGD 是指南针，Adam 是带实时路况的导航。

开始阅读→

07CH. 07

正则化

模型在训练集上 99%，测试集上 60%。它是在背答案而不是在学习。正则化是你对复杂度征收的税，强迫模型泛化。

开始阅读→

08CH. 08

权重初始化与训练稳定性

初始化错了训练永远不会开始。初始化对了，50 层跟 3 层一样顺畅。

开始阅读→

09CH. 09

学习率调度与 Warmup

学习率是最重要的超参数。不是架构，不是数据集大小，不是激活函数。如果你只调一个东西，调学习率。

开始阅读→

10CH. 10

搭建自己的 Mini 框架

你已经造了神经元、层、网络、反向传播、激活函数、损失函数、优化器、正则化、初始化和学习率调度。现在把它们焊在一起变成一个框架。不是 PyTorch，不是 TensorFlow，是你自己的。

开始阅读→

11CH. 11

PyTorch 入门

你已经从活塞和曲轴开始造了一台引擎。现在来学大家真正开的那辆车。

开始阅读→

12CH. 12

JAX 入门

PyTorch 原地修改张量，TensorFlow 构建计算图，JAX 编译纯函数。最后这个会改变你对深度学习的思考方式。

开始阅读→

13CH. 13

调试神经网络

你的网络编译通过了，跑起来了，输出了一个数字。这个数字是错的，但什么都没崩。欢迎来到最难的调试——没有报错信息的那种。

开始阅读→

主题

字号

AI 深度学习核心

感知机

多层网络与前向传播

从零实现反向传播

激活函数

损失函数

优化器

正则化

权重初始化与训练稳定性

学习率调度与 Warmup

搭建自己的 Mini 框架

PyTorch 入门

JAX 入门

调试神经网络