主题
字号

AI 深度学习核心

从第一性原理搭建神经网络——感知机、反向传播、激活函数、优化器、正则化,最后造一个 mini 框架。

Mav
01CH. 01

感知机

感知机是神经网络的原子。掰开看里面就是权重、偏置和一个决策。

开始阅读
02CH. 02

多层网络与前向传播

一个神经元画直线。堆起来,你能画任何东西。

开始阅读
03CH. 03

从零实现反向传播

反向传播是让学习成为可能的算法。没有它,神经网络只是昂贵的随机数生成器。

开始阅读
04CH. 04

激活函数

没有非线性,你的 100 层网络只是一个花哨的矩阵乘法。激活函数是让神经网络能画曲线的门。

开始阅读
05CH. 05

损失函数

网络做了预测,真实值说不对。差多少?那个数就是 loss。选错 loss 函数,模型会优化完全错误的目标。

开始阅读
06CH. 06

优化器

梯度下降告诉你往哪走。但走多远、走多快,它什么都没说。SGD 是指南针,Adam 是带实时路况的导航。

开始阅读
07CH. 07

正则化

模型在训练集上 99%,测试集上 60%。它是在背答案而不是在学习。正则化是你对复杂度征收的税,强迫模型泛化。

开始阅读
08CH. 08

权重初始化与训练稳定性

初始化错了训练永远不会开始。初始化对了,50 层跟 3 层一样顺畅。

开始阅读
09CH. 09

学习率调度与 Warmup

学习率是最重要的超参数。不是架构,不是数据集大小,不是激活函数。如果你只调一个东西,调学习率。

开始阅读
10CH. 10

搭建自己的 Mini 框架

你已经造了神经元、层、网络、反向传播、激活函数、损失函数、优化器、正则化、初始化和学习率调度。现在把它们焊在一起变成一个框架。不是 PyTorch,不是 TensorFlow,是你自己的。

开始阅读
11CH. 11

PyTorch 入门

你已经从活塞和曲轴开始造了一台引擎。现在来学大家真正开的那辆车。

开始阅读
12CH. 12

JAX 入门

PyTorch 原地修改张量,TensorFlow 构建计算图,JAX 编译纯函数。最后这个会改变你对深度学习的思考方式。

开始阅读
13CH. 13

调试神经网络

你的网络编译通过了,跑起来了,输出了一个数字。这个数字是错的,但什么都没崩。欢迎来到最难的调试——没有报错信息的那种。

开始阅读