AI 深度学习核心
从第一性原理搭建神经网络——感知机、反向传播、激活函数、优化器、正则化,最后造一个 mini 框架。
Mav
01CH. 01
感知机
感知机是神经网络的原子。掰开看里面就是权重、偏置和一个决策。
开始阅读→
02CH. 02
多层网络与前向传播
一个神经元画直线。堆起来,你能画任何东西。
开始阅读→
03CH. 03
从零实现反向传播
反向传播是让学习成为可能的算法。没有它,神经网络只是昂贵的随机数生成器。
开始阅读→
04CH. 04
激活函数
没有非线性,你的 100 层网络只是一个花哨的矩阵乘法。激活函数是让神经网络能画曲线的门。
开始阅读→
05CH. 05
损失函数
网络做了预测,真实值说不对。差多少?那个数就是 loss。选错 loss 函数,模型会优化完全错误的目标。
开始阅读→
06CH. 06
优化器
梯度下降告诉你往哪走。但走多远、走多快,它什么都没说。SGD 是指南针,Adam 是带实时路况的导航。
开始阅读→
07CH. 07
正则化
模型在训练集上 99%,测试集上 60%。它是在背答案而不是在学习。正则化是你对复杂度征收的税,强迫模型泛化。
开始阅读→
08CH. 08
权重初始化与训练稳定性
初始化错了训练永远不会开始。初始化对了,50 层跟 3 层一样顺畅。
开始阅读→
09CH. 09
学习率调度与 Warmup
学习率是最重要的超参数。不是架构,不是数据集大小,不是激活函数。如果你只调一个东西,调学习率。
开始阅读→
10CH. 10
搭建自己的 Mini 框架
你已经造了神经元、层、网络、反向传播、激活函数、损失函数、优化器、正则化、初始化和学习率调度。现在把它们焊在一起变成一个框架。不是 PyTorch,不是 TensorFlow,是你自己的。
开始阅读→
11CH. 11
PyTorch 入门
你已经从活塞和曲轴开始造了一台引擎。现在来学大家真正开的那辆车。
开始阅读→
12CH. 12
JAX 入门
PyTorch 原地修改张量,TensorFlow 构建计算图,JAX 编译纯函数。最后这个会改变你对深度学习的思考方式。
开始阅读→
13CH. 13
调试神经网络
你的网络编译通过了,跑起来了,输出了一个数字。这个数字是错的,但什么都没崩。欢迎来到最难的调试——没有报错信息的那种。
开始阅读→