动手学深度学习——线性神经网络

发表于 2025-06-01 更新于 2025-06-08 分类于学习提升，深度学习本文字数： 1k 阅读时长 ≈ 2 分钟

序言

为系统性重温深度学习中的一些重要技术，深入掌握其底层原理及更高层次的思想，我选择使用《动手学深度学习》作为教材，并在此进行一些记录。

线性回归基于几个简单的假设：首先，假设自变量x和因变量y之间的关系是线性的，即y可以表示为x中元素的加权和，这里通常允许包含观测值的一些噪声；其次，我们假设任何噪声都比较正常，如噪声遵循正态分布。
术语：
- 训练数据集（training data set）、验证数据集（validation dataset）
- 样本（sample）、数据点（data point）、数据样本（data instance）：每行数据
- 标签（label）、目标（target）：试图预测的目标
- 特征（feature）、协变量（covariate）：预测所依据的自变量
- 权重（weight）
- 偏置（bias）、偏移量（offset）、截距（intercept）
- 超参数（hyperparameter）：可以调整但不在训练过程中更新的参数
- 调参（hyperparameter tuning）：选择超参数的过程
- 泛化（generalization）：找到一组能够在从未见过的数据上实现较低的损失的参数
- 预测（prediction）、推断（inference）：给定特征估计目标的过程