入门容易,代码浅显易懂,动态图。

ML 中的一些专有名词

模型的偏差和方差

  • 偏差(Bias): 模型在样本上的输出与真实值之间的误差 —— 模型本身的精确度
  • 方差(Variance): 模型每一次的输出结果与模型输出期望之间的误差 —— 模型的稳定性

防止过拟合的方法

  • 补充数据集(数据增强)
  • 减少模型参数
  • Dropout
  • Earlystopping
  • 正则化 & 稀疏化(模型结构变得更简单的一种手段)

防止欠拟合的方法

  • 加大模型参数
  • 减少正则化参数
  • 更充分的训练

在实际的 ML 中可能解决过拟合是更常见的需求。

Tensor

标量是 0 维张量,向量是 1 维张量,矩阵是 2 维张量。

PCA 与特征值分解

将 n 维特征映射到 k 维上(投影矩阵),这 k 维是全新的正交特征,也被称为主成分,是在原有的 n 维特征的基础上重新构造出来的 k 维特征。

PCA 算法的优化目标:

  • 降维后同一维度的方差最大
  • 不同维度的相关性为 0
  • 协方差矩阵

参考资料

  • Visdom: 提供了大多数科学计算的可视化工具,支持 PyTorch、Torch、Numpy
  • Torchvision: 独立于 PyTorch 的关于图片操作的一些方便的工具库。