PyTorch常用代码段整理合集，建议收藏

点击上方，选择星标或置顶，每天给你送干！

阅读大概需要12分钟
跟随小博主，每天进步一丢丢

本文代码基于 PyTorch 1.0 版本，需要用到以下包

基础配置

检查 PyTorch 版本

更新 PyTorch

PyTorch 将被安装在 anaconda3/lib/python3.7/site-packages/torch/目录下。

固定随机种子

指定程序运行在特定 GPU 卡上

在命令行指定环境变量

或在代码中指定

判断是否有 CUDA 支持

设置为 cuDNN benchmark 模式

Benchmark 模式会提升计算速度，但是由于计算中有随机性，每次网络前馈结果略有差异。

如果想要避免这种结果波动，设置

清除 GPU 存储

有时 Control-C 中止运行后 GPU 存储没有及时释放，需要手动清空。在 PyTorch 内部可以

或在命令行可以先使用 ps 找到程序的 PID，再使用 kill 结束该进程

或者直接重置没有被清空的 GPU

张量处理

张量基本信息

数据类型转换

torch.Tensor 与 np.ndarray 转换

torch.Tensor 与 PIL.Image 转换

PyTorch 中的张量默认采用 N×D×H×W 的顺序，并且数据范围在 [0, 1]，需要进行转置和规范化。

np.ndarray 与 PIL.Image 转换

从只包含一个元素的张量中提取值

这在训练时统计 loss 的变化过程中特别有用。否则这将累积计算图，使 GPU 存储占用量越来越大。

张量形变

张量形变常常需要用于将卷积层特征输入全连接层的情形。相比 torch.view，torch.reshape 可以自动处理输入张量不连续的情况。

打乱顺序

水平翻转

PyTorch 不支持 tensor[::-1] 这样的负步长操作，水平翻转可以用张量索引实现。

复制张量

有三种复制的方式，对应不同的需求。

拼接张量

注意 torch.cat 和 torch.stack 的区别在于 torch.cat 沿着给定的维度拼接，而 torch.stack 会新增一维。例如当参数是 3 个 10×5 的张量，torch.cat 的结果是 30×5 的张量，而 torch.stack 的结果是 3×10×5 的张量。

将整数标记转换成独热（one-hot）编码

PyTorch 中的标记默认从 0 开始。

得到非零/零元素

张量扩展

矩阵乘法

计算两组数据之间的两两欧式距离

模型定义

卷积层

最常用的卷积层配置是

如果卷积层配置比较复杂，不方便计算输出大小时，可以利用如下可视化工具辅助

链接：https://ezyang.github.io/convolution-visualizer/index.html

0GAP（Global average pooling）层

双线性汇合（bilinear pooling）

多卡同步 BN（Batch normalization）

当使用 torch.nn.DataParallel 将代码运行在多张 GPU 卡上时，PyTorch 的 BN 层默认操作是各卡上数据独立地计算均值和标准差，同步 BN 使用所有卡上的数据一起计算 BN 层的均值和标准差，缓解了当批量大小（batch size）比较小时对均值和标准差估计不准的情况，是在目标检测等任务中一个有效的提升性能的技巧。

链接：https://github.com/vacancy/Synchronized-BatchNorm-PyTorch

类似 BN 滑动平均

如果要实现类似 BN 滑动平均的操作，在 forward 函数中要使用原地（inplace）操作给滑动平均赋值。

计算模型整体参数量

类似 Keras 的 model.summary() 输出模型信息

链接：https://github.com/sksq96/pytorch-summary

模型权值初始化

注意 model.modules() 和 model.children() 的区别：model.modules() 会迭代地遍历模型的所有子层，而 model.children() 只会遍历模型下的一层。

部分层使用预训练模型

注意如果保存的模型是 torch.nn.DataParallel，则当前的模型也需要是

将在 GPU 保存的模型加载到 CPU

数据准备、特征提取与微调

得到视频数据基本信息

TSN 每段（segment）采样一帧视频

提取 ImageNet 预训练模型某层的卷积特征

提取 ImageNet 预训练模型多层的卷积特征

其他预训练模型

链接：https://github.com/Cadene/pretrained-models.pytorch

微调全连接层

以较大学习率微调全连接层，较小学习率微调卷积层

模型训练

常用训练和验证数据预处理

其中 ToTensor 操作会将 PIL.Image 或形状为 H×W×D，数值范围为 [0, 255] 的 np.ndarray 转换为形状为 D×H×W，数值范围为 [0.0, 1.0] 的 torch.Tensor。

训练基本代码框架

标记平滑（label smoothing）

Mixup

L1 正则化

不对偏置项进行 L2 正则化/权值衰减（weight decay）

梯度裁剪（gradient clipping）

计算 Softmax 输出的准确率

可视化模型前馈的计算图

链接：https://github.com/szagoruyko/pytorchviz

可视化学习曲线

有 Facebook 自己开发的 Visdom 和 Tensorboard 两个选择。

https://github.com/facebookresearch/visdom

https://github.com/lanpa/tensorboardX

得到当前学习率

学习率衰减

保存与加载断点

注意为了能够恢复训练，我们需要同时保存模型和优化器的状态，以及当前的训练轮数。

计算准确率、查准率（precision）、查全率（recall）

PyTorch 其他注意事项

模型定义

建议有参数的层和汇合（pooling）层使用 torch.nn 模块定义，激活函数直接使用 torch.nn.functional。torch.nn 模块和 torch.nn.functional 的区别在于，torch.nn 模块在计算时底层调用了 torch.nn.functional，但 torch.nn 模块包括该层参数，还可以应对训练和测试两种网络状态。使用 torch.nn.functional 时要注意网络状态，如

model(x) 前用 model.train() 和 model.eval() 切换网络状态。
不需要计算梯度的代码块用 with torch.no_grad() 包含起来。model.eval() 和 torch.no_grad() 的区别在于，model.eval() 是将网络切换为测试状态，例如 BN 和随机失活（dropout）在训练和测试阶段使用不同的计算方法。torch.no_grad() 是关闭 PyTorch 张量的自动求导机制，以减少存储使用和加速计算，得到的结果无法进行 loss.backward()。
torch.nn.CrossEntropyLoss 的输入不需要经过 Softmax。torch.nn.CrossEntropyLoss 等价于 torch.nn.functional.log_softmax + torch.nn.NLLLoss。
loss.backward() 前用 optimizer.zero_grad() 清除累积梯度。optimizer.zero_grad() 和 model.zero_grad() 效果一样。

PyTorch 性能与调试

torch.utils.data.DataLoader 中尽量设置 pin_memory=True，对特别小的数据集如 MNIST 设置 pin_memory=False 反而更快一些。num_workers 的设置需要在实验中找到最快的取值。
用 del 及时删除不用的中间变量，节约 GPU 存储。
使用 inplace 操作可节约 GPU 存储，如

减少 CPU 和 GPU 之间的数据传输。例如如果你想知道一个 epoch 中每个 mini-batch 的 loss 和准确率，先将它们累积在 GPU 中等一个 epoch 结束之后一起传输回 CPU 会比每个 mini-batch 都进行一次 GPU 到 CPU 的传输更快。
使用半精度浮点数 half() 会有一定的速度提升，具体效率依赖于 GPU 型号。需要小心数值精度过低带来的稳定性问题。
时常使用 assert tensor.size() == (N, D, H, W) 作为调试手段，确保张量维度和你设想中一致。
除了标记 y 外，尽量少使用一维张量，使用 n*1 的二维张量代替，可以避免一些意想不到的一维张量计算结果。
统计代码各部分耗时

或者在命令行运行

致谢

感谢 @些许流年和@El tnoto的勘误。由于作者才疏学浅，更兼时间和精力所限，代码中错误之处在所难免，敬请读者批评指正。

参考资料

PyTorch 官方代码：pytorch/examples (https://link.zhihu.com/?target=https%3A//github.com/pytorch/examples)
PyTorch 论坛：PyTorch Forums (https://link.zhihu.com/?target=https%3A//discuss.pytorch.org/latest%3Forder%3Dviews)
PyTorch 文档：http://pytorch.org/docs/stable/index.html (https://link.zhihu.com/?target=http%3A//pytorch.org/docs/stable/index.html)
其他基于 PyTorch 的公开实现代码，无法一一列举

相关推荐

取消回复欢迎你发表评论:

Google 黑客常用搜索语句一览原力计划

npx简介（npxvip是哪国的）

在 Android 模拟器上运行 ARM 应用（android模拟器原理）

GB28181,B接口协议之SIPRTSPRTPRTMP协议从入门到精通

手机实时提取SIM卡打电话的信令和声音-辅助外设与商用通话方案

安装使用Hoppscotch构建API请求访问与测试

轻松转换!AppleNumbers到Excel的快捷教程

Python自动化办公——后台截图（python 自动截图）

电脑端腾讯文档如何导出excel

网络流媒体经典开源软件宝典webRTC, FFMpeg, SIP_流媒体开发教程