上采样¶

class torch.nn.Upsample(size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None)[源代码]¶

对给定的多通道一维（时间）、二维（空间）或三维（体积）数据进行上采样。

输入数据的形式假设为小批量 x 通道 x [可选深度] x [可选高度] x 宽度。因此，对于空间输入，我们期望一个4D张量，而对于体积输入，我们期望一个5D张量。

可用于上采样的算法有最近邻和线性，分别为3D、4D和5D输入张量的双线性、双三次和三线性。

可以选择提供一个scale_factor或目标输出size来计算输出大小。（不能同时提供两者，因为这会导致歧义）

Parameters

大小 (整数或元组[整数] 或 元组[整数, 整数] 或 元组[整数, 整数, 整数], 可选) – 输出空间大小
scale_factor (float 或 Tuple[float] 或 Tuple[float, float] 或 Tuple[float, float, float], 可选) – 空间大小的乘数。如果是一个元组，则必须与输入大小匹配。
模式 (字符串, 可选) – 上采样算法：可以是 'nearest', 'linear', 'bilinear', 'bicubic' 和 'trilinear' 之一。默认值: 'nearest'
align_corners (布尔值, 可选) – 如果True，输入和输出张量的角像素对齐，从而保留这些像素的值。这仅在mode为'linear'、'bilinear'、'bicubic'或'trilinear'时有效。默认值：False
recompute_scale_factor (bool, 可选) – 重新计算用于插值计算的 scale_factor。如果 recompute_scale_factor 是 True，则必须传入 scale_factor 并且 scale_factor 用于计算输出 size。计算出的输出 size 将用于推断插值的新比例。请注意，当 scale_factor 为浮点数时，由于舍入和精度问题，它可能与重新计算的 scale_factor 不同。如果 recompute_scale_factor 是 False，则 size 或 scale_factor 将直接用于插值。

Shape:

输入: $(N, C, W_{in})$ , $(N, C, H_{in}, W_{in})$ 或 $(N, C, D_{in}, H_{in}, W_{in})$
输出: $(N, C, W_{out})$ , $(N, C, H_{out}, W_{out})$ 或 $(N, C, D_{out}, H_{out}, W_{out})$ , 其中

D_{out} = \left\lfloor D_{in} \times \text{scale\_factor} \right\rfloor

H_{out} = \left\lfloor H_{in} \times \text{scale\_factor} \right\rfloor

W_{out} = \left\lfloor W_{in} \times \text{scale\_factor} \right\rfloor

警告

使用 align_corners = True，线性插值模式（线性、双线性、双三次和三线性）不会按比例对齐输出和输入像素，因此输出值可能会依赖于输入大小。在 0.3.1 版本之前，这是这些模式的默认行为。自那以后，默认行为是 align_corners = False。请参见下面的具体示例，了解这如何影响输出。

注意

如果你想进行下采样/一般缩放，你应该使用 interpolate()。

示例：

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[1., 2.],
          [3., 4.]]]])

>>> m = nn.Upsample(scale_factor=2, mode='nearest')
>>> m(input)
tensor([[[[1., 1., 2., 2.],
          [1., 1., 2., 2.],
          [3., 3., 4., 4.],
          [3., 3., 4., 4.]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear')  # align_corners=False
>>> m(input)
tensor([[[[1.0000, 1.2500, 1.7500, 2.0000],
          [1.5000, 1.7500, 2.2500, 2.5000],
          [2.5000, 2.7500, 3.2500, 3.5000],
          [3.0000, 3.2500, 3.7500, 4.0000]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
>>> m(input)
tensor([[[[1.0000, 1.3333, 1.6667, 2.0000],
          [1.6667, 2.0000, 2.3333, 2.6667],
          [2.3333, 2.6667, 3.0000, 3.3333],
          [3.0000, 3.3333, 3.6667, 4.0000]]]])

>>> # 尝试在更大的张量中缩放相同的数据
>>> input_3x3 = torch.zeros(3, 3).view(1, 1, 3, 3)
>>> input_3x3[:, :, :2, :2].copy_(input)
tensor([[[[1., 2.],
          [3., 4.]]]])
>>> input_3x3
tensor([[[[1., 2., 0.],
          [3., 4., 0.],
          [0., 0., 0.]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear')  # align_corners=False
>>> # 注意左上角的值与小输入相同（除了边界）
>>> m(input_3x3)
tensor([[[[1.0000, 1.2500, 1.7500, 1.5000, 0.5000, 0.0000],
          [1.5000, 1.7500, 2.2500, 1.8750, 0.6250, 0.0000],
          [2.5000, 2.7500, 3.2500, 2.6250, 0.8750, 0.0000],
          [2.2500, 2.4375, 2.8125, 2.2500, 0.7500, 0.0000],
          [0.7500, 0.8125, 0.9375, 0.7500, 0.2500, 0.0000],
          [0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
>>> # 注意左上角的值现在已更改
>>> m(input_3x3)
tensor([[[[1.0000, 1.4000, 1.8000, 1.6000, 0.8000, 0.0000],
          [1.8000, 2.2000, 2.6000, 2.2400, 1.1200, 0.0000],
          [2.6000, 3.0000, 3.4000, 2.8800, 1.4400, 0.0000],
          [2.4000, 2.7200, 3.0400, 2.5600, 1.2800, 0.0000],
          [1.2000, 1.3600, 1.5200, 1.2800, 0.6400, 0.0000],
          [0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000]]]])