Keras 3 API 文档 / 层 API / 卷积层 / Conv2DTranspose层

Conv2DTranspose层

[source]

Conv2DTranspose class

keras.layers.Conv2DTranspose(
    filters,
    kernel_size,
    strides=(1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1),
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

2D 转置卷积层.

转置卷积的需求通常来自于希望使用一种与普通卷积方向相反的变换,即从具有某种卷积输出形状的东西转换为具有其输入形状的东西,同时保持与该卷积兼容的连接模式.

参数: filters: int, 输出空间的维度(转置卷积中的滤波器数量). kernel_size: int 或 tuple/list 包含 1 个整数,指定转置卷积窗口的大小. strides: int 或 tuple/list 包含 1 个整数,指定转置卷积的步长长度.strides > 1dilation_rate > 1 不兼容. padding: string, 可以是 "valid""same"(不区分大小写)."valid" 表示不填充."same" 会导致在输入的左右或上下均匀填充.当 padding="same"strides=1 时,输出与输入大小相同. data_format: string, 可以是 "channels_last""channels_first".输入中维度的顺序."channels_last" 对应输入形状为 (batch_size, height, width, channels),而 "channels_first" 对应输入形状为 (batch_size, channels, height, width).它默认为 ~/.keras/keras.json 中找到的 image_data_format 值.如果你从未设置它,那么它将是 "channels_last". dilation_rate: int 或 tuple/list 包含 1 个整数,指定用于扩张转置卷积的扩张率. activation: 激活函数.如果为 None,则不应用激活. use_bias: bool, 如果为 True,则将偏置添加到输出中. kernel_initializer: 卷积核的初始化器.如果为 None,将使用默认初始化器 ("glorot_uniform"). bias_initializer: 偏置向量的初始化器.如果为 None,将使用默认初始化器 ("zeros"). kernel_regularizer: 卷积核的可选正则化器. bias_regularizer: 偏置向量的可选正则化器. activity_regularizer: 输出的可选正则化函数. kernel_constraint: 可选的投影函数,在 Optimizer 更新卷积核后应用(例如,用于实现层权重的范数约束或值约束).该函数必须接受未投影的变量作为输入,并返回投影的变量(必须具有相同的形状).在异步分布式训练中使用约束不安全. bias_constraint: 可选的投影函数,在 Optimizer 更新偏置后应用.

输入形状:

  • 如果 data_format="channels_last": 形状为 (batch_size, height, width, channels) 的 4D 张量
  • 如果 data_format="channels_first": 形状为 (batch_size, channels, height, width) 的 4D 张量

输出形状:

  • 如果 data_format="channels_last": 形状为 (batch_size, new_height, new_width, filters) 的 4D 张量
  • 如果 data_format="channels_first": 形状为 (batch_size, filters, new_height, new_width) 的 4D 张量

返回: 表示 activation(conv2d_transpose(inputs, kernel) + bias) 的 4D 张量.

引发: ValueError: 当 strides > 1dilation_rate > 1 同时存在时.

参考文献: - 深度学习的卷积算法指南 - 反卷积网络

示例:

>>> x = np.random.rand(4, 10, 8, 128)
>>> y = keras.layers.Conv2DTranspose(32, 2, 2, activation='relu')(x)
>>> print(y.shape)
(4, 20, 16, 32)