Keras 3 API 文档 / 层 API / 卷积层 / 深度可分离卷积1D层

深度可分离卷积1D层

[source]

DepthwiseConv1D class

keras.layers.DepthwiseConv1D(
    kernel_size,
    strides=1,
    padding="valid",
    depth_multiplier=1,
    data_format=None,
    dilation_rate=1,
    activation=None,
    use_bias=True,
    depthwise_initializer="glorot_uniform",
    bias_initializer="zeros",
    depthwise_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    depthwise_constraint=None,
    bias_constraint=None,
    **kwargs
)

一维深度卷积层.

深度卷积是一种卷积类型,其中每个输入通道与不同的核(称为深度核)进行卷积.你可以将深度卷积理解为深度可分离卷积的第一步.

它通过以下步骤实现:

  • 将输入拆分为单独的通道.
  • 使用 depth_multiplier 个输出通道将每个通道与单独的深度核进行卷积.
  • 沿通道轴连接卷积后的输出.

与常规的一维卷积不同,深度卷积不会在不同的输入通道之间混合信息.

depth_multiplier 参数决定了对一个输入通道应用多少个滤波器.因此,它控制了在深度卷积步骤中每个输入通道生成的输出通道数量.

参数: kernel_size: 整数或包含1个整数的元组/列表,指定深度卷积窗口的大小. strides: 整数或包含1个整数的元组/列表,指定卷积的步长.strides > 1dilation_rate > 1 不兼容. padding: 字符串,"valid""same"(不区分大小写)."valid" 表示不填充."same" 会在输入的左右或上下均匀填充.当 padding="same"strides=1 时,输出大小与输入相同. depth_multiplier: 每个输入通道的深度卷积输出通道数量.深度卷积输出通道的总数将等于 input_channel * depth_multiplier. data_format: 字符串,"channels_last""channels_first".输入中维度的顺序."channels_last" 对应形状为 (batch, steps, features) 的输入,而 "channels_first" 对应形状为 (batch, features, steps) 的输入.它默认为 ~/.keras/keras.json 中的 image_data_format 值.如果你从未设置它,那么它将是 "channels_last". dilation_rate: 整数或包含1个整数的元组/列表,指定用于扩张卷积的扩张率. activation: 激活函数.如果为 None,则不应用激活. use_bias: 布尔值,如果为 True,则将偏置添加到输出中. depthwise_initializer: 卷积核的初始化器.如果为 None,将使用默认初始化器("glorot_uniform"). bias_initializer: 偏置向量的初始化器.如果为 None,将使用默认初始化器("zeros"). depthwise_regularizer: 卷积核的可选正则化器. bias_regularizer: 偏置向量的可选正则化器. activity_regularizer: 输出的可选正则化函数. depthwise_constraint: 可选投影函数,在 Optimizer 更新后应用于核.(例如,用于实现层权重的范数约束或值约束).该函数必须接受未投影变量作为输入,并返回具有相同形状的投影变量.在进行异步分布式训练时不安全使用约束. bias_constraint: 可选投影函数,在 Optimizer 更新后应用于偏置.

输入形状:

  • 如果 data_format="channels_last": 形状为 (batch_shape, steps, channels) 的3D张量
  • 如果 data_format="channels_first": 形状为 (batch_shape, channels, steps) 的3D张量

输出形状:

  • 如果 data_format="channels_last": 形状为 (batch_shape, new_steps, channels * depth_multiplier) 的3D张量
  • 如果 data_format="channels_first": 形状为 (batch_shape, channels * depth_multiplier, new_steps) 的3D张量

返回: 表示 activation(depthwise_conv1d(inputs, kernel) + bias) 的3D张量.

引发: ValueError: 当 strides > 1dilation_rate > 1 时.

示例:

>>> x = np.random.rand(4, 10, 12)
>>> y = keras.layers.DepthwiseConv1D(3, 3, 2, activation='relu')(x)
>>> print(y.shape)
(4, 4, 36)