Keras 3 API 文档 / Keras 应用程序 / VGG16和VGG19

VGG16和VGG19

[source]

VGG16 function

keras.applications.VGG16(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name="vgg16",
)

实例化 VGG16 模型.

参考: - 用于大规模图像识别的非常深的卷积网络 (ICLR 2015)

对于图像分类用例,请参阅 此页面以获取详细示例.

对于迁移学习用例,请务必阅读 迁移学习与微调指南.

该模型的默认输入大小为 224x224.

注意:每个 Keras 应用程序期望特定类型的输入预处理. 对于 VGG16,请在将输入传递给模型之前调用 keras.applications.vgg16.preprocess_input. vgg16.preprocess_input 将输入图像从 RGB 转换为 BGR, 然后根据 ImageNet 数据集对每个颜色通道进行零中心化,但不进行缩放.

参数: include_top:是否在网络顶部包含 3 个全连接层. weights:可以是 None(随机初始化), "imagenet"(在 ImageNet 上预训练), 或要加载的权重文件路径. input_tensor:可选的 Keras 张量 (即 layers.Input() 的输出) 用作模型的图像输入. input_shape:可选的形状元组,仅在 include_topFalse 时指定 (否则输入形状 必须是 (224, 224, 3) (使用 channels_last 数据格式)或 (3, 224, 224)(使用 "channels_first" 数据格式). 它应具有恰好 3 个输入通道, 且宽度和高度应不小于 32. 例如 (200, 200, 3) 是一个有效值. pooling:当 include_topFalse 时用于特征提取的可选池化模式. - None 表示模型的输出将是 最后一个卷积块的 4D 张量输出. - avg 表示将对最后一个卷积块的输出应用全局平均池化, 因此模型的输出将是 2D 张量. - max 表示将应用全局最大池化. classes:可选的分类图像的类别数,仅在 include_topTrue 且 未指定 weights 参数时指定. classifier_activation:一个 str 或可调用对象.用于 "顶部" 层的激活函数. 除非 include_top=True,否则忽略.设置 classifier_activation=None 以返回 "顶部" 层的 logits. 加载预训练权重时,classifier_activation 只能是 None"softmax". name:模型的名称(字符串).

返回: 一个 Model 实例.


[source]

VGG19 function

keras.applications.VGG19(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name="vgg19",
)

实例化 VGG19 模型.

参考: - 用于大规模图像识别的非常深的卷积网络 (ICLR 2015)

对于图像分类用例,请参阅 此页面以获取详细示例.

对于迁移学习用例,请务必阅读 迁移学习与微调指南.

该模型的默认输入大小为 224x224.

注意:每个 Keras 应用程序期望特定类型的输入预处理. 对于 VGG19,请在将输入传递给模型之前调用 keras.applications.vgg19.preprocess_input. vgg19.preprocess_input 将输入图像从 RGB 转换为 BGR, 然后根据 ImageNet 数据集对每个颜色通道进行零中心化,但不进行缩放.

参数: include_top: 是否在网络顶部包含 3 个全连接层. weights: 可以是 None(随机初始化), "imagenet"(在 ImageNet 上预训练), 或要加载的权重文件路径. input_tensor: 可选的 Keras 张量 (即 layers.Input() 的输出) 用作模型的图像输入. input_shape: 可选的形状元组,仅在 include_topFalse 时指定 (否则输入形状必须是 (224, 224, 3) (使用 channels_last 数据格式)或 (3, 224, 224)(使用 "channels_first" 数据格式). 它应具有恰好 3 个输入通道, 且宽度和高度应不小于 32. 例如 (200, 200, 3) 是一个有效值. pooling: 当 include_topFalse 时用于特征提取的可选池化模式. - None 表示模型的输出将是 最后一个卷积块的 4D 张量输出. - avg 表示将对最后一个卷积块的输出应用全局平均池化, 因此模型的输出将是 2D 张量. - max 表示将应用全局最大池化. classes: 可选的分类图像类数,仅在 include_topTrue 且 未指定 weights 参数时指定. classifier_activation: 一个 str 或可调用对象.用于 "顶部" 层的激活函数. 除非 include_top=True,否则忽略.设置 classifier_activation=None 以返回 "顶部" 层的 logits. 加载预训练权重时,classifier_activation 只能是 None"softmax". name: 模型的名称(字符串).

返回: 一个模型实例.