tamaño del mapa de características en redes neuronales convolucionales

Fórmula:outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1

Entendiendo-el-Tamaño-del-Mapa-de-Características-en-Redes-Neuronales-Convolucionales

Las-Redes-Neuronales-Convolucionales-(CNNs)-se-han-convertido-en-un-pilar-en-el-campo-del-aprendizaje-profundo,-especialmente-para-tareas-que-involucran-el-reconocimiento-de-imágenes-y-videos.-Un-aspecto-crítico-de-la-arquitectura-de-las-CNN-es-el-tamaño-del-mapa-de-características,-que-se-transforma-en-cada-capa-convolucional.-Saber-cómo-calcularlo-es-fundamental-para-construir-modelos-efectivos.

La-Fórmula

El-tamaño-del-mapa-de-características-después-de-una-capa-convolucional-en-una-CNN-se-determina-utilizando-la-siguiente-fórmula:

outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1

A-continuación-se-desglosa-cada-parámetro-involucrado:

inputSize:-El-tamaño-del-mapa-de-características-de-entrada-(medido-en-píxeles).
kernelSize:-El-tamaño-del-kernel-convolucional-(medido-en-píxeles).
padding:-El-número-de-píxeles-de-relleno-agregados-al-borde-de-la-entrada-(medido-en-píxeles).
stride:-El-número-de-píxeles-que-se-desplaza-el-kernel-a-través-del-mapa-de-características-de-entrada-(medido-en-píxeles).

Entradas-y-Salidas

Entradas

inputSize:-Entero,-número-de-píxeles-(px).
kernelSize:-Entero,-número-de-píxeles-(px).
padding:-Entero,-número-de-píxeles-(px).
stride:-Entero,-número-de-píxeles-(px).

Salida

outputSize:-Entero,-número-de-píxeles-(px).

Ejemplo-de-la-Vida-Real

Considere-un-caso-de-uso-popular-donde-tiene-una-imagen-de-entrada-de-tamaño-224x224-píxeles.-Aplica-una-capa-convolucional-con-un-kernel-de-tamaño-3x3,-relleno-de-1-y-un-stride-de-1.-Así-es-como-se-calcula-el-tamaño-del-mapa-de-características:

inputSize:-224,-kernelSize:-3,-padding:-1,-stride:-1

Insertando-estos-valores-en-nuestra-fórmula:

outputSize-=-(224---3-+-2-*-1)-/-1-+-1-=-224

El-mapa-de-características-resultante-seguirá-siendo-de-224x224-píxeles.

Validación-de-Datos

Para-que-este-cálculo-funcione,-todos-los-parámetros-de-entrada-deben-ser-mayores-a-cero.-Además,-asegúrese-de-que-el-stride-sea-un-entero-que-divida-el-tamaño-de-entrada-modificado-(inputSize---kernelSize-+-2-*-padding)-uniformemente,-de-lo-contrario,-el-tamaño-del-mapa-de-características-no-será-un-entero-y-la-fórmula-no-funcionará.

Valores-de-Ejemplo:

inputSize-=-32
kernelSize-=-5
padding-=-2
stride-=-1
outputSize-=-tamaño-del-mapa-de-características-resultante

Salida:

outputSize-=-32

Resumen

Calcular-el-tamaño-del-mapa-de-características-en-redes-neuronales-convolucionales-es-crucial-para-la-arquitectura-y-optimización-del-modelo.-Al-entender-y-emplear-correctamente-la-fórmula-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1,-los-científicos-de-datos-e-ingenieros-pueden-diseñar-redes-más-eficientes,-mejorando-el-rendimiento-y-la-eficacia.

Preguntas-Frecuentes-(FAQs)

¿Por-qué-se-usa-el-padding?

El-padding-ayuda-a-controlar-las-dimensiones-espaciales-del-mapa-de-características-de-salida.-Es-particularmente-útil-cuando-se-desea-preservar-el-tamaño-de-entrada-en-la-salida.

¿Qué-pasa-si-el-stride-es-mayor-a-uno?

Cuando-el-stride-es-mayor-a-uno,-el-kernel-se-salta-píxeles-en-la-entrada,-lo-que-lleva-a-un-mapa-de-características-de-salida-más-pequeño.-Esto-reduce-la-carga-computacional.

¿La-fórmula-solo-aplica-a-entradas-cuadradas?

No,-la-fórmula-se-puede-ajustar-para-entradas-no-cuadradas-aplicando-la-misma-lógica-a-cada-dimensión-(alto-y-ancho)-por separado.

Siguiendo estas pautas y entendiendo cada parámetro, puede aprovechar todo el potencial de las Redes Neuronales Convolucionales y optimizar sus modelos de aprendizaje profundo de manera eficiente.

Tags: Aprendizaje profundo, Reconocimiento de imagen, Aprendizaje Automático

Tamaño de entrada:
Tamaño de kernel:
Relleno:
zancada: