Taille de la carte des caractéristiques dans les réseaux de neurones convolutionnels

Formule:outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1

Comprendre-La-Taille-De-La-Carte-des-Caractéristiques-Dans-Les-Réseaux-Neurones-Convolutionnels

Les-réseaux-de-neurones-convolutionnels-(CNN)-sont-devenus-un-pilier-dans-le-domaine-de-l'apprentissage-profond,-particulièrement-pour-les-tâches-impliquant-la-reconnaissance-d'images-et-de-vidéos.-Un-aspect-critique-de-l'architecture-des-CNN-est-la-taille-de-la-carte-des-caractéristiques,-qui-subit-une-transformation-à-chaque-couche-de-convolution.-Savoir-comment-la-calculer-est-fondamental-pour-construire-des-modèles-efficaces.

La-Formule

La-taille-de-la-carte-des-caractéristiques-après-une-couche-de-convolution-dans-un-CNN-est-déterminée-à-l'aide-de-la-formule-suivante-:

outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1

Voici-une-explication-de-chaque-paramètre-impliqué-:

inputSize-:-La-taille-de-la-carte-des-caractéristiques-d'entrée-(mesurée-en-pixels).
kernelSize-:-La-taille-du-noyau-de-convolution-(mesurée-en-pixels).
padding-:-Le-nombre-de-pixels-nuls-ajoutés-à-la-bordure-de-l'entrée-(mesuré-en-pixels).
stride-:-Le-nombre-de-pixels-par-lesquels-le-noyau-se-déplace-sur-la-carte-des-caractéristiques-d'entrée-(mesuré-en-pixels).

Entrées-et-Sorties

Entrées

inputSize-:-Entier,-nombre-de-pixels-(px).
kernelSize-:-Entier,-nombre-de-pixels-(px).
padding-:-Entier,-nombre-de-pixels-(px).
stride-:-Entier,-nombre-de-pixels-(px).

Sortie

outputSize-:-Entier,-nombre-de-pixels-(px).

Exemple-de-La-Vie-Courante

Considérez-un-cas-d'utilisation-populaire-où-vous-avez-une-image-d'entrée-de-taille-224x224-pixels.-Vous-appliquez-une-couche-de-convolution-avec-un-noyau-de-taille-3x3,-un-padding-de-1,-et-un-stride-de-1.-Voici-comment-vous-calculez-la-taille-de-la-carte-des-caractéristiques-:

inputSize-:-224,-kernelSize-:-3,-padding-:-1,-stride-:-1

En-insérant-ces-valeurs-dans-notre-formule-:

outputSize-=-(224---3-+-2-*-1)-/-1-+-1-=-224

La-carte-des-caractéristiques-résultante-sera-toujours-de-224x224-pixels.

Validation-des-Données

Pour-que-ce-calcul-fonctionne,-tous-les-paramètres-d'entrée-doivent-être-supérieurs-à-zéro.-De-plus,-assurez-vous-que-le-stride-est-un-entier-qui-divise-uniformément-la-taille-d'entrée-modifiée-(inputSize---kernelSize-+-2-*-padding),-sinon-la-taille-de-la-carte-des-caractéristiques-ne-sera-pas-un-entier-et-la-formule-ne-fonctionnera-pas.

Exemples-de-Valeurs-:

inputSize-=-32
kernelSize-=-5
padding-=-2
stride-=-1
outputSize-=-taille-de-la-carte-des-caractéristiques-resultante

Sortie-:

outputSize-=-32

Résumé

Calculer-la-taille-de-la-carte-des-caractéristiques-dans-les-réseaux-de-neurones-convolutionnels-est-crucial-pour-l'architecture-et-l'optimisation-du-modèle.-En-comprenant-et-en-utilisant-correctement-la-formule-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1,-les-scientifiques-des-données-et-les-ingénieurs-peuvent-concevoir-des-réseaux-plus-efficaces,-améliorant-la-performance-et-l'efficacité.

Questions-Fréquemment-Posées-(FAQ)

Pourquoi-utilise-t-on-le-padding-?

Le-padding-aide-à-contrôler-les-dimensions-spatiales-de-la-carte-des-caractéristiques-de-sortie.-Il-est-particulièrement-utile-lorsque-vous-voulez-préserver-la-taille-d'entrée-dans-la-sortie.

Que-se-passe-t-il-si-le-stride-est-supérieur-à-un-?

Lorsque-le-stride-est-supérieur-à-un,-le-noyau-saute-des-pixels-dans-l'entrée,-conduisant-à-une-carte-des-caractéristiques-de-sortie-plus-petite.-Cela-réduit-la-charge-computationnelle.

La-formule-s'applique-t-elle-uniquement-aux-entrées-carrées-?

Non,-la-formule-peut-être-ajustée-pour-les-entrées-non-carrées-en-appliquant-la-même-logique-à-chaque-dimension-(hauteur-et-largeur)-séparément.

En-suivant ces directives et en comprenant chaque paramètre, vous pouvez exploiter tout le potentiel des réseaux de neurones convolutionnels et optimiser vos modèles d'apprentissage profond de manière efficiente.

Tags: L'apprentissage en profondeur, Reconnaissance d'image, Apprentissage automatique

Taille d'entrée:
Taille du noyau:
Rembourrage:
Foulée: