Taille de la carte des caractéristiques dans les réseaux de neurones convolutionnels
Formule: Les-réseaux-de-neurones-convolutionnels-(CNN)-sont-devenus-un-pilier-dans-le-domaine-de-l'apprentissage-profond,-particulièrement-pour-les-tâches-impliquant-la-reconnaissance-d'images-et-de-vidéos.-Un-aspect-critique-de-l'architecture-des-CNN-est-la-taille-de-la-carte-des-caractéristiques,-qui-subit-une-transformation-à-chaque-couche-de-convolution.-Savoir-comment-la-calculer-est-fondamental-pour-construire-des-modèles-efficaces. La-taille-de-la-carte-des-caractéristiques-après-une-couche-de-convolution-dans-un-CNN-est-déterminée-à-l'aide-de-la-formule-suivante-: Voici-une-explication-de-chaque-paramètre-impliqué-: Considérez-un-cas-d'utilisation-populaire-où-vous-avez-une-image-d'entrée-de-taille-224x224-pixels.-Vous-appliquez-une-couche-de-convolution-avec-un-noyau-de-taille-3x3,-un-padding-de-1,-et-un-stride-de-1.-Voici-comment-vous-calculez-la-taille-de-la-carte-des-caractéristiques-: En-insérant-ces-valeurs-dans-notre-formule-: La-carte-des-caractéristiques-résultante-sera-toujours-de-224x224-pixels. Pour-que-ce-calcul-fonctionne,-tous-les-paramètres-d'entrée-doivent-être-supérieurs-à-zéro.-De-plus,-assurez-vous-que-le-stride-est-un-entier-qui-divise-uniformément-la-taille-d'entrée-modifiée-(inputSize---kernelSize-+-2-*-padding),-sinon-la-taille-de-la-carte-des-caractéristiques-ne-sera-pas-un-entier-et-la-formule-ne-fonctionnera-pas. Calculer-la-taille-de-la-carte-des-caractéristiques-dans-les-réseaux-de-neurones-convolutionnels-est-crucial-pour-l'architecture-et-l'optimisation-du-modèle.-En-comprenant-et-en-utilisant-correctement-la-formule-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1,-les-scientifiques-des-données-et-les-ingénieurs-peuvent-concevoir-des-réseaux-plus-efficaces,-améliorant-la-performance-et-l'efficacité. Le-padding-aide-à-contrôler-les-dimensions-spatiales-de-la-carte-des-caractéristiques-de-sortie.-Il-est-particulièrement-utile-lorsque-vous-voulez-préserver-la-taille-d'entrée-dans-la-sortie. Lorsque-le-stride-est-supérieur-à-un,-le-noyau-saute-des-pixels-dans-l'entrée,-conduisant-à-une-carte-des-caractéristiques-de-sortie-plus-petite.-Cela-réduit-la-charge-computationnelle. Non,-la-formule-peut-être-ajustée-pour-les-entrées-non-carrées-en-appliquant-la-même-logique-à-chaque-dimension-(hauteur-et-largeur)-séparément. En-suivant ces directives et en comprenant chaque paramètre, vous pouvez exploiter tout le potentiel des réseaux de neurones convolutionnels et optimiser vos modèles d'apprentissage profond de manière efficiente.outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1
Comprendre-La-Taille-De-La-Carte-des-Caractéristiques-Dans-Les-Réseaux-Neurones-Convolutionnels
La-Formule
outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1
inputSize
-:-La-taille-de-la-carte-des-caractéristiques-d'entrée-(mesurée-en-pixels).kernelSize
-:-La-taille-du-noyau-de-convolution-(mesurée-en-pixels).padding
-:-Le-nombre-de-pixels-nuls-ajoutés-à-la-bordure-de-l'entrée-(mesuré-en-pixels).stride
-:-Le-nombre-de-pixels-par-lesquels-le-noyau-se-déplace-sur-la-carte-des-caractéristiques-d'entrée-(mesuré-en-pixels).Entrées-et-Sorties
Entrées
inputSize
-:-Entier,-nombre-de-pixels-(px).kernelSize
-:-Entier,-nombre-de-pixels-(px).padding
-:-Entier,-nombre-de-pixels-(px).stride
-:-Entier,-nombre-de-pixels-(px).Sortie
outputSize
-:-Entier,-nombre-de-pixels-(px).Exemple-de-La-Vie-Courante
inputSize-:-224,-kernelSize-:-3,-padding-:-1,-stride-:-1
outputSize-=-(224---3-+-2-*-1)-/-1-+-1-=-224
Validation-des-Données
Exemples-de-Valeurs-:
inputSize
-=-32kernelSize
-=-5padding
-=-2stride
-=-1outputSize
-=-taille-de-la-carte-des-caractéristiques-resultanteSortie-:
outputSize
-=-32Résumé
Questions-Fréquemment-Posées-(FAQ)
Pourquoi-utilise-t-on-le-padding-?
Que-se-passe-t-il-si-le-stride-est-supérieur-à-un-?
La-formule-s'applique-t-elle-uniquement-aux-entrées-carrées-?
Tags: L'apprentissage en profondeur, Reconnaissance d'image, Apprentissage automatique