Размер карты признаков в сверточных нейронных сетях
Формула: Сверточные-нейронные-сети-(CNN)-стали-основой-в-области-глубокого-обучения,-особенно-для-задач,-связанных-с-распознаванием-изображений-и-видео.-Критический-аспект-архитектуры-CNN-—-это-размер-карты-признаков,-который-трансформируется-на-каждом-слое-свертки.-Знание-того,-как-его-вычислить,-является-фундаментальным-для-построения-эффективных-моделей. Размер-карты-признаков-после-слоя-свертки-в-CNN-определяется-по-следующей-формуле: Вот-расшифровка-каждого-параметра: Рассмотрим-популярный-случай,-когда-у-вас-есть-входное-изображение-размером-224x224-пикселя.-Вы-применяете-слой-свертки-с-размером-ядра-3x3,-отступом-1-и-шагом-1.-Вот-как-рассчитывается-размер-карты-признаков: Вставив-эти-значения-в-нашу-формулу: Результирующая-карта-признаков-все-еще-будет-размером-224x224-пикселя. Для-того-чтобы-этот-расчет-работал,-все-параметры-ввода-должны-быть-больше-нуля.-Более-того,-убедитесь,-что-шаг-является-целым-числом,-которое-равномерно-делит-модифицированный-размер-входа-(inputSize---kernelSize-+-2-*-padding),-иначе-размер-карты-признаков-не-будет-целым-числом-и-формула-не-сработает. Расчет-размера-карты-признаков-в-сверточных-нейронных-сетях-имеет-решающее-значение-для-архитектуры-и-оптимизации-модели.-Понимая-и-правильно-применяя-формулу-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1,-ученые-по-данным-и-инженеры-могут-разработать-более-эффективные-сети,-улучшая-производительность-и-эффективность. Отступ-помогает-контролировать-пространственные-размеры-выходной-карты-признаков.-Он-особенно-полезен,-когда-вы-хотите-сохранить-размер-входа-в-выходе. Когда-шаг-больше-одного,-ядро-пропускает-пиксели-во-входном-изображении,-что-приводит-к-меньшему-размеру-выходной-карты-признаков.-Это-снижает-вычислительную-нагрузку. Нет,-формула-может-быть-скорректирована-для-неквадратных-входов,-применяя-ту-же-логику-отдельно к каждой размерности (высота и ширина). Следуя этим советам и понимая каждый параметр, вы можете полностью использовать потенциал сверточных нейронных сетей и эффективно оптимизировать свои модели глубокого обучения.outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1
Понимание-размера-карты-признаков-в-сверточных-нейронных-сетях
Формула
outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1
inputSize
:-Размер-входной-карты-признаков-(измеряется-в-пикселях).kernelSize
:-Размер-сверточного-ядра-(измеряется-в-пикселях).padding
:-Количество-нулевых-пикселей,-добавленных-к-границе-входа-(измеряется-в-пикселях).stride
:-Количество-пикселей,-на-которое-ядро-перемещается-по-входной-карте-признаков-(измеряется-в-пикселях).Входные-данные-и-результаты
Входные-данные
inputSize
:-Целое-число,-количество-пикселей-(px).kernelSize
:-Целое-число,-количество-пикселей-(px).padding
:-Целое-число,-количество-пикселей-(px).stride
:-Целое-число,-количество-пикселей-(px).Результаты
outputSize
:-Целое-число,-количество-пикселей-(px).Пример-из-жизни
inputSize:-224,-kernelSize:-3,-padding:-1,-stride:-1
outputSize-=-(224---3-+-2-*-1)-/-1-+-1-=-224
Проверка-данных
Пример-значений:
inputSize
=-32kernelSize
=-5padding
=-2stride
=-1outputSize
=-результирующий-размер-карты-признаковРезультат:
outputSize
=-32Резюме
Часто-задаваемые-вопросы-(FAQs)
Почему-используется-отступ?
Что-происходит,-если-шаг-больше-одного?
Применима-ли-формула-только-для-квадратных-входов?
Tags: Глубокое Обучение, Изображение Распознавание, Машинное Обучение