Размер карты признаков в сверточных нейронных сетях

Формула:outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1

Понимание-размера-карты-признаков-в-сверточных-нейронных-сетях

Сверточные-нейронные-сети-(CNN)-стали-основой-в-области-глубокого-обучения,-особенно-для-задач,-связанных-с-распознаванием-изображений-и-видео.-Критический-аспект-архитектуры-CNN-—-это-размер-карты-признаков,-который-трансформируется-на-каждом-слое-свертки.-Знание-того,-как-его-вычислить,-является-фундаментальным-для-построения-эффективных-моделей.

Формула

Размер-карты-признаков-после-слоя-свертки-в-CNN-определяется-по-следующей-формуле:

outputSize-=-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1

Вот-расшифровка-каждого-параметра:

inputSize:-Размер-входной-карты-признаков-(измеряется-в-пикселях).
kernelSize:-Размер-сверточного-ядра-(измеряется-в-пикселях).
padding:-Количество-нулевых-пикселей,-добавленных-к-границе-входа-(измеряется-в-пикселях).
stride:-Количество-пикселей,-на-которое-ядро-перемещается-по-входной-карте-признаков-(измеряется-в-пикселях).

Входные-данные-и-результаты

Входные-данные

inputSize:-Целое-число,-количество-пикселей-(px).
kernelSize:-Целое-число,-количество-пикселей-(px).
padding:-Целое-число,-количество-пикселей-(px).
stride:-Целое-число,-количество-пикселей-(px).

Результаты

outputSize:-Целое-число,-количество-пикселей-(px).

Пример-из-жизни

Рассмотрим-популярный-случай,-когда-у-вас-есть-входное-изображение-размером-224x224-пикселя.-Вы-применяете-слой-свертки-с-размером-ядра-3x3,-отступом-1-и-шагом-1.-Вот-как-рассчитывается-размер-карты-признаков:

inputSize:-224,-kernelSize:-3,-padding:-1,-stride:-1

Вставив-эти-значения-в-нашу-формулу:

outputSize-=-(224---3-+-2-*-1)-/-1-+-1-=-224

Результирующая-карта-признаков-все-еще-будет-размером-224x224-пикселя.

Проверка-данных

Для-того-чтобы-этот-расчет-работал,-все-параметры-ввода-должны-быть-больше-нуля.-Более-того,-убедитесь,-что-шаг-является-целым-числом,-которое-равномерно-делит-модифицированный-размер-входа-(inputSize---kernelSize-+-2-*-padding),-иначе-размер-карты-признаков-не-будет-целым-числом-и-формула-не-сработает.

Пример-значений:

inputSize=-32
kernelSize=-5
padding=-2
stride=-1
outputSize=-результирующий-размер-карты-признаков

Результат:

outputSize=-32

Резюме

Расчет-размера-карты-признаков-в-сверточных-нейронных-сетях-имеет-решающее-значение-для-архитектуры-и-оптимизации-модели.-Понимая-и-правильно-применяя-формулу-(inputSize---kernelSize-+-2-*-padding)-/-stride-+-1,-ученые-по-данным-и-инженеры-могут-разработать-более-эффективные-сети,-улучшая-производительность-и-эффективность.

Часто-задаваемые-вопросы-(FAQs)

Почему-используется-отступ?

Отступ-помогает-контролировать-пространственные-размеры-выходной-карты-признаков.-Он-особенно-полезен,-когда-вы-хотите-сохранить-размер-входа-в-выходе.

Что-происходит,-если-шаг-больше-одного?

Когда-шаг-больше-одного,-ядро-пропускает-пиксели-во-входном-изображении,-что-приводит-к-меньшему-размеру-выходной-карты-признаков.-Это-снижает-вычислительную-нагрузку.

Применима-ли-формула-только-для-квадратных-входов?

Нет,-формула-может-быть-скорректирована-для-неквадратных-входов,-применяя-ту-же-логику-отдельно к каждой размерности (высота и ширина).

Следуя этим советам и понимая каждый параметр, вы можете полностью использовать потенциал сверточных нейронных сетей и эффективно оптимизировать свои модели глубокого обучения.

Tags: Глубокое Обучение, Изображение Распознавание, Машинное Обучение

Размер ввода:
Размер ядра:
отступ:
шагать: