कंवोल्यूशनल न्यूरल नेटवर्क्स में फीचर मैप आकार

सूत्र:outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1

संकल्पनात्मक न्यूरल नेटवर्क में विशेषता मानचित्र के आकार को समझना

कॉन्वोल्यूशनल न्यूरल नेटवर्क (CNNs) गहरे शिक्षण के क्षेत्र में एक मुख्य आधार बन गए हैं, विशेष रूप से छवि और वीडियो पहचान से संबंधित कार्यों के लिए। CNN आर्किटेक्चर का एक महत्वपूर्ण पहलू विशेषता मानचित्र का आकार है, जो प्रत्येक कॉन्वोल्यूशनल परत पर परिवर्तन करता है। इसे कैसे गणना करना है, यह प्रभावी मॉडलों को बनाने के लिए मौलिक है।

सूत्र

एक सीएनएन में संकुचनात्मक परत के बाद विशेषता मानचित्र का आकार निम्नलिखित सूत्र का उपयोग करके निर्धारित किया जाता है:

outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1

यहाँ प्रत्येक मूल्यांकन में शामिल पैरामीटर का एक विवरण है:

इनपुट आकारइनपुट फ़ीचर मानचित्र का आकार (पिक्सेल में मापा गया)।
कर्नेलसाइज़संवहनात्मक कर्नेल का आकार (पिक्सेल में मापा गया)।
पैडिंगइनपुट के_border_ में जोड़े गए जीरो-पिक्सेल की संख्या (पिक्सेल में मापी गई)।
चालकर्नेल द्वारा इनपुट फीचर मानचित्र के पार चलने के लिए पिक्सल की संख्या (पिक्सल में मापी गई)।

इनपुट और आउटपुट

इनपुट

इनपुट आकारपूर्णांक, पिक्सल (px) की संख्या।
कर्नेलसाइज़पूर्णांक, पिक्सल (px) की संख्या।
पैडिंगपूर्णांक, पिक्सल (px) की संख्या।
चालपूर्णांक, पिक्सल (px) की संख्या।

उत्पादन

आउटपुट आकारपूर्णांक, पिक्सल (px) की संख्या।

वास्तविक जीवन का उदाहरण

एक सामान्य उपयोग मामले पर विचार करें जहां आपके पास 224x224 पिक्सल आकार का एक इनपुट चित्र है। आप 3x3 का कर्नेल आकार, 1 का पैडिंग और 1 का स्ट्राइड के साथ एक महाप्रवेश (कॉन्वोल्यूशन) परत लागू करते हैं। यहां बताया गया है कि आप फीचर मानचित्र का आकार कैसे निकालते हैं:

inputSize: 224, kernelSize: 3, padding: 1, stride: 1

हमारे फार्मूले में इन मानों को डालना:

outputSize = (224 - 3 + 2 * 1) / 1 + 1 = 224

परिणामी विशेषता मानचित्र अभी भी 224x224 पिक्सल होगा।

डेटा सत्यापन

इस गणना के काम करने के लिए, सभी इनपुट पैरामीटर को शून्य से बड़ा होना चाहिए। इसके अलावा, सुनिश्चित करें कि स्ट्राइड एक पूर्णांक है जो संशोधित इनपुट आकार (inputSize - kernelSize + 2 * padding) को समान रूप से विभाजित करता है, अन्यथा फीचर मैप का आकार एक पूर्णांक नहीं होगा और सूत्र टूट जाएगा।

उदाहरण मान:

इनपुट आकार= 32
कर्नेलसाइज़= 5
पैडिंग= 2
चाल= 1
आउटपुट आकार= परिणामस्वरूप फीचर मानचित्र आकार

{

आउटपुट आकार= 32

सारांश

कन्वोल्यूशनल न्यूरल नेटवर्क में फीचर मैप का आकार निकालना मॉडल आर्किटेक्चर और ऑप्टिमाइजेशन के लिए महत्वपूर्ण है। फ़ॉर्मूला (inputSize - kernelSize + 2 * padding) / stride + 1 को समझकर और सही ढंग से लागू करके, डेटा वैज्ञानिक और इंजीनियर अधिक कुशल नेटवर्क डिज़ाइन कर सकते हैं, जिससे प्रदर्शन और प्रभावशीलता में सुधार होता है।

अक्सर पूछे जाने वाले प्रश्न (FAQs)

padding का उपयोग क्यों किया जाता है?

पैडिंग आउटपुट फ़ीचर मैप के स्थानिक आयामों को नियंत्रित करने में मदद करता है। यह विशेष रूप से उपयोगी है जब आप आउटपुट में इनपुट आकार को संरक्षित करना चाहते हैं।

अगर स्ट्राइड एक से बड़ा है तो क्या होता है?

जब स्ट्राइड एक से बड़ा होता है, तो कर्नेल इनपुट में पिक्सल छोड़ देता है, जिससे आउटपुट फीचर मैप छोटा हो जाता है। इससे कंप्यूटेशनल लोड कम होता है।

क्या यह सूत्र केवल वर्ग इनपुट पर लागू होता है?

नहीं, सूत्र को गैर-चौकोर इनपुट के लिए प्रत्येक आयाम (ऊँचाई और चौड़ाई) पर अलग-अलग उसी तार्किक का उपयोग करके समायोजित किया जा सकता है।

इन दिशानिर्देशों का पालन करके और प्रत्येक पैरामीटर को समझकर, आप संयोजनात्मक तंत्रिका नेटवर्क की पूरी क्षमता का उपयोग कर सकते हैं और अपने गहरे शिक्षण मॉडलों को कुशलता से अनुकूलित कर सकते हैं।

Tags: मशीन लर्निंग

इनपुट आकार:
कर्नेल साइज:
पैडिंग:
बढता कदम: