कंवोल्यूशनल न्यूरल नेटवर्क्स में फीचर मैप आकार

उत्पादन: कैलकुलेट दबाएँ

सूत्र:outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1

संकल्पनात्मक न्यूरल नेटवर्क में विशेषता मानचित्र के आकार को समझना

कॉन्वोल्यूशनल न्यूरल नेटवर्क (CNNs) गहरे शिक्षण के क्षेत्र में एक मुख्य आधार बन गए हैं, विशेष रूप से छवि और वीडियो पहचान से संबंधित कार्यों के लिए। CNN आर्किटेक्चर का एक महत्वपूर्ण पहलू विशेषता मानचित्र का आकार है, जो प्रत्येक कॉन्वोल्यूशनल परत पर परिवर्तन करता है। इसे कैसे गणना करना है, यह प्रभावी मॉडलों को बनाने के लिए मौलिक है।

सूत्र

एक सीएनएन में संकुचनात्मक परत के बाद विशेषता मानचित्र का आकार निम्नलिखित सूत्र का उपयोग करके निर्धारित किया जाता है:

outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1

यहाँ प्रत्येक मूल्यांकन में शामिल पैरामीटर का एक विवरण है:

इनपुट और आउटपुट

इनपुट

उत्पादन

वास्तविक जीवन का उदाहरण

एक सामान्य उपयोग मामले पर विचार करें जहां आपके पास 224x224 पिक्सल आकार का एक इनपुट चित्र है। आप 3x3 का कर्नेल आकार, 1 का पैडिंग और 1 का स्ट्राइड के साथ एक महाप्रवेश (कॉन्वोल्यूशन) परत लागू करते हैं। यहां बताया गया है कि आप फीचर मानचित्र का आकार कैसे निकालते हैं:

inputSize: 224, kernelSize: 3, padding: 1, stride: 1

हमारे फार्मूले में इन मानों को डालना:

outputSize = (224 - 3 + 2 * 1) / 1 + 1 = 224

परिणामी विशेषता मानचित्र अभी भी 224x224 पिक्सल होगा।

डेटा सत्यापन

इस गणना के काम करने के लिए, सभी इनपुट पैरामीटर को शून्य से बड़ा होना चाहिए। इसके अलावा, सुनिश्चित करें कि स्ट्राइड एक पूर्णांक है जो संशोधित इनपुट आकार (inputSize - kernelSize + 2 * padding) को समान रूप से विभाजित करता है, अन्यथा फीचर मैप का आकार एक पूर्णांक नहीं होगा और सूत्र टूट जाएगा।

उदाहरण मान:

{

सारांश

कन्वोल्यूशनल न्यूरल नेटवर्क में फीचर मैप का आकार निकालना मॉडल आर्किटेक्चर और ऑप्टिमाइजेशन के लिए महत्वपूर्ण है। फ़ॉर्मूला (inputSize - kernelSize + 2 * padding) / stride + 1 को समझकर और सही ढंग से लागू करके, डेटा वैज्ञानिक और इंजीनियर अधिक कुशल नेटवर्क डिज़ाइन कर सकते हैं, जिससे प्रदर्शन और प्रभावशीलता में सुधार होता है।

अक्सर पूछे जाने वाले प्रश्न (FAQs)

padding का उपयोग क्यों किया जाता है?

पैडिंग आउटपुट फ़ीचर मैप के स्थानिक आयामों को नियंत्रित करने में मदद करता है। यह विशेष रूप से उपयोगी है जब आप आउटपुट में इनपुट आकार को संरक्षित करना चाहते हैं।

अगर स्ट्राइड एक से बड़ा है तो क्या होता है?

जब स्ट्राइड एक से बड़ा होता है, तो कर्नेल इनपुट में पिक्सल छोड़ देता है, जिससे आउटपुट फीचर मैप छोटा हो जाता है। इससे कंप्यूटेशनल लोड कम होता है।

क्या यह सूत्र केवल वर्ग इनपुट पर लागू होता है?

नहीं, सूत्र को गैर-चौकोर इनपुट के लिए प्रत्येक आयाम (ऊँचाई और चौड़ाई) पर अलग-अलग उसी तार्किक का उपयोग करके समायोजित किया जा सकता है।

इन दिशानिर्देशों का पालन करके और प्रत्येक पैरामीटर को समझकर, आप संयोजनात्मक तंत्रिका नेटवर्क की पूरी क्षमता का उपयोग कर सकते हैं और अपने गहरे शिक्षण मॉडलों को कुशलता से अनुकूलित कर सकते हैं।

Tags: मशीन लर्निंग