ukuran peta fitur dalam jaringan saraf konvolusional
Rumus:outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1
Memahami Ukuran Pemetaan Fitur dalam Jaringan Syaraf Tiruan Konvolusional
Jaringan Syaraf Tiruan Konvolusional (CNN) telah menjadi landasan dalam bidang pembelajaran mendalam, khususnya untuk tugas yang melibatkan pengenalan gambar dan video. Aspek penting dari arsitektur CNN adalah ukuran peta fitur, yang mengalami transformasi pada setiap lapisan konvolusional. Mengetahui cara menghitungnya merupakan hal mendasar untuk membangun model yang efektif.
Rumus
Ukuran peta fitur setelah lapisan konvolusional dalam CNN ditentukan menggunakan rumus berikut:
outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1
Berikut adalah rincian setiap parameter yang terlibat:
inputSize
: Ukuran peta fitur input (diukur dalam piksel).kernelSize
: Ukuran kernel konvolusional (diukur dalam piksel).padding
: Jumlah piksel nol yang ditambahkan ke batas input (diukur dalam piksel).stride
: Jumlah piksel yang digunakan kernel untuk bergerak melintasi peta fitur input (diukur dalam piksel).
Input dan Output
Input
inputSize
: Integer, jumlah piksel (px).kernelSize
: Integer, jumlah piksel (px).padding
: Integer, jumlah piksel (px).stride
: Integer, jumlah piksel (px).
Output
outputSize
: Integer, jumlah piksel (px).
Contoh di Dunia Nyata
Pertimbangkan kasus penggunaan populer saat Anda memiliki gambar input berukuran 224x224 piksel. Anda menerapkan lapisan konvolusional dengan ukuran kernel 3x3, padding 1, dan langkah 1. Berikut cara menghitung ukuran peta fitur:
inputSize: 224, kernelSize: 3, padding: 1, langkah: 1
Masukkan nilai-nilai ini ke dalam rumus kita:
outputSize = (224 - 3 + 2 * 1) / 1 + 1 = 224
Peta fitur yang dihasilkan akan tetap berukuran 224x224 piksel.
Validasi Data
Agar perhitungan ini berhasil, semua parameter input harus lebih besar dari nol. Selain itu, pastikan bahwa langkahnya adalah bilangan bulat yang membagi ukuran masukan yang dimodifikasi (inputSize - kernelSize + 2 * padding) secara merata, jika tidak, ukuran peta fitur tidak akan menjadi bilangan bulat dan rumus akan rusak.
Contoh Nilai:
inputSize
= 32kernelSize
= 5padding
= 2stride
= 1outputSize
= ukuran peta fitur yang dihasilkan
Keluaran:
outputSize
= 32
Ringkasan
Menghitung ukuran peta fitur dalam jaringan saraf konvolusional sangat penting untuk arsitektur dan pengoptimalan model. Dengan memahami dan menggunakan rumus (inputSize - kernelSize + 2 * padding) / stride + 1 dengan benar, ilmuwan dan teknisi data dapat merancang jaringan yang lebih efisien, meningkatkan kinerja dan efisiensi.
Pertanyaan Umum (FAQ)
Mengapa padding digunakan?
Padding membantu mengendalikan dimensi spasial peta fitur keluaran. Ini sangat berguna ketika Anda ingin mempertahankan ukuran masukan dalam keluaran.
Apa yang terjadi jika stride lebih besar dari satu?
Ketika stride lebih besar dari satu, kernel akan melewatkan piksel dalam masukan, yang mengarah ke peta fitur keluaran yang lebih kecil. Hal ini mengurangi beban komputasi.
Apakah rumus tersebut hanya berlaku untuk masukan persegi?
Tidak, rumus tersebut dapat disesuaikan untuk masukan non-persegi dengan menerapkan logika yang sama pada setiap dimensi (tinggi dan lebar) secara terpisah.
Dengan mengikuti panduan ini dan memahami setiap parameter, Anda dapat memanfaatkan potensi penuh Jaringan Syaraf Konvolusional dan mengoptimalkan model pembelajaran mendalam Anda secara efisien.
Tags: Pembelajaran Mendalam, Gambar Pengenalan, Mesin Pembelajaran