ukuran peta fitur dalam jaringan saraf konvolusional
Formula:outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1
Memahami Ukuran Peta Fitur dalam Jaringan Saraf Konvolusional
Jaringan Syaraf Konvolusional (CNN) telah menjadi pilar dalam bidang pembelajaran mendalam, khususnya untuk tugas yang melibatkan pengenalan gambar dan video. Aspek penting dari arsitektur CNN adalah ukuran peta fitur, yang mengalami transformasi di setiap lapisan konvolusi. Mengetahui cara menghitungnya sangat mendasar untuk membangun model yang efektif.
Rumus
Ukuran peta fitur setelah lapisan konvolusional dalam CNN ditentukan menggunakan rumus berikut:
outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1
Berikut adalah penjelasan tentang setiap parameter yang terlibat:
ukuranInput
Ukuran peta fitur input (diukur dalam piksel).ukuranKernel
Ukuran kernel konvolusi (diukur dalam piksel).penyangga
Jumlah piksel nol yang ditambahkan ke tepi masukan (diukur dalam piksel).melangkah
Jumlah piksel di mana kernel bergerak melintasi peta fitur input (diukur dalam piksel).
Input dan Output
Masukan
ukuranInput
Integer, jumlah piksel (px).ukuranKernel
Integer, jumlah piksel (px).penyangga
Integer, jumlah piksel (px).melangkah
Integer, jumlah piksel (px).
Keluaran
ukuranKeluaran
Integer, jumlah piksel (px).
Contoh Kehidupan Nyata
Pertimbangkan penggunaan umum di mana Anda memiliki gambar masukan berukuran 224x224 piksel. Anda menerapkan lapisan konvolusi dengan ukuran kernel 3x3, padding 1, dan langkah 1. Berikut adalah cara menghitung ukuran peta fitur:
inputSize: 224, kernelSize: 3, padding: 1, stride: 1
Menyisipkan nilai nilai ini ke dalam rumus kami:
outputSize = (224 - 3 + 2 * 1) / 1 + 1 = 224
Peta fitur yang dihasilkan akan tetap berukuran 224x224 piksel.
Validasi Data
Untuk perhitungan ini agar berfungsi, semua parameter masukan harus lebih besar dari nol. Selain itu, pastikan bahwa langkah (stride) adalah bilangan bulat yang membagi ukuran input yang dimodifikasi (inputSize - kernelSize + 2 * padding) secara merata, jika tidak, ukuran peta fitur tidak akan menjadi bilangan bulat dan rumus akan mengalami kesalahan.
Contoh Nilai:
ukuranInput
= 32ukuranKernel
= 5penyangga
= 2melangkah
= 1ukuranKeluaran
= ukuran peta fitur yang dihasilkan
{
ukuranKeluaran
= 32
Ringkasan
Menghitung ukuran peta fitur dalam jaringan syaraf konvolusional sangat penting untuk arsitektur model dan optimasi. Dengan memahami dan menggunakan rumus (inputSize - kernelSize + 2 * padding) / stride + 1 dengan benar, ilmuwan data dan insinyur dapat merancang jaringan yang lebih efisien, meningkatkan kinerja dan efikasi.
Pertanyaan yang Sering Diajukan (FAQ)
Mengapa padding digunakan?
Padding membantu mengontrol dimensi spasial dari peta fitur keluaran. Ini sangat berguna ketika Anda ingin mempertahankan ukuran input dalam keluaran.
Apa yang terjadi jika langkah (stride) lebih besar dari satu?
Ketika langkah lebih dari satu, kernel melewatkan piksel dalam input, menghasilkan peta fitur keluaran yang lebih kecil. Ini mengurangi beban komputasi.
Apakah rumus ini hanya berlaku untuk input berbentuk persegi?
Tidak, rumus dapat disesuaikan untuk input non-persegi dengan menerapkan logika yang sama pada setiap dimensi (tinggi dan lebar) secara terpisah.
Dengan mengikuti pedoman ini dan memahami setiap parameter, Anda dapat memanfaatkan potensi penuh dari Jaringan Saraf Konvolusi dan mengoptimalkan model pembelajaran mendalam Anda dengan efisien.
Tags: Mesin Pembelajaran