ukuran peta fitur dalam jaringan saraf konvolusional

Keluaran: Tekan hitung

Formula:outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1

Memahami Ukuran Peta Fitur dalam Jaringan Saraf Konvolusional

Jaringan Syaraf Konvolusional (CNN) telah menjadi pilar dalam bidang pembelajaran mendalam, khususnya untuk tugas yang melibatkan pengenalan gambar dan video. Aspek penting dari arsitektur CNN adalah ukuran peta fitur, yang mengalami transformasi di setiap lapisan konvolusi. Mengetahui cara menghitungnya sangat mendasar untuk membangun model yang efektif.

Rumus

Ukuran peta fitur setelah lapisan konvolusional dalam CNN ditentukan menggunakan rumus berikut:

outputSize = (inputSize - kernelSize + 2 * padding) / stride + 1

Berikut adalah penjelasan tentang setiap parameter yang terlibat:

Input dan Output

Masukan

Keluaran

Contoh Kehidupan Nyata

Pertimbangkan penggunaan umum di mana Anda memiliki gambar masukan berukuran 224x224 piksel. Anda menerapkan lapisan konvolusi dengan ukuran kernel 3x3, padding 1, dan langkah 1. Berikut adalah cara menghitung ukuran peta fitur:

inputSize: 224, kernelSize: 3, padding: 1, stride: 1

Menyisipkan nilai nilai ini ke dalam rumus kami:

outputSize = (224 - 3 + 2 * 1) / 1 + 1 = 224

Peta fitur yang dihasilkan akan tetap berukuran 224x224 piksel.

Validasi Data

Untuk perhitungan ini agar berfungsi, semua parameter masukan harus lebih besar dari nol. Selain itu, pastikan bahwa langkah (stride) adalah bilangan bulat yang membagi ukuran input yang dimodifikasi (inputSize - kernelSize + 2 * padding) secara merata, jika tidak, ukuran peta fitur tidak akan menjadi bilangan bulat dan rumus akan mengalami kesalahan.

Contoh Nilai:

{

Ringkasan

Menghitung ukuran peta fitur dalam jaringan syaraf konvolusional sangat penting untuk arsitektur model dan optimasi. Dengan memahami dan menggunakan rumus (inputSize - kernelSize + 2 * padding) / stride + 1 dengan benar, ilmuwan data dan insinyur dapat merancang jaringan yang lebih efisien, meningkatkan kinerja dan efikasi.

Pertanyaan yang Sering Diajukan (FAQ)

Mengapa padding digunakan?

Padding membantu mengontrol dimensi spasial dari peta fitur keluaran. Ini sangat berguna ketika Anda ingin mempertahankan ukuran input dalam keluaran.

Apa yang terjadi jika langkah (stride) lebih besar dari satu?

Ketika langkah lebih dari satu, kernel melewatkan piksel dalam input, menghasilkan peta fitur keluaran yang lebih kecil. Ini mengurangi beban komputasi.

Apakah rumus ini hanya berlaku untuk input berbentuk persegi?

Tidak, rumus dapat disesuaikan untuk input non-persegi dengan menerapkan logika yang sama pada setiap dimensi (tinggi dan lebar) secara terpisah.

Dengan mengikuti pedoman ini dan memahami setiap parameter, Anda dapat memanfaatkan potensi penuh dari Jaringan Saraf Konvolusi dan mengoptimalkan model pembelajaran mendalam Anda dengan efisien.

Tags: Mesin Pembelajaran