وقتی یک لایه کانولوشن به یک تصویر اعمال می شود، الگوهای موجود در تصویر را با حرکت یک فیلتر کوچک، یا هسته، روی تصویر می آموزد. هسته یک ماتریس کوچک از وزن ها است که در طی فرآیند آموزش آموخته می شود. هسته در هر مکان با تصویر ضرب می شود و نتیجه یک مقدار واحد است. این مقدار بیانگر شدت ویژگی ای است که هسته در حال تشخیص آن است.
هسته ها در تصویر به ترتیب خاصی ضرب می شوند که به آن گام همگرایی می گویند. گام تعیین می کند که هسته تا چه حد در تصویر حرکت می کند. یک گام کوچک منجر به یک نمایش دقیق تر از تصویر می شود، در حالی که یک گام بزرگتر منجر به یک نمایش تقریبی تر می شود.
لایه کانولوشن این فرآیند را برای هر هسته در لایه تکرار می کند. خروجی لایه کانولوشن یک مجموعه نقشه ویژگی است که هر کدام یک ویژگی مختلف در تصویر را نشان می دهد.
نقشه های ویژگی سپس به لایه بعدی در شبکه عصبی convolutional منتقل می شوند، جایی که برای یادگیری ویژگی های پیچیده تر پردازش می شوند.
در اینجا توضیحی دقیق تر در مورد نحوه کار لایه کانولوشن آورده شده است:
تصویر به یک شبکه مربع های کوچک، به نام پچ ها، تقسیم می شود.
یک هسته روی هر پچ قرار می گیرد.
هسته با پچ ضرب می شود و نتیجه یک مقدار واحد است.
این فرآیند برای همه پچ ها در تصویر تکرار می شود.
خروجی لایه کانولوشن یک مجموعه نقشه ویژگی است که هر کدام یک ویژگی مختلف در تصویر را نشان می دهد.
هسته ها در طی فرآیند آموزش آموخته می شوند. شبکه به یک مجموعه تصاویر و برچسب های آنها داده می شود. سپس شبکه سعی می کند الگوهای موجود در تصاویر را که با برچسب ها مرتبط هستند، بیاموزد. این کار با تنظیم وزن های هسته انجام می شود. وزن ها به گونه ای تنظیم می شوند که شبکه برچسب صحیح را برای تصویر تولید کند.
لایه کانولوشن یک ابزار قدرتمند برای یادگیری الگوها در تصاویر است. این در بسیاری از معماری های مختلف شبکه عصبی convolutional استفاده می شود، از جمله AlexNet، VGGNet و ResNet.