MobileNets یک کلاس از معماریهای شبکه عصبی هستند که به طور خاص برای عملیات کارآمد و سبکوزن در دستگاههای تلفن همراه و امبدد ها طراحی شدهاند. آنها این کارایی را از طریق تکنیکی به نام "depthwise separable convolutions" به دست میآورند، که یک بلوک ساختمانی اساسی در معماری MobileNet است.
convolution های سنتی شامل حرکت یک فیلتر کوچک (که به آن هسته نیز گفته میشود) روی یک تصویر ورودی یا نقشه ویژگی برای استخراج ویژگیها است. در convolution های استاندارد، هر کانال از ورودی با کل هسته همگرایی میشود و این عملیات شامل تعداد زیادی محاسبات، به ویژه در شبکههای عصبی عمیق است. MobileNets به کاهش بار محاسباتی در حالی که عملکرد خوبی را حفظ میکند، هدف دارند.
convolution های separable عمقی، عملیات convolution را به دو مرحله جداگانه تقسیم میکند: convolution عمقی و convolution نقطهای.
depthwise separable convolutions: convolution عمقی اولین مرحله در فرآیند convolution separable عمقی است. این شامل همگرایی هر کانال ازتصویر ورودی به طور مستقل با هسته خود است. این بدان معنی است که هر کانال به طور جداگانه پردازش میشود و در این مرحله هیچ تعاملی بین کانالها وجود ندارد. هدف از convolution عمقی، به دام انداختن ویژگیهای فضایی در هر کانال از ورودی است.
convolution نقطهای: convolution نقطهای مرحله دوم است. پس از اینکه convolution عمقی به هر کانال به طور جداگانه اعمال شد، convolution نقطهای انجام میشود. این شامل اعمال یک فیلتر 1x1 (هستهای با اندازه 1x1) به خروجی convolution عمقی است. این مرحله به دنبال ترکیب اطلاعات از کانالهای مختلف و ایجاد بازنماییهای ویژگی جدید است. convolution نقطهای یک ترکیب خطی از اطلاعات کانالها را انجام میدهد و یک مجموعه جدید از کانالها را با تعداد کانالهای مختلف، معمولاً تولید میکند.
مزیت اصلی convolution های separable عمقی، کارایی آنها است. MobileNets با جدا کردن فیلتر کردن فضایی ( convolution عمقی) از مخلوط کردن کانال ( convolution نقطهای)، به طور قابل توجهی تعداد محاسبات مورد نیاز را در مقایسه با convolution های سنتی کاهش میدهد. این کاهش در محاسبات منجر به زمانهای استنباط سریعتر و استفاده از حافظه کمتر میشود، که MobileNets را برای محیطهای با محدودیت منابع مانند تلفنهای همراه، دستگاههای IoT و دستگاههای لبه مناسب میکند.
با وجود کاهش محاسبات، convolution های separable عمقی برای حفظ سطح قابل قبولی از دقت در مقایسه با همتایان سنتی خود طراحی شدهاند. این با ترکیب مناسب اطلاعات فضایی و کانالی در طی دو مرحله convolution انجام میشود.
به طور خلاصه، MobileNets از convolution های separable عمقی برای پردازش و استخراج کارآمد ویژگیها از دادههای ورودی استفاده میکنند، که آنها را برای استقرار در دستگاههایی با منابع محاسباتی محدود بسیار مناسب میکند.