در یادگیری ماشینی با نظارت، مجموعه دادههای آموزشی که به الگوریتم داده میشود شامل راه حلهای مطلوب یا برچسبها است .مجموعه دادههای آموزشی برچسبدار برای دستهبندی اسپم (مثالی از یادگیری با نظارت)
یک وظیفه معمول یادگیری با نظارت، دستهبندی است. فیلتر اسپم نمونه خوبی از این مورد است: آن با ایمیلهای نمونه زیادی به همراه دسته آنها (اسپم یا غیر اسپم) آموزش داده میشود و باید یاد بگیرد چگونه ایمیلهای جدید را دستهبندی کند.
وظیفه معمول دیگر پیشبینی یک مقدار هدف عددی مانند قیمت یک خودرو با توجه به مجموعهای از ویژگیها (کارکرد، سن، برند و غیره) است که predictors نامیده میشوند. این نوع وظیفه را رگرسیون میگویند
برای آموزش سیستم، باید نمونههای زیادی از خودروها شامل هم predictors و هم برچسبهایشان (قیمت) را به آن بدهید.
توجه داشته باشید که برخی الگوریتمهای رگرسیون را میتوان برای دستهبندی نیز به کار برد و برعکس. به عنوان مثال، از رگرسیون لجستیک معمولاً برای دستهبندی استفاده میشود، زیرا میتواند مقداری تولید کند که متناظر احتمال تعلق به یک دسته مشخص است (مثلاً 20٪ احتمال اسپم بودن).
انواع الگوریتم های با نظارت:
-
k-Nearest Neighbors
-
Linear Regression
-
Logistic Regression
-
Support Vector Machines (SVMs)
-
Decision Trees and Random Forests
-
Neural networks