قصد داریم در این پست مباحثی از هوش مصنوعی را مطرح کنیم که از جمله آنها یادگیری ماشین
(machine learning) و داده کاوی (data mining) می باشد که از جمله کاربرد این علوم در فیلید های
هوش مصنوعی ، پردازش تصویر ، پردازش اشیاء 3 بعدی ،پردازش صوت و داده کاوی در پایگاه داده و غیره می باشد.
در ابتدا مباحث تئوریک را مطرح می کنیم و سپس مثال های عملی را نیز بیان می کنیم.
Machine Learning چیست؟
دو تعریف برای یادگیری ماشین ارائه شده است. Arthur Samuel آن را بدین صورت توصیف میکند:
-
زمینهای از مطالعه که به کامپیوترها توانایی یاد گرفتن میدهد، بدون این که صریحا پروگرم شوند. این تعریفی قدیمی و غیر رسمی است.
-
Tom Mitchell یک تعریف مدرنتر ارائه میدهد: یک برنامه کامپیوتری از تجربه[1] E با توجه به دستههایی از وظایف[2] T و معیار عملکرد[3] P یاد میگیرد، اگر عملکرد آن که با P اندازه گرفته میشود، در وظایف موجود در T ، با تجربه Eبهبود یابد.
مثال: بازی کردن چکرز(جنگ نادر)
E : تجربهی بازی کردن چکرز به دفعات زیاد
T: عمل بازی کردن چکرز
P: احتمال این که پروگرم بازی بعدی را خواهد برد
یادگیری با نظارت (supervised learning):
در یادگیری با نظارت، ما یک مجموعه داده در اختیار داریم و با دانستن این مساله که رابطهای بین ورودی و خروجی وجود دارد، تقریبا میدانیم خروجی صحیح به چه شکل است.
مسائل یادگیری با نظارت به دو دسته تقسیم میشوند: رگرسیون[1] و دستهبندی[2]. در یک مساله رگرسیون، ما در تلاشیم نتایج را در یک خروجی پیوسته[3] پیشبینی کنیم؛ به این معنا که ما سعی میکنیم متغیرهای ورودی را به تابعی پیوسته نگاشت کنیم. در یک مساله دستهبندی، به جای این کار، در تلاشیم نتایج را در یک خروجی گسسته[4] پیشبینی کنیم. به عبارت دیگر، در تلاشیم متغیرهای ورودی را به دستههای گسسته نگاشت کنیم.
مثال: با در اختیار داشتن دادههایی درباره اندازه خانهها در تجارت معاملات زمین، تلاش میکنیم قیمت خانهها را پیشبینی کنیم. قیمت به عنوان تابعی از اندازه، یک خروجی پیوسته است. بنابراین این مساله، یک مساله رگرسیون است.
ما میتوانیم مساله مزبور را با تبدیل کردن خروجی به این که خانه به قیمتی بالاتر یا پایینتر از قیمت موردنظر فروخته میشود، به یک مساله دستهبندی تغییر دهیم. در مسالهی اخیر، خانهها بر مبنای قیمت به دو دستهی گسسته دستهبندی میشوند.