Exploratory Data Analysis چیست؟ - هفت خط کد انجمن پرسش و پاسخ برنامه نویسی

وبـــلاگ هــفت خــط کــد


آموزش های برنامه نویسی
۲۴۳ نفر آنلاین
۶۸ عضو و ۱۷۵ مهمان در سایت حاضرند

Exploratory Data Analysis چیست؟

0 امتیاز
سلام.

میگن قبل از هر پروژه machine learning باید EDA انجام بدی منظورشون دقیقا چیه ؟
سوال شده مرداد 6, 1402  بوسیله ی Lori3 (امتیاز 857)   11 36 105

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

تجزیه و تحلیل داده های کاوشگر (EDA) یک رویکرد برای تجزیه و تحلیل مجموعه داده ها برای خلاصه کردن ویژگی های اصلی آنها است، اغلب با استفاده از نمودارها و سایر روش های بصری سازی داده ها. این یک راه مفید برای درک بهتر داده ها قبل از شروع مدل سازی یا نتیجه گیری است.

EDA را می توان برای:

  • کشف الگوها و روندها: EDA می تواند به شما کمک کند الگوها و روندهای موجود در داده های خود را شناسایی کنید که ممکن است به طور دیگری متوجه آنها نشوید. این می تواند به درک بهتر داده های شما و تصمیم گیری آگاهانه در مورد نحوه ادامه تجزیه و تحلیل شما کمک کند.
  • بررسی فرضیات: EDA می تواند به شما کمک کند فرضیاتی را که توسط مدل های آماری انجام می شود بررسی کنید. این مهم است زیرا اگر فرضیات برآورده نشوند، نتایج مدل ممکن است معتبر نباشد.
  • شناسایی موارد دورافتاده: EDA می تواند به شما کمک کند موارد دورافتاده را در داده های خود شناسایی کنید. موارد دورافتاده نقاط داده ای هستند که به طور قابل توجهی با بقیه داده ها متفاوت هستند. آنها می توانند ناشی از خطاهای ورودی داده یا موارد ناهنجاری واقعی باشند.
  • فرضیه های تولید: EDA می تواند به شما کمک کند فرضیه هایی در مورد داده های خود ایجاد کنید. این فرضیه ها سپس می توانند با استفاده از روش های آماری آزمایش شوند.

تعدادی تکنیک مختلف وجود دارد که می توان برای EDA استفاده کرد. برخی از رایج ترین تکنیک ها عبارتند از:

  • تجزیه و تحلیل تک متغیره: این شامل بررسی توزیع یک متغیر واحد است.
  • تجزیه و تحلیل دو متغیره: این شامل بررسی رابطه بین دو متغیر است.
  • تجزیه و تحلیل چند متغیره: این شامل بررسی رابطه بین چند متغیر است.

EDA یک فرآیند تکراری است. معمولاً با تجزیه و تحلیل داده ها با استفاده از تکنیک های ساده مانند تجزیه و تحلیل تک متغیره شروع می شود. همانطور که بیشتر در مورد داده ها یاد می گیرید، می توانید از تکنیک های پیچیده تر مانند تجزیه و تحلیل چند متغیره استفاده کنید.

EDA یک ابزار ارزشمند برای دانشمندان داده و تحلیلگران است. می تواند به شما کمک کند تا درک بهتری از داده های خود داشته باشید و تصمیمات آگاهانه در مورد نحوه ادامه تجزیه و تحلیل خود بگیرید.

در اینجا چند نمونه از EDA آورده شده است:

  • یک فروشگاه خرده فروشی ممکن است از EDA برای درک توزیع هزینه های مشتری استفاده کند. آنها ممکن است متوجه شوند که اکثر مشتریان بین 50 تا 100 دلار در هر بازدید خرج می کنند، اما تعداد کمی از مشتریان بسیار بیشتر خرج می کنند. این اطلاعات می تواند به فروشگاه کمک کند تا تلاش های بازاریابی خود را به طور موثرتری هدف قرار دهد.
  • یک سازمان مراقبت های بهداشتی ممکن است از EDA برای درک توزیع زمان انتظار بیمار استفاده کند. آنها ممکن است متوجه شوند که میانگین زمان انتظار 30 دقیقه است، اما تعداد قابل توجهی از بیماران باید بیش از یک ساعت منتظر بمانند. این اطلاعات می تواند به سازمان کمک کند تا فرآیندهای مراقبت از بیمار خود را بهبود بخشد.
  • یک شرکت خدمات مالی ممکن است از EDA برای درک توزیع بدهی کارت اعتباری استفاده کند. آنها ممکن است متوجه شوند که اکثر مشتریان مقدار قابل مدیریتی از بدهی دارند، اما تعداد کمی از مشتریان در مشکل مالی جدی هستند. این اطلاعات می تواند به شرکت کمک کند تا برنامه های امداد بدهی هدفمندی ایجاد کند.

EDA یک ابزار قدرتمند است که می تواند به شما کمک کند تا درک بهتری از داده های خود داشته باشید. اگر با داده ها کار می کنید، تشویق می کنم تا در مورد EDA بیشتر بیاموزید و از آن برای بهبود تجزیه و تحلیل خود استفاده کنید.

 

پاسخ داده شده مرداد 6, 1402 بوسیله ی عباس مولایی (امتیاز 2,754)   1 5 13
انتخاب شد شهریور 8, 1402 بوسیله ی farnoosh
...