چالش ها در طبقه بندی KNN
الگوریتم K نزدیکترین همسایگان
الگوریتم K نزدیکترین همسایگان (KNN) یک الگوریتم یادگیری ماشین ساده و آسان برای پیاده سازی است که می تواند برای حل مشکلات طبقه بندی و رگرسیون استفاده شود.
الگوریتم یادگیری ماشینی نظارتشده (برخلاف الگوریتم یادگیری ماشینی بدون نظارت) الگوریتمی است که برای یادگیری تابعی بر دادههای ورودی برچسبگذاری شده تکیه میکند که با دادههای بدون برچسب جدید، خروجی مناسبی تولید میکند.
الگوریتم KNN
K دیتا اولیه را در تعداد همسایگان انتخابی خود بارگیری کنید
3. برای هر مثال در داده ها
3.1 فاصله بین مثال پرس و جو و مثال فعلی را از داده ها محاسبه کنید.
3.2 فاصله و نمایه مثال را به مجموعه مرتب شده اضافه کنید
4. مجموعه مرتب فاصله ها و شاخص ها را از کوچکترین به بزرگترین (به ترتیب صعودی) بر اساس فاصله مرتب کنید
5. اولین ورودی های K را از مجموعه مرتب شده انتخاب کنید
6. برچسب های ورودی های K انتخاب شده را دریافت کنید
7. در صورت رگرسیون، میانگین برچسب های K را برگردانید
8. در صورت طبقه بندی، حالت برچسب های K را برگردانید
الگوریتم KNN یکی از محبوب ترین الگوریتم های داده کاوی است. علیرغم موفقیت آن، چالشهای زیادی در طبقهبندی KNN وجود دارد، از جمله محاسبات K، انتخاب نزدیکترین همسایه، جستجوی نزدیکترین همسایه و قوانین طبقهبندی. پس از ایجاد این مسائل، رویکردهای اخیر برای حل آنها با جزئیات بیشتری مورد بررسی قرار میگیرند، در نتیجه یک نقشه راه بالقوه برای تحقیقات مرتبط با KNN و همچنین برخی قوانین طبقهبندی جدید در مورد چگونگی مقابله با مسئله عدم تعادل نمونه آموزشی ارائه میدهند.
دیدگاهتان را بنویسید