نفرین ابعاد در یادگیری ماشین چیست (با مثال)

نفرین ابعاد به چالش های مختلف ایجاد تعمیم های معنادار یادگیری ماشینی از داده های حاوی تعداد زیادی ابعاد اشاره دارد.

نفرین ابعاد چیست؟

Curse of Dimensionality توضیح می‌دهد که چگونه با افزایش تعداد ابعاد یا ویژگی‌ها، مقدار داده‌هایی که برای تعمیم‌های دقیق نیاز داریم به‌طور تصاعدی افزایش می‌یابد.

این اصطلاح توسط ریچارد ای بلمن در سال 1966 در یک نام کاغذی ابداع شد برنامه نویسی پویا به چالش هایی اشاره دارد که هنگام کار با داده ها در ابعاد بالا ایجاد می شود. اشیا پراکنده تر و متفاوت تر می شوند و جمع آوری بینش های معنادار از داده ها را دشوارتر می کند.

مثال نفرین ابعاد

مثالی از نفرین ابعاد زمانی است که ما سعی می کنیم k نزدیکترین همسایه یک مقدار را پیدا کنیم. وقتی یک خط 1 بعدی دارید و همه داده ها به طور یکنواخت در آن خط پخش می شوند، نزدیکترین همسایه به صورت پیش فرض یک همسایگی بسیار کوچک از مقادیر ممکن را نشان می دهد.

  • 1D: هر X نشان دهنده 1/6 ام است، n_neighbors=2
  • 2D: هر X نشان دهنده 1/36th، n_neighbors=8 است
  • 3D: هر X نشان دهنده 1/216th، n_neighbors=26 است

چگونه بر نفرین ابعاد غلبه کنیم؟

یکی از راه‌حل‌های مقابله با نفرین ابعاد، انجام تجزیه و تحلیل مؤلفه‌های اصلی روی یک مجموعه داده برای کاهش تعداد ویژگی‌ها با انتخاب تنها مؤلفه‌های اصلی است که بیشترین سهم را در واریانس داده‌ها دارند.

سئو PBN | خبر های جدید سئو و هک و سرور