استخراج ویژگی در کاهش ابعاد برای تبدیل داده ها از فضایی با ابعاد بالا به فضایی با ابعاد کمتر استفاده می شود. تکنیک های استخراج ویژگی خطی زمانی استفاده می شود که روابط بین ویژگی ها از یک الگوی خطی پیروی کند.
روش های استخراج ویژگی به روش های غیر خطی یا خطی تقسیم می شوند. 4 روش رایج استخراج ویژگی خطی عبارتند از:
- تجزیه و تحلیل اجزای اصلی (PCA)
- فاکتورسازی ماتریس غیر منفی (NMF)
- تجزیه و تحلیل تشخیص خطی (LDA)
1. تجزیه و تحلیل مؤلفه اصلی (PCA)
تجزیه و تحلیل مؤلفه اصلی یا PCA، تکنیک خطی اصلی برای کاهش ابعاد است.
نگاشت خطی داده ها به فضایی با ابعاد کمتر به گونه ای انجام می شود که واریانس داده ها را به حداکثر می رساند.
PCA فرض می کند که ویژگی های با واریانس کم بی ربط هستند و ویژگی های با واریانس بالا آموزنده هستند. تفسیر مدل های PCA دشوار است.
2. فاکتورسازی ماتریس غیرمنفی (NMF)
فاکتورسازی ماتریس غیر منفی یا NMF یک تکنیک کاهش ابعاد است که حاصلضرب ویژگی های غیر منفی را در یک واحد ترکیب می کند.
قابلیت تفسیر مدل NMF
NMF اسناد و تصاویر را به الگوهای رایج تجزیه می کند. به دلیل تجزیه اسناد، مدل های NMF به راحتی قابل تفسیر هستند.
چه زمانی از کاهش ابعاد NMF استفاده کنیم؟
از NMF در ویژگی های غیر منفی مانند آرایه فرکانس کلمات، سیستم های توصیه کننده، تاریخچه خرید در سایت های تجارت الکترونیک و بینایی کامپیوتر استفاده کنید.
3. تحلیل تشخیصی خطی (LDA)
تجزیه و تحلیل تشخیص خطی یا LDA یک تکنیک کاهش ابعاد خطی است که در پیش پردازش برای یادگیری ماشین استفاده می شود.
این یک تعمیم از تشخیص خطی فیشر است. این شبیه به PCA عمل می کند اما بر به حداکثر رساندن قابلیت تفکیک در دو یا چند دسته شناخته شده تمرکز دارد.
این همان است، در مرحله بعد، شما باید این آموزش را دنبال کنید تا در مورد تکنیکهای رایج استخراج ویژگی غیرخطی مورد استفاده در کاهش ابعاد استفاده کنید.
استراتژیست سئو در Tripadvisor، Seek سابق (ملبورن، استرالیا). متخصص در سئو فنی. نویسنده در پایتون، بازیابی اطلاعات، سئو و یادگیری ماشین. نویسنده مهمان در SearchEngineJournal، SearchEngineLand و OnCrawl.