تخمین تعداد کلاس های جدید در NCD با استفاده از شاخص های اعتبار خوشه ای

نویسندگان:

(1) Troisemaine Colin، دپارتمان علوم کامپیوتر، IMT Atlantique، Brest، فرانسه، و Orange Labs، Lannion، فرانسه.

(2) Reifers-Masson Alexandre، گروه علوم کامپیوتر، IMT آتلانتیک، برست، فرانسه.

(3) Gosselin Stephane، Orange Labs، Lannion، فرانسه.

(4) Lemaire Vincent، Orange Labs، Lannion، فرانسه.

(5) Vaton Sandrine، گروه علوم کامپیوتر، IMT Atlantique، برست، فرانسه.

چکیده و مقدمه

کار مرتبط

رویکردها

بهینه سازی هایپرپارامتر

تخمین تعداد کلاس های رمان

مراحل آموزش کامل

آزمایش

نتیجه

اعلامیه ها

منابع

پیوست A: معیارهای نتایج اضافی

پیوست ب: فراپارامترها

پیوست ج: نتایج عددی شاخص‌های اعتبار خوشه‌ای

پیوست D: NCD k-means مطالعه همگرایی مرکزها

5 تخمین تعداد کلاس های رمان

شاخص‌های اعتبار خوشه‌ای (CVI) معمولاً در تجزیه و تحلیل داده‌های بدون نظارت برای تخمین تعداد خوشه‌ها استفاده می‌شوند و همچنین برای مشکل NCD قابل استفاده هستند. CVI ها امتیازهایی هستند که فشردگی و تفکیک خوشه ها را بدون کمک اطلاعات خارجی مانند برچسب های حقیقت زمینی مقایسه می کنند. با این حال، اگر CVI ها مستقیماً برای تخمین تعداد کلاس های جدید اعمال شوند، از دانش کلاس های شناخته شده استفاده نمی شود. بنابراین، ما پیشنهاد می کنیم که CVI ها را در …

Source link