بهینه‌سازی کشف کلاس جدید با خوشه‌بندی طیفی NCD و k-means

نویسندگان:

(1) Troisemaine Colin، دپارتمان علوم کامپیوتر، IMT Atlantique، Brest، فرانسه، و Orange Labs، Lannion، فرانسه.

(2) Reifers-Masson Alexandre، گروه علوم کامپیوتر، IMT آتلانتیک، برست، فرانسه.

(3) Gosselin Stephane، Orange Labs، Lannion، فرانسه.

(4) Lemaire Vincent، Orange Labs، Lannion، فرانسه.

(5) Vaton Sandrine، گروه علوم کامپیوتر، IMT Atlantique، برست، فرانسه.

چکیده و مقدمه

کار مرتبط

رویکردها

بهینه سازی هایپرپارامتر

تخمین تعداد کلاس های رمان

مراحل آموزش کامل

آزمایش

نتیجه

اعلامیه ها

منابع

پیوست A: معیارهای نتایج اضافی

پیوست ب: فراپارامترها

پیوست ج: نتایج عددی شاخص‌های اعتبار خوشه‌ای

پیوست D: NCD k-means مطالعه همگرایی مرکزها

3 رویکرد

در این بخش، پس از معرفی نمادها، دو مدل ساده اما بالقوه قوی برگرفته از الگوریتم‌های خوشه‌بندی کلاسیک را تعریف می‌کنیم (بخش‌های 3.2 و 3.3). ایده این است که از داده های برچسب گذاری شده برای بهبود فرآیند خوشه بندی بدون نظارت استفاده شود و مقایسه با روش های NCD چالش برانگیزتر شود. سپس، ما یک روش جدید، PBN (برای NCD مبتنی بر طرح ریزی، بخش 3.4) ارائه می کنیم، که با تعداد کم فراپارامترهای مورد نیاز برای تنظیم مشخص می شود.

3.1 تنظیم مشکل

3.2 NCD k-means

این یک …

Source link