چگونه استراتژی های نمونه گیری متفاوت بر دقت خوشه بندی تأثیر می گذارد

نویسندگان:

(1) اندرو دراگانوف ، دانشگاه ارهوس و همه نویسندگان به طور مساوی در این تحقیق نقش داشتند.

(2) David Saulpic ، Université Paris Cité & CNRS ؛

(3) کریس شوویگلشان ، دانشگاه آرهوس.

چکیده و 1 مقدمه

2 مقدمات و کارهای مرتبط

2.1 در مورد استراتژی های نمونه برداری

2.2 استراتژی های دیگر Coreset

2.3 هسته برای برنامه های پایگاه داده

2.4 تعبیه چهارگانه

3 هسته سریع

4 کاهش تأثیر گسترش

4.1 محاسبه یک قسمت فوقانی خام

4.2 از محلول تقریبی تا کاهش گسترش

5 فشرده سازی سریع در عمل

5.1 هدف و دامنه تحلیل تجربی

5.2 تنظیم آزمایشی

5.3 ارزیابی استراتژی های نمونه برداری

5.4 تنظیم جریان و 5.5 غذای آماده

6 نتیجه گیری

7 اذعان

8 اثبات ، شبه کد و پسوندها و 8.1 اثبات نتیجه 3.2

8.2 کاهش K-Mean به K-Median

8.3 تخمین هزینه بهینه در یک درخت

8.4 پسوند به الگوریتم 1

منابع

5.2 تنظیم آزمایشی

الگوریتم ما هسته های سریع (الگوریتم 1) را در برابر 4 استراتژی نمونه گیری معیار مختلف مقایسه می کنیم که فضای بین زمان بهینه و دقت بهینه و همچنین رقبای پیشرفته BICO را نشان می دهد [38] و streamkm ++[1]بشر

– نمونه گیری یکنواخت استاندارد. هر نقطه با احتمال برابر نمونه برداری می شود و وزن آنها روی n/m تنظیم می شود ، جایی که m …

Source link