چگونه می توان خوشه بندی داده های بزرگ را سریعتر و کارآمدتر کرد

نویسندگان:

(1) اندرو دراگانوف ، دانشگاه ارهوس و همه نویسندگان به طور مساوی در این تحقیق نقش داشتند.

(2) David Saulpic ، Université Paris Cité & CNRS ؛

(3) کریس شوویگلشان ، دانشگاه آرهوس.

چکیده و 1 مقدمه

2 مقدمات و کارهای مرتبط

2.1 در مورد استراتژی های نمونه برداری

2.2 استراتژی های دیگر Coreset

2.3 هسته برای برنامه های پایگاه داده

2.4 تعبیه چهارگانه

3 هسته سریع

4 کاهش تأثیر گسترش

4.1 محاسبه یک قسمت فوقانی خام

4.2 از محلول تقریبی تا کاهش گسترش

5 فشرده سازی سریع در عمل

5.1 هدف و دامنه تحلیل تجربی

5.2 تنظیم آزمایشی

5.3 ارزیابی استراتژی های نمونه برداری

5.4 تنظیم جریان و 5.5 غذای آماده

6 نتیجه گیری

7 اذعان

8 اثبات ، شبه کد و پسوندها و 8.1 اثبات نتیجه 3.2

8.2 کاهش K-Mean به K-Median

8.3 تخمین هزینه بهینه در یک درخت

8.4 پسوند به الگوریتم 1

منابع

3 هسته سریع

پیش نمایش فنی. ما با ارائه یک مرور کلی درباره استدلال ها در این بخش شروع می کنیم.

بین هسته های محاسباتی و راه حل های تقریبی رابطه محکمی وجود دارد-با توجه به یک راه حل معقول و برعکس ، می توان به سرعت یک هسته را پیدا کرد. بنابراین ، طرح کلی به شرح زیر است: ما خیلی سریع یک راه حل خشن پیدا می کنیم که به نوبه خود ، …

Source link