با نمونه گیری هوشمند ، داده های بزرگ را کنترل کنید

نویسندگان:

(1) اندرو دراگانوف ، دانشگاه ارهوس و همه نویسندگان به طور مساوی در این تحقیق نقش داشتند.

(2) David Saulpic ، Université Paris Cité & CNRS ؛

(3) کریس شوویگلشان ، دانشگاه آرهوس.

چکیده و 1 مقدمه

2 مقدمات و کارهای مرتبط

2.1 در مورد استراتژی های نمونه برداری

2.2 استراتژی های دیگر Coreset

2.3 هسته برای برنامه های پایگاه داده

2.4 تعبیه چهارگانه

3 هسته سریع

4 کاهش تأثیر گسترش

4.1 محاسبه یک قسمت فوقانی خام

4.2 از محلول تقریبی تا کاهش گسترش

5 فشرده سازی سریع در عمل

5.1 هدف و دامنه تحلیل تجربی

5.2 تنظیم آزمایشی

5.3 ارزیابی استراتژی های نمونه برداری

5.4 تنظیم جریان و 5.5 غذای آماده

6 نتیجه گیری

7 اذعان

8 اثبات ، شبه کد و پسوندها و 8.1 اثبات نتیجه 3.2

8.2 کاهش K-Mean به K-Median

8.3 تخمین هزینه بهینه در یک درخت

8.4 پسوند به الگوریتم 1

منابع

6 نتیجه گیری

در این کار ، ما در مورد محدودیت های نظری و عملی الگوریتم های فشرده سازی برای خوشه بندی مبتنی بر مرکز بحث کردیم. ما اولین الگوریتم هسته ای تقریباً خطی را برای K-Median و K-Means پیشنهاد کردیم. علاوه بر این ، الگوریتم می تواند پارامتر شود تا به اندازه هسته ای بهینه بهینه دست یابد. پس از آن ، ما یک آزمایش کامل انجام دادیم …

Source link