ADA در مقابل C-Mixup: عملکرد در مجموعه داده های مسکن کالیفرنیا و بوستون

نویسندگان:

(1) نورا اشنایدر، گروه علوم کامپیوتر، ETH زوریخ، زوریخ، سوئیس ([email protected])

(2) شیرین گشتاسب پور، گروه علوم کامپیوتر، ETH زوریخ، زوریخ، سوئیس و مرکز علوم داده سوئیس، زوریخ، سوئیس ([email protected])

(3) فرناندو پرز-کروز، گروه علوم کامپیوتر، ETH زوریخ، زوریخ، سوئیس و مرکز علوم داده سوئیس، زوریخ، سوئیس ([email protected]).

چکیده و 1 مقدمه

2 پس زمینه

2.1 افزایش داده ها

2.2 رگرسیون لنگر

3 تقویت داده لنگر

3.1 مقایسه با C-Mixup و 3.2 حفظ ساختار داده غیرخطی

3.3 الگوریتم

4 آزمایش و 4.1 داده های مصنوعی خطی

4.2 رگرسیون غیرخطی مسکن

4.3 تعمیم در توزیع

4.4 استحکام خارج از توزیع

5 نتیجه گیری، تأثیر گسترده تر، و مراجع

اطلاعات اضافی برای تقویت داده های لنگر

B آزمایش ها

4.2 رگرسیون غیرخطی مسکن

ما نتایج بخش قبل را به داده های مسکن کالیفرنیا و بوستون گسترش می دهیم و ADA را با C-Mixup مقایسه می کنیم. [49]. ما همان آزمایش ها را روی سه مجموعه داده رگرسیون مختلف تکرار می کنیم. نتایج در ضمیمه B.2 ارائه شده است و همچنین برتری ADA را نسبت به C-Mixup برای تقویت داده ها در تنظیمات آزمایشی پیاده سازی شده نشان می دهد.

شکل 2: میانگین مربعات خطا برای مدل رگرسیون ریج و مدل MLP با تعداد نمونه های آموزشی متفاوت. برای رگرسیون ریج، افزایش وانیل و C-Mixup k = 10 مشاهدات تقویت شده در هر مشاهده ایجاد می کنند. به طور مشابه، Anchor Augmentation k = 10 مشاهدات افزوده شده در هر مشاهده با پارامتر α = 10 ایجاد می کند.شکل 2: میانگین مربعات خطا برای مدل رگرسیون ریج و مدل MLP با تعداد نمونه های آموزشی متفاوت. برای رگرسیون ریج، افزایش وانیل و C-Mixup k = 10 مشاهدات تقویت شده در هر مشاهده ایجاد می کنند. به طور مشابه، Anchor Augmentation k = 10 مشاهدات افزوده شده در هر مشاهده با پارامتر α = 10 ایجاد می کند.

داده ها: ما از …

Source link