اندازه مجموعه داده های خود را از طریق افزایش داده

LimarcLimarc Ambalina

ویرایشگرHackernoon در روز ، VR Gamer و Anime Binger شب

دسترسی به داده های آموزش یکی از بزرگترین مسدودکننده ها برای بسیاری از پروژه های یادگیری ماشین است. خوشبختانه ، برای پروژه های مختلف ، ما می توانیم از داده ها برای افزایش اندازه داده های آموزش خود چندین برابر استفاده کنیم.

به جای تلاش برای یافتن و برچسب گذاری اطلاعات بیشتر ، می توانیم نقاط جدیدی را بسازیم بر اساس داده هایی که از قبل داریم. توجه: این مقاله توسط Sergios Karagiannakos در Lionbridge AI

نوشته شده است صبر کنید؟ آیا می توانیم این کار را انجام دهیم؟ مطمئنا می توانیم. گرچه همیشه آسان نیست و ممکن است بهترین نتیجه را نداشته باشد ، اما همچنان یک گزینه مناسب است.

گسترش یک مجموعه داده با روش های افزودن داده نه تنها برای چالش داده های محدود مفید نیست . این همچنین می تواند از تناسب بیش از حد استفاده کند و تعمیم مدل های ما را بهبود بخشد زیرا تنوع مجموعه آموزشی ما را افزایش می دهد.

بنابراین بیایید تعقیب کنیم: چگونه می توانیم داده ها را افزایش دهیم؟

فکر می کنم تصویر زیر گویای همه چیز است. در این مقاله ، ما بر افزایش تصویر تمرکز خواهیم کرد زیرا در حال حاضر فعال ترین زمینه تحقیق است ، اما بیشتر این روش ها را می توان برای انواع داده ها استفاده کرد.

< IMG ALT SRC = "https://firebasestorage.googleapis.com/v0/b/hackernoon-app.appspot.com/o/images٪2FugoTV1vwcgR4mN8MMDUUN4vt6p02-uu7f3tai.jpeg؟alt=media&token=27d646fd-92b7-4b9f-98f5-faa6ef709c4f ">

منبع: https://link.springer.com/article/10.1186/s40537-019-0197-0

دستکاری های تصویر اساسی

اولین ساده کاری که باید انجام شود انجام تحولات هندسی به تصویر است. ممکن است تصور کنید که یادگیری ماشینی به راحتی می تواند دو تصویر یکسان را با چرخش های مختلف از یکدیگر متمایز کند ، اما نمی تواند.

ورق زدن ، برش دادن ، چرخش ها و ترجمه تصاویر اولین مراحل آشکار است. ما همچنین می توانیم فضای رنگی تصویر را با استفاده از کنتراست ، شفاف سازی ، تعادل رنگ سفید ، لرزش رنگ ، دستکاری رنگ تصادفی و بسیاری از تکنیک های دیگر (که تحولات فوتومتریک نامیده می شوند) تغییر دهیم. اگر تاکنون از فیلترهای اینستاگرام یا Snapseed استفاده کرده اید ، آنچه را که می گویم دریافت خواهید کرد. شما می توانید به همان اندازه که می خواهید خلاق باشید.

علاوه بر این ، می توانید تصاویر را با هم مخلوط کنید ، به طور تصادفی بخشهایی از یک تصویر را پاک کنید و البته همه موارد بالا را به انواع مختلف ترکیب کنید .

منبع: https://arxiv.org/pdf/1809.06839v1.pdf

افزودن داده ها با استفاده از یادگیری ماشین

علاوه بر دستکاری های اساسی تصویر ، مهندسان بیشتر و بیشتر شروع به استفاده از تکنیک های یادگیری عمیق و ماشینی برای افزایش داده های خود می کنند. به این روش در این مورد فکر کنید: ما می توانیم با استفاده از مدل های یادگیری ماشین ، داده های بیشتری تولید کنیم تا مدل های یادگیری ماشین بیشتری آموزش دهیم. برخی از امیدوار کننده ترین آثار در زیر آمده است:

افزودن فضای ویژه و رمزگذاران خودکار

در مثال های بالا ، تصاویر را در فضای ورودی تغییر شکل دادیم. ما همچنین می توانیم تحولات را در فضای ویژگی ها اعمال کنیم.

با استفاده از شبکه های عصبی می توانیم ورودی های با ابعاد بالا (مانند تصاویر) را در نمایش ابعاد پایین تر (به عنوان ویژگی یا فضای نهفته شناخته می شود) بسیار کارآمد ترسیم کنیم. . تصور کنید که این رمزگذار یک تانسور سه بعدی در یک بردار 1D بدون از دست دادن اطلاعات زیاد است. داشتن یک کدگذاری تصویری در چند بعد ، انجام عمل بزرگ سازی را بسیار آسان تر می کند.

بسیاری از مقالات جالب روش های مختلفی را برای انجام این کار پیشنهاد می کنند ، مانند پیوستن به نزدیکترین همسایگان با هم ، اضافه کردن نویز ، درون یابی ، و موارد دیگر.

رمزگذاران خودکار بهترین انتخاب برای استخراج بازنمایی های فضای ویژگی را ثابت کرده اند. خود رمزگذارها نوع خاصی از شبکه های عصبی هستند ، که سعی می کنند ورودی را بازسازی کنند. آنها از دو شبکه رمزگذار و رمزگشای تشکیل شده اند. رمزگذار ورودی را گرفته و در ابعادی پایین تر (فضای ویژگی) را در یک بردار کد می کند. رمزگشای آن بردار را می گیرد و سعی می کند ورودی اصلی را بازسازی کند.

با این کار ، بردار نهفته در وسط شامل تمام اطلاعات مربوط به مجموعه داده است و می تواند برای انجام انواع مختلف استخراج شود موارد ، از جمله افزایش داده ها.

افزایش داده مبتنی بر GAN

مدل سازی ژنتیکی یکی از جالب ترین تکنیک ها در حال حاضر است زیرا می تواند تصاویر کاملاً جدیدی تولید کند. . مدل های تولیدی می توانند الگوهای جدیدی در داده ها ایجاد کنند زیرا آنها توزیع داده ها و نه مرز بین آنها را می آموزند (همانطور که در بیشتر مدل های یادگیری ماشین معمول است).

در این راستا ، تولید کننده شبکه های خصمانه (GAN) به صنعت و استاندارد تحقیقاتی تبدیل شده اند. GAN ها از دو شبکه ژنراتور و تفکیک کننده تشکیل شده اند. وظیفه ژنراتور تولید داده های جعلی است که هیچ چیز دیگری به غیر از نویز به عنوان ورودی نیست. مدل دوم ، متمایز کننده ، تصاویر واقعی و تصاویر جعلی (تولید شده توسط ژنراتور) را به عنوان ورودی دریافت می کند و می آموزد که تصویر را جعلی یا واقعی تشخیص دهد.

به عنوان این شبکه ها در برابر یکدیگر رقابت کنند و با آموزش همزمان آنها (در فرآیندی به نام آموزش خصمانه) ، جادو آغاز می شود:

ژنراتور در تولید تصویر بهتر و بهتر می شود زیرا هدف نهایی آن این است که گمراه کننده تبعیض گر ، به نوبه خود ، در تشخیص تصاویر جعلی از واقعی بهتر و بهتر می شود ، زیرا هدفش فریب نخوردن است. نتیجه داده های جعلی فوق العاده واقع گرایانه از ژنراتور است.

GAN ها برخی از واقعی ترین تصاویر و فیلم هایی را که دیده ایم تولید کرده اند. جعلیات عمیق را به خاطر می آورید؟ این همه کار GAN ها بود. پس چرا به جای جایگزینی جک نیکلسون به جای جیم کری در Shining ، از آنها برای افزایش داده استفاده نمی کنید؟

فراآموزی

آخر اما نه بیشتر ، ما متا داریم -یادگیری. Meta-Learning یک منطقه نسبتاً جدید است ، که در آن ما از شبکه های عصبی برای تنظیم بهینه سایر شبکه های عصبی با تنظیم بیش پارامترهای آنها ، بهبود طرح آنها و موارد دیگر استفاده می کنیم. از نظر افزایش داده ها ، همه چیز کمی پیچیده تر می شود.

به زبان ساده ، ما از یک شبکه طبقه بندی برای تنظیم یک شبکه افزایش برای ایجاد تصاویر بهتر استفاده می کنیم.

نگاهی به تصویر زیر بیندازید: با تغذیه تصاویر تصادفی در شبکه افزایش (به احتمال زیاد GAN) ، تصاویر افزوده ایجاد می کند. هر دو تصویر افزوده و اصلی به یک شبکه دوم منتقل می شوند ، که آنها را با یکدیگر مقایسه می کند و به ما می گوید که تصویر افزوده چقدر خوب است. پس از تکرار فرآیند ، شبکه تقویت در تولید تصاویر جدید بهتر و بهتر می شود.

Source: https://arxiv.org/pdf/1712.04621 .pdf

البته ، این روش تنها روش موجود نیست ، اما نقطه شروع بسیار خوبی برای مقاله های تحقیقاتی مختلف در این منطقه است.

نتیجه گیری

افزودن داده ها به هیچ وجه کار آسانی نیست. آثار جالبی وجود داشته است (در اینجا مجموعه ای از آنهاست) اما هنوز جای پیشرفت زیادی دارد. به عنوان مثال ، ما هنوز می توانیم کیفیت نمونه های GAN را بهبود بخشیم ، روش های جدیدی برای استفاده از Meta-Learning پیدا کنیم و شاید بتوانیم طبقه بندی تکنیک های مختلف افزایش را ایجاد کنیم.

و البته ، ما می توانیم هنوز روشهای جدیدی را برای استفاده از این تکنیک ها در سایر اشکال داده مانند متن ، داده های جدولی ، داده های نمودار و غیره کشف کنید. چرا فراتر از آن نیز گسترش نمی یابد؟ در مورد آموزش تقویت چطور؟ یا الگوریتم های جستجو؟ مرحله مربوط به شماست.

امیدوارم که از طریق افزایش داده ها ، بتوانید کیفیت داده های آموزشی خود را افزایش داده و بهبود ببخشید.

مشخصات نویسنده

سرجیوس کاراگیاناکوس مهندس یادگیری ماشین و بنیانگذار AI Summer ، یک وبلاگ آموزشی متمرکز بر هوش مصنوعی و یادگیری عمیق است. < p class = "paragraph"> همچنین در: https://lionbridge.ai/articles/data-augmentation-with-machine-learning-an-overview/

مرتبط

 Adf image

داستان قبل از شکلک

< img alt src = "https://firebasestorage.googleapis.com/v0/b/hackernoon-app.appspot.com/o/images٪2FugoTV1vwcgR4mN8MMDUUN4vt6p02-ro2d3t5a.jpeg؟alt=media&eoken7c7c7-7b7-7b7-7bbbb07bb5fb0fb0fb0f9b0f9b07fb0f9b0a7fb0f9a7f9f9a5f9a5f9a5f9a5f9a5f9a5f9a5f9a5f9a5f9a5fb0f9f9f9f9f5fb0f9f9fcfb0f9fcfcfcfb0fc0fccc0bc0b0b0b0b0b0b0b0b0b0b0b0b0b0b0b0b0b0a7fb0fb0fcfcfcfccccccccc ">

پیش -emoji story

> رو 4 -sc-1bzkg2-0 lihLaA “readability =” 5.6506024096386 “> به هکر ظهر بپیوندید

برای باز کردن قفل تجربه خواندن سفارشی ، حساب رایگان خود را ایجاد کنید.

سئو PBN | خبر های جدید سئو و هک و سرور
مطالب پیشنهادی  چرا اکنون باید در اکوسیستم کاردانو سرمایه گذاری کنید؟