

@لیمارکلیمارک آمبالینا
ویرایشگرHackernoon در روز ، VR Gamer و Anime Binger در شب
این مقاله در مورد مجموعه داده های تشخیص چهره یکی از بهترین مقاله هایی است که من در ابتدا در Lionbridge AI نوشتم. خوشحالم که آن را با جامعه هکر نون به اشتراک می گذارم!
از دوربین های امنیتی و نظارتی تلفن همراه گرفته تا واقعیت افزوده و عکاسی ، شاخه تشخیص چهره بینایی رایانه کاربردهای متنوعی دارد. بسته به پروژه خاص خود ، ممکن است به تصاویر چهره در شرایط نوری مختلف ، چهره هایی که احساسات مختلف را بیان می کنند یا تصاویر صورت حاشیه دار نیاز داشته باشید. از فریم های ویدئویی حاوی نکته های کلیدی صورت گرفته تا جفت های واقعی و جعلی تصویر صورت ، مجموعه داده های این لیست از نظر اندازه و دامنه متفاوت هستند.
از کجا می توان مجموعه داده تصویر رایگان را برای مدل های تشخیص چهره پیدا کرد؟
ما لیستی از بهترین مجموعه داده های تصویر رایگان برای تشخیص چهره را جمع آوری کرده ایم که در مجموع بیش از 5،000،000 عکس چهره و فریم ویدئو دارد. از GIF و تصاویر ثابت گرفته شده از فیلم های Youtube گرفته تا تصویربرداری حرارتی و تصاویر سه بعدی ، هر مجموعه داده متفاوت است و برای پروژه ها و الگوریتم های مختلف مناسب است.
1. مجموعه CelebA
فقط برای اهداف تحقیقاتی غیر تجاری ، این مجموعه داده از MMLAB حاوی بیش از 200000 تصویر افراد مشهور است.
2. تشخیص چهره در تصاویر با جعبه های Bounding
یک مجموعه داده ساده و در عین حال مفید ، Face Detection in Images شامل کمی بیش از 500 تصویر با تقریبا 1100 چهره است که قبلاً با جعبه های محدود برچسب گذاری شده اند.

dataturks.com/projects/devika.mishra/face_detection3
تصاویر چهره با نقاط علامت گذاری شده علامت گذاری شده
این مجموعه داده شامل بیش از 7000 تصویر صورت با نقاط کلیدی حاوی هر تصویر است. تعداد نقاط کلید در هر تصویر متفاوت است ، با حداکثر تعداد کلیدهای کلیدی در یک تصویر 15. داده های نقاط کلیدی در یک فایل CSV جداگانه گنجانده شده است.
4. چهره های فلیکر
با استفاده از تصاویر گرفته شده از فلیکر ، این مجموعه داده 210،000 تصویر دارد. تعداد کل تصاویر از 70،000 تصویر اصلی از Flickr ، 70،000 تصویر برش داده شده در 1024 10 1024 پیکسل و 70،000 تصویر در 128 128 128 پیکسل تشکیل شده است.
5. مقایسه بیان چهره Google
از Google AI ، مجموعه داده های مقایسه بیان بیان Google ارائه می شود که شامل 156000 تصویر صورت است. این تصاویر به صورت سه تایی ارائه می شوند ، از هر سه گانه دو تصویر حاوی “شبیه ترین” در سه قلو از نظر بیان چهره است. به شکل واقعی گوگل ، این تصاویر با دقت شرح داده می شدند و حداقل سه شش حاشیه نویسی انسانی جداگانه روی هر سه گانه کار می کردند.
6. چهره های دارای برچسب در طبیعت
این مجموعه داده توسط محققان دانشگاه ماساچوست ایجاد شده است و در ابتدا برای بررسی تشخیص چهره نامحدود ساخته شده است. در مجموع بیش از 13000 تصویر از بیش از 5700 نفر است. این مجموعه داده همچنین دارای فراداده مفید در قالب CSV است.
7. تشخیص چهره واقعی و جعلی
این مجموعه داده برای آموزش مدل های تشخیص چهره برای تشخیص تصاویر چهره واقعی از تصاویر صورت تولید شده ساخته شده است. این مجموعه داده شامل بیش از 1000 تصویر چهره واقعی و بیش از 900 تصویر چهره جعلی است که از دشواری تشخیص آسان ، میانی و سخت متفاوت است.
8. چهره های سیمپسونها
این مجموعه داده با تصاویر گرفته شده از فصول 25 تا 28 مجموعه کارتونی محبوب آمریکایی ، شامل بیش از 9800 چهره بریده شده از شخصیت های سیمپسون است.
9. پایگاه داده چهره های تافت
با بیش از 100000 تصویر ، پایگاه داده چهره های تافت شامل مجموعه عظیمی از تصاویر صورت است که به 9 دسته تقسیم شده است. این دسته بندی ها شامل طرح های کامپیوتری ، حرارتی ، برش حرارتی ، سه بعدی ، Lytro ، 2D RGB در اطراف ، 2D RGB احساسات ، دید در شب و فیلم است.
10. UMDFaces
با بزرگترین مجموعه داده در این لیست ، مجموعه داده های UMDFaces دارای بیش از 367000 حاشیه نویسی چهره در بیش از 8200 سوژه مختلف در تصاویر ثابت است. به غیر از این تصاویر ، این مجموعه داده همچنین شامل بیش از 3.7 میلیون فریم ویدئویی است که همه حاوی نقاط مهم صورت بیش از 3،100 موضوع هستند. لازم به ذکر است که این مجموعه داده فقط برای اهداف تحقیقاتی غیر تجاری است.

از طریق umdfaces.io11. UTKFace
مجموعه داده های UTKFace شامل چهره هایی از طیف سنی گسترده است. افراد در این تصاویر از کمتر از یک سال تا بیش از 100 سال سن دارند. این مجموعه داده شامل بیش از 20،000 تصویر چهره با حاشیه نویسی های مربوط به سن ، جنسیت و نژاد است.
12. صورت گسترده تر
این مجموعه داده شامل بیش از 10000 تصویر است که شامل چندین نفر یا فقط یک شخص است. تصاویر به تنظیمات بی شماری مانند جلسات ، ترافیک ، موکب ها و موارد دیگر تقسیم می شوند.
13. پایگاه داده چهره ییل
پایگاه داده چهره ییل مجموعه داده ای است که شامل 165 تصویر GIF از 15 سوژه مختلف در شرایط مختلف نوری است. سوژه های موجود در تصاویر احساسات و حالات مختلفی را به نمایش می گذارند.
14. چهره های یوتیوب با نکات کلیدی صورت
این مجموعه داده از فیلمهای عمومی مشاهیر Youtube تشکیل شده است که در مجموع 155،560 فریم ثابت هستند. ویدئوها در اطراف چهره افراد مشهور بریده شده اند و برای هر فریم از هر ویدیو با کلیدهای صورت حاشیه نویسی شده اند.
همچنین در: https://lionbridge.ai/datasets/5-million-faces-top-15-free-image-datasets-for-facial-recognition/
هنوز به دنبال مجموعه داده های بیشتر هستید؟ وارسی:
- https://hackernoon.com/tagged/datasets
- https://hackernoon.com/tagged/dataset
برچسب ها
حساب رایگان خود را ایجاد کنید تا قفل تجربه خواندن سفارشی خود را باز کنید.