این نکات به شما کمک می کند تا با استفاده از ML ، تشخیص ناهنجاری را افزایش دهید [Part I]

عکس پروفایل ظهر دیویس دیوید هکر

@davisdavidدیویس دیوید

دانشمند داده | پزشک هوش مصنوعی | توسعه دهنده نرم افزار سخنرانی ، آموزش ، نوشتن.

در این مقاله ، شما دو رویکرد مبتنی بر یادگیری ماشین برای تشخیص ناهنجاری را یاد خواهید گرفت و سپس نشان می دهید که چگونه یکی از این روش ها را برای حل یک مورد استفاده خاص برای تشخیص ناهنجاری (تشخیص تقلب اعتباری) در قسمت دوم بکار بگیرید.

هنگام تجزیه و تحلیل مجموعه داده های دنیای واقعی ، یک نیاز معمول این است که مشخص کنید کدام نقطه داده از همه نقاط داده متفاوت است. چنین نقاط داده ای به عنوان شناخته می شوند ناهنجاری ها، و هدف از تشخیص ناهنجاری (همچنین به عنوان تشخیص outlier شناخته می شود) تعیین تمام این نقاط داده به صورت داده محور است. ناهنجاری ها می تواند ناشی از خطاهای موجود در داده ها باشد اما بعضی اوقات بیانگر یک روند اساسی جدید است که قبلاً ناشناخته بوده است.

تشخیص ناهنجاری چیست؟

تشخیص ناهنجاری تکنیکی است که برای شناسایی الگوهای غیر معمول که مطابق با رفتار مورد انتظار نیست استفاده می شود. می توان آن را فرایند متفکرانه ای برای تعیین اینکه چه چیزی طبیعی است و چه چیزی نیست ، در نظر گرفت. ناهنجاری ها همچنین به عنوان پرتگاه ، تازگی ، سر و صدا ، استثنائات و انحرافات شناخته می شوند.

بیایید از دانش آموزان در کلاس ها مثال بزنیم تا بفهمیم معنای واقعی ناهنجاری یا دور زدن چیست. دانش آموزان همیشه عملکرد متفاوتی دارند. بعضی از دانش آموزان یا از دیگر …