HAM در مقابل هرزنامه: نحوه شناسایی و طبقه بندی ایمیل هرزنامه

چکیده

ایمیل ابزاری اساسی برای برقراری ارتباط در دنیای امروز است. با این حال ، ایمیل های هرزنامه به عنوان یک چالش بزرگ ظاهر شده اند. این پیام های ناخواسته از منابع ناشناخته اغلب صندوق های ورودی را پر می کنند و ارتباط و بهره وری را مختل می کنند. در این مقاله به بررسی استفاده از تکنیک های مختلف یادگیری ماشین برای طبقه بندی ایمیل ها به عنوان “هرزنامه” یا “ژامبون” (غیر اسپم) می پردازیم.

مدل های طبقه بندی مانند همسایگان K-Nearest (KNN) ، رگرسیون لجستیک ، دستگاه های بردار پشتیبانی (SVM) و Bayes ساده لوح ارزیابی می شوند و اثربخشی آنها را در طبقه بندی ایمیل مقایسه می کنند. عملکرد هر مدل بر اساس معیارهایی مانند دقت ، دقت ، فراخوان و نمره F1 ارزیابی می شود تا مشخص شود کدام روش برای این کار مناسب است.

مقدمه

در سال 2023 ، هر روز 347.3 میلیارد ایمیل ارسال می شود که از این تعداد ایمیل های اسپم 45 ٪ از کل ترافیک ایمیل را تشکیل می دهند. این اسپم ایمیل هر سال 20.5 میلیارد دلار برای مشاغل هزینه دارد. با توجه به این امر ، همیشه نیاز به اطمینان از طبقه بندی اسپم به درستی است و در ترافیک ایمیل مشروع دخالت نمی کند. این یک روش مفید برای درک پتانسیل و کاربرد یادگیری ماشین است.

در مورد تشخیص هرزنامه ، یک کاربر انسانی که با ایمیل آشنا است ، تقریباً بلافاصله می تواند هرزنامه را تعیین کند. در نتیجه ، من معتقدم این کار …

Source link