با ترکیب ویژگی های طبقه ای ، عملکرد مدل یادگیری ماشین را بهبود ببخشید

عکس پروفایل ظهر دیویس دیوید هکر

@davisdavidدیویس دیوید

دانشمند داده | پزشک هوش مصنوعی | توسعه دهنده نرم افزار سخنرانی ، آموزش ، نوشتن.

هنگامی که یک مدل یادگیری ماشین را آموزش می دهید ، می توانید برخی از ویژگی ها را در مجموعه داده خود داشته باشید که نشان دهنده مقادیر دسته بندی هستند. ویژگی های طبقه ای انواع داده هایی است که ممکن است به گروه تقسیم شوند.

سه نوع داده طبقه ای معمول وجود دارد که عبارتند از:

  1. عادی – این مجموعه ای از سفارشات را دارد. مثال: رتبه بندی شادی در مقیاس 10-10
  2. دودویی – این فقط دو مقدار دارد. مثال: زن یا مرد
  3. اسمی – این مجموعه ای از سفارشات را ندارد. مثال: کشورها

بیشتر الگوریتم های یادگیری ماشین به متغیرهای ورودی و خروجی عددی نیاز دارند. بنابراین شما باید ویژگی های طبقه بندی شده را در مجموعه داده خود به اعداد صحیح یا شناور تبدیل کنید تا توسط الگوریتم های یادگیری ماشین مورد استفاده قرار گیرند. شما می توانید برای ویژگی های باینری از LabelEncoding یا از کدگذاری یک داغ برای ویژگی های اسمی استفاده کنید.

در این مقاله ، شما یاد خواهید گرفت که چگونه ترکیب ویژگی های طبقه بندی می تواند عملکرد مدل یادگیری ماشین شما را بهبود بخشد.

پس بیایید شروع کنیم.?

ترکیب ویژگی های دسته بندی در مدل های یادگیری ماشین

شما می توانید یک ویژگی جدید ایجاد کنید که ترکیبی از دو ویژگی طبقه ای دیگر باشد. همچنین می توانید بیش از سه یا چهار یا حتی ویژگی های طبقه بندی شده بیشتری را با هم ترکیب کنید.

df["new_feature"] =...
سئو PBN | خبر های جدید سئو و هک و سرور