نمودارهای وابستگی جزئی: چگونه متغیرهای تأثیرگذار بر مدل را کشف کنیم

عکس پروفایل نویسنده

@mitilikrishnanمیتیلی کریشنان

رهبر علوم داده و نویسنده ثابت در نشریه رسانه “به سوی Datascience”

آیا تا به حال فکر کرده اید که چگونه مدل های یادگیری ماشین ساخته می شوند؟ امروز ما این را کشف خواهیم کرد و چند روش سریع در مورد چگونگی کشف اینکه کدام متغیرها بر روی نتایج مدل تأثیر می گذارند را یاد می گیریم.

ما از مجموعه داده های FIFA 2018 در Kaggle استفاده خواهیم کرد و مدل های زیر را کشف خواهیم کرد:

  1. مدل درخت تصمیم
  2. مدل جنگل تصادفی

این دستور کار امروز خواهد بود:

  1. برای آموزش مدل درخت تصمیم از مجموعه داده های FIFA استفاده کنید
  2. برای آموزش مدل جنگل تصادفی از مجموعه داده های FIFA استفاده کنید
  3. متغیرهای تأثیرگذار را در مدل ها کاوش کنید
  4. آستانه متغیرهای تأثیرگذار را پیدا کنید

بنابراین بدون هیچ زحمتی بیشتر بیایید شروع کنیم.

1. برای آموزش مدل درخت تصمیم از مجموعه داده های FIFA استفاده کنید

بگذارید ابتدا کمی درباره درختان تصمیم صحبت کنیم.

الگوریتم های درخت تصمیم با یک گره ریشه از یک نمونه داده شروع می شوند و سپس ویژگی ها را براساس معیارهایی مانند ناخالصی جینی یا افزایش اطلاعات انتخاب می کنند و گره های ریشه را به گره های برگ / گره های انتهایی تقسیم می کنند تا دیگر تقسیم امکان پذیر نباشد. این در نمودار زیر با یک درخت نمونه نشان داده شده است.

پس از وارد کردن داده ها و کتابخانه ها ، خطوط کد زیر به آموزش مدل درخت تصمیم کمک می کند.

#Create the dependent variable

y = (data['Man of the...
سئو PBN | خبر های جدید سئو و هک و سرور