مجموعه داده های NLP از HuggingFace: نحوه دسترسی و آموزش آنها

تصویر
عکس پروفایل دیویس دیوید هکر ظهر

@دیوید داویددیویس دیوید

دانشمند داده | تمرین کننده هوش مصنوعی | توسعه دهنده نرم افزار. سخنرانی ، تدریس ، نوشتن.

این کتابخانه مجموعه داده ها از hugging Face روشی بسیار کارآمد برای بارگیری و پردازش مجموعه داده های NLP از پرونده های خام یا داده های داخل حافظه ارائه می دهد. این مجموعه داده های NLP توسط جوامع مختلف تحقیقاتی و حرفه ای در سراسر جهان به اشتراک گذاشته شده است.

همچنین می توانید معیارهای مختلف ارزیابی مورد استفاده برای بررسی عملکرد مدلهای NLP در کارهای متعدد را بارگذاری کنید.

اگر در پردازش زبان طبیعی کار می کنید و برای پروژه بعدی خود مجموعه داده NLP می خواهید ، توصیه می کنم از این کتابخانه از Hugging Face استفاده کنید.

می توانید از این کتابخانه با سایر چارچوب های محبوب در یادگیری ماشین استفاده کنید ، مانند آشفته، پانداها، پایتورچ، و TensorFlow. در مثالهای زیر بیشتر خواهید آموخت.

مجموعه داده های NLP در کارهای مختلف مانند

  • طبقه بندی متن
  • پرسش و پاسخ
  • مدل سازی توالی
  • ترجمه ماشینی ،
  • تشخیص خودکار گفتار
  • تجزیه و تحلیل احساسات
  • پردازش گفتار
  • نام نهاد تشخیص
  • بخشی از برچسب زدن گفتار
  • دیگران

مجموعه داده های NLP را می توانید به بیش از 186 زبان بیابید. همه این مجموعه های داده همچنین می توانند در HuggingFace Hub مرور شوند و می توانند به صورت آنلاین با نمایشگر مجموعه داده ها مشاهده و کاوش شوند.

تصویر

در این مقاله نحوه بارگیری ، بارگذاری ، پیکربندی و استفاده از مجموعه داده های NLP را از …

سئو PBN | خبر های جدید سئو و هک و سرور