مدل شناسایی صدای خود را با Tensorflow بسازید

عکس پروفایل نویسنده

@FlippedCodingمایلیسا

مهندس نرم افزار / سخت افزار | سخنران فن آوری بین المللی | مخترع تصادفی و دانشمند کمی دیوانه

تشخیص صدا یک مشکل پیچیده در تعدادی از صنایع است. دانستن برخی از اصول مربوط به دست زدن به داده های صوتی و نحوه طبقه بندی نمونه های صدا نکته خوبی است که باید در جعبه ابزار علم داده خود داشته باشید.

ما می خواهیم نمونه ای از طبقه بندی برخی از کلیپ های صوتی را با استفاده از Tensorflow مرور کنیم. وقتی این مشکل را پشت سر گذاشتید ، به اندازه کافی آگاهی خواهید داشت تا بتوانید مدل های تشخیص صدای خود را بسازید. با تحقیقات بیشتر ، می توانید این مفاهیم را در نظر بگیرید و آنها را در پرونده های صوتی بزرگتر و پیچیده تری به کار ببرید.

کد کامل را می توانید در این repo Github پیدا کنید.

دریافت داده ها

جمع آوری داده ها یکی از مشکلات سخت در علم داده است. داده های زیادی در دسترس است ، اما استفاده از همه آنها در مشکلات یادگیری ماشین آسان نیست. شما باید مطمئن شوید که داده ها تمیز ، دارای برچسب و کامل هستند.

برای انجام مثال ما ، از برخی از فایلهای صوتی منتشر شده توسط Google استفاده خواهیم کرد.

ابتدا خط لوله Conducto جدید ایجاد خواهیم کرد. این جایی است که شما می توانید مدل خود را بسازید ، آموزش دهید و آزمایش کنید و پیوند را با هر شخص دیگری که علاقه مند است به اشتراک بگذارید:

###
# Main Pipeline
###
def main() - co.Serial:
    path = "/conducto/data/pipeline"
    root = co.Serial(image = get_image())
    
    #...