آزمایش در Seeplessexpressivelm برتری آن در کارایی و کیفیت ترجمه را نشان می دهد

چکیده و 1 مقدمه

  1. کار مرتبط
  2. مدل
  3. آزمایشات
  4. مطالعه اتساع
  5. نتیجه گیری ، محدودیت ها و خطرات

4. آزمایشات

جدول 2: آمار داده های آموزش و ارزیابی از جمله اندازه نمونه ، میانگین مدت زمان در ثانیه و مدت زمان کل در ساعت. ارزش اول آمار آموزش است و مقدار دوم آمار آزمون است.جدول 2: آمار داده های آموزش و ارزیابی از جمله اندازه نمونه ، میانگین مدت زمان در ثانیه و مدت زمان کل در ساعت. ارزش اول آمار آموزش است و مقدار دوم آمار آزمون است.

در این بخش جزئیات تجربی آموزش و ارزیابی مدل در مورد وظیفه ترجمه گفتار گفتار با انتقال سبک بلندگو درج شده است. ما در نظر داریم دارای اسپانیایی به انگلیسی (es-en) و مجارستانی (Hu-en) ترجمه به عنوان ترجمه های نماینده بین زبانهای مشابه و دور.

دادهبشر ما از داده های تراز معنایی داخلی متشکل از 250K اسپانیایی-انگلیسی و 300K گفتار مجارستانی-انگلیسی-انگلیسی استفاده کردیم. مجموعه ای از نمونه های 1K به طور تصادفی از داده های آموزش به عنوان مجموعه اعتبار سنجی گرفته شد. جدول 2 کلیه آمار داده ها را خلاصه می کند.

معیارهای ارزیابی خودکار. ما از Asrbleu Metric استفاده می کنیم تا کیفیت ترجمه معنایی را به عنوان مطالعات موجود ترجمه گفتار اندازه گیری کنیم. Audios تولید شده ابتدا با ابزارهای ASR به متون رونویسی می شود و ما از مدل ASR انگلیسی Whisper English استفاده می کنیم[1] در این کار Bleu همپوشانی Ngram را بین رونوشت ها و ترجمه های حقیقت زمینی ارزیابی می کند.

متریک مهم دیگر است شباهت سبک صوتی (VSIM) ، با تعیین میزان صدای صوتی تولید شده در مقایسه با گفتار منبع از نظر سبک صوتی ، کمیت کنید. در زیر (بارو و همکاران ، 2023) ، ما تعبیه سبک آواز …

Source link