چارچوبی جدید برای تحلیل روایات اخبار اقتصادی با استفاده از GPT-3.5: نتایج

نویسندگان:

(1) دبورا میوری، مؤسسه ریاضی، دانشگاه آکسفورد، آکسفورد، انگلستان و مؤسسه مالی کمی آکسفورد-من، آکسفورد، بریتانیا (نویسنده مسئول: دبورا میوری، [email protected])

(2) کنستانتین پتروف، سرمایه گذاری فیدلیتی، لندن، انگلستان.

چکیده و مقدمه

داده ها

چارچوب

نتایج

نتیجه گیری، قدردانی، و مراجع

4 نتیجه

4.1 معیار Word2vec

ما با در نظر گرفتن هر دو کلمه جاسازی شده از پیش آموزش دیده GoogleNews و FinText شروع می کنیم و نماینده برداری هر یک از کلمات کلیدی (موجودات یا مفاهیم) خود را که در اخبار شناسایی شده است پیدا می کنیم. متأسفانه، تنها 30٪ از موجودیت ها دارای یک بردار مرتبط در مدل GoogleNews هستند، در حالی که این درصد با مدل FinText به 50٪ افزایش می یابد. این به دلیل ترکیبی از چنین مدل‌هایی است که بر روی داده‌های منسوخ آموزش داده می‌شوند، و پیچیدگی ناکافی در کلمات کلیدی ما که گاهی توسط چندین کلمه ساخته می‌شوند. نکته مهم این است که “مفاهیم” بیشتر از نظر پیچیدگی و ساختار به جای “موجودات” و در نتیجه کاربرد کمتری دارند. بنابراین، مطالعه ما بر روی “موجودات” به عنوان کلمات کلیدی برای هر آزمایش بعدی تمرکز خواهد کرد.

ما از دو جاسازی برداری انتخاب شده برای ایجاد معیاری در مورد موضوعات اصلی مورد توجه اخبار ما استفاده می کنیم…

Source link