“کوروساوا”: دستیار فیلمنامه نویس: مجموعه داده

نویسندگان:

(1) پراک گاندی، گروه علوم و مهندسی کامپیوتر، موسسه فناوری هند بمبئی، بمبئی، [email protected]و این نویسندگان به طور مساوی به این کار کمک کردند.

(2) ویشال پرامانیک، گروه علوم و مهندسی کامپیوتر، موسسه فناوری هند بمبئی، بمبئی، ویشالپرامانیک،[email protected]و این نویسندگان به طور مساوی به این کار کمک کردند.

(3) Pushpak Bhattacharyya، گروه علوم و مهندسی کامپیوتر، موسسه فناوری هند بمبئی، بمبئی.

4. مجموعه داده

برای تولید داستان فیلم، ما طرح ها را از ویکی پدیا گرفته ایم. دستورات این کار از IMDb گرفته شده است. در IMDb این اعلان می تواند دو نوع باشد. اولین توضیح کوتاه (15 تا 40 کلمه) از فیلم است، در حالی که دومی یک خط داستانی طولانی است که از 30 تا 200 کلمه متغیر است و حاوی جزئیات بسیار بیشتری در مورد شخصیت ها و رویدادهای مختلف فیلم است. همچنین ژانرهای هر فیلم را از سایت IMDb جمع آوری کرده ایم. سپس با استفاده از ساختار 4 عملی، طرح ها را تقسیم می کنیم. برای تولید صحنه، اسکریپت ها را از IMSDb می گیریم و آنها را با عناصر کلیدی یک صحنه حاشیه نویسی می کنیم.

4.1. مجموعه داده های تولید پلات

ما مجموعه داده ای از 1000 طرح متشکل از توطئه های بالیوود و هالیوود ایجاد کرده ایم که از ویکی پدیا با استفاده از …

Source link