❗سلب مسئولیت: این قسمت 3 از سری شش تکه ما در مورد اسکرپینگ پیشرفته وب است. جدید به سریال؟ از ابتدا با خواندن قسمت 1 شروع کنید!
در قسمت 2 از سری Advanced Web Scraping ما، یاد گرفتید که چگونه داده ها را از SPA، PWA و سایت های مجهز به هوش مصنوعی خراش دهید. در حال حاضر، شما باید تمام دانش مورد نیاز برای ساخت یک اسکراپر را داشته باشید که در برابر اکثر وب سایت های مدرن کار می کند.
بعدش چی؟ زمان آن است که با چند نکته و ترفند خراش دادن حرفه ای اسکراپر خود را بهینه کنید!
خراش دادن وب ساده است – یا این است؟
ساخت یک اسکراپر وب؟ همه چیز در مورد اسکریپت است. 👨💻
و بیایید صادق باشیم – اگر تا به حال کد نوشته اید، می دانید که اسکریپت نویسی اینطور نیست که بیشتر اوقات سخت است چند خط اینجا، الف for
در آنجا، و رونق، شما مانند یک حرفه ای داده ها را می خراشید. ساده به نظر می رسد، درست است؟ 😄
اما مشکل اینجاست: سادگی نوشتن یک خراش کوچک می تواند شما را دچار احساس امنیت کاذب کند. چرا با نظرات مناسب، رسیدگی به خطاها، گزارشها یا حتی تورفتگی منظم در حالی که فقط دهها خط کد است که هر کسی میتواند آن را بخواند، زحمت بکشید؟
ما متوجه شدیم – چرا چیزی را بیش از حد مهندسی کنیم که به آن نیاز ندارد؟ مهندسی بیش از حد است دشمن پیشرفت اما چه اتفاقی میافتد زمانی که نیاز دارید اسکراپرهای خود را در چندین صفحه یا حتی کل سایتها مقیاس کنید؟ 🤔
آن وقت است که خراش سریع و کثیف و با کد اسپاگتی شما از هم می پاشد! 🍝