بهینه سازی خراش وب: نکاتی برای اسکراپرهای سریعتر و هوشمندتر

سلب مسئولیت: این قسمت 3 از سری شش تکه ما در مورد اسکرپینگ پیشرفته وب است. جدید به سریال؟ از ابتدا با خواندن قسمت 1 شروع کنید!

در قسمت 2 از سری Advanced Web Scraping ما، یاد گرفتید که چگونه داده ها را از SPA، PWA و سایت های مجهز به هوش مصنوعی خراش دهید. در حال حاضر، شما باید تمام دانش مورد نیاز برای ساخت یک اسکراپر را داشته باشید که در برابر اکثر وب سایت های مدرن کار می کند.

بعدش چی؟ زمان آن است که با چند نکته و ترفند خراش دادن حرفه ای اسکراپر خود را بهینه کنید!

خراش دادن وب ساده است – یا این است؟

ساخت یک اسکراپر وب؟ همه چیز در مورد اسکریپت است. 👨‍💻

و بیایید صادق باشیم – اگر تا به حال کد نوشته اید، می دانید که اسکریپت نویسی اینطور نیست که بیشتر اوقات سخت است چند خط اینجا، الف for در آنجا، و رونق، شما مانند یک حرفه ای داده ها را می خراشید. ساده به نظر می رسد، درست است؟ 😄

اما مشکل اینجاست: سادگی نوشتن یک خراش کوچک می تواند شما را دچار احساس امنیت کاذب کند. چرا با نظرات مناسب، رسیدگی به خطاها، گزارش‌ها یا حتی تورفتگی منظم در حالی که فقط ده‌ها خط کد است که هر کسی می‌تواند آن را بخواند، زحمت بکشید؟

شما نیازی به نظر ندارید… یا دارید؟شما نیازی به نظر ندارید… یا دارید؟

ما متوجه شدیم – چرا چیزی را بیش از حد مهندسی کنیم که به آن نیاز ندارد؟ مهندسی بیش از حد است دشمن پیشرفت اما چه اتفاقی می‌افتد زمانی که نیاز دارید اسکراپرهای خود را در چندین صفحه یا حتی کل سایت‌ها مقیاس کنید؟ 🤔

آن وقت است که خراش سریع و کثیف و با کد اسپاگتی شما از هم می پاشد! 🍝

توسعه دهندگان می توانند با لمس کد آنها عصبانی شوندبرنامه نویسان وقتی کد آنها را لمس می کنید عصبانی می شوند. 40 1x، https ://hackernoon.imgix.net/images/0FC9YtxD4fbD3T7mPipOt4HSxY42-2024-11-15T21:45:40.635Z-z8hyyk5fub8vsp8cj4v9dazi?auto=format .net/images/ 0FC9YtxD4fbD3T7mPipOt4HSxY42-2024-11-15T21:45:40.635Z-z8hyyk5fub8vsp8cj4v9dazi?auto=format&fit=max&w=828

Source link