درک خطرات حریم خصوصی سیستم های تبلیغاتی محبوب موتورهای جستجو: روش اندازه گیری

:::info این مقاله در arxiv تحت مجوز CC0 1.0 DEED موجود است.

نویسندگان:

(1) Salim Chouaki، LIX، CNRS، Inria، Ecole Polytechnique، Institut Polytechnique de Paris.

(2) Oana Goga، LIX، CNRS، Inria، Ecole Polytechnique، Institut Polytechnique de Paris.

(3) حامد حدادی، امپریال کالج لندن، نرم افزار Brave;

(4) پیتر اسنایدر، نرم افزار شجاع.

:::

  • چکیده و مقدمه
  • زمینه
  • روش اندازه گیری
  • نتایج
  • محدودیت ها
  • کار مرتبط
  • نتیجه گیری، قدردانی و مراجع
  • ضمیمه

3 روش اندازه گیری

ما یک روش اندازه گیری برای ضبط جریان های شبکه هنگام کلیک کردن بر روی یک تبلیغ از صفحه نتایج موتور جستجو ایجاد می کنیم. با استفاده از خزنده‌های متعدد، تعداد زیادی درخواست موتور جستجو را شبیه‌سازی می‌کنیم تا نمونه‌ای از جریان‌های اطلاعات در هر موتور جستجو جمع‌آوری شود. برای هر درخواست، کوکی های ایجاد شده، مقادیر ذخیره شده محلی و درخواست وب ارسال شده توسط مرورگر را جمع آوری می کنیم. علاوه بر این، برای شناسایی درخواست‌های وب به ردیاب‌های آنلاین به چندین مجموعه داده منبع باز تکیه می‌کنیم. ما پنج موتور جستجوی اصلی را در نظر می گیریم: Google[1]، بینگ[2]، DuckDuckGo[3]، صفحه شروع[4]و Qwant[5]. ما از Google و Bing به عنوان خطوط پایه برای مقایسه با سه مورد دیگر استفاده می کنیم که ادعا می کنند استانداردهای حفظ حریم خصوصی و اقدامات حفاظتی بالاتری دارند.

\
شکل 2: ردیابی پرش.

\
شکل 3: قاچاق UID

3.1 خزیدن…