مرورگر Edge تمام تصاویر وب را با هوش مصنوعی بهبود می بخشد

مایکروسافت بینگ یک فناوری جدید هوش مصنوعی را معرفی کرد که تجربه تصویر 4K را از طریق مایکروسافت اج به وب‌سایت‌ها می‌آورد و به طور خودکار تصاویر وب‌سایت را بهبود می‌بخشد. این فناوری که Turing Image Super-Resolution نام دارد، باعث می شود تصاویر با وضوح بالا نمایش داده شوند، مهم نیست که تصویر اصلی چقدر ضعیف باشد.

این فناوری جدید توسط تیم توسعه هوش مصنوعی پروژه تورینگ مایکروسافت توسعه یافته است.

قبلاً در نقشه های بینگ استفاده شده است

این فناوری جدید در حال حاضر در نقشه های بینگ برای افزایش کیفیت تصاویر هوایی ماهواره ای آنها استفاده می شود.

در زیر مقایسه ای از تصاویر هوایی از مقر گوگل در Mountain View، CA ارائه شده است.

اسکرین شات نقشه بینگ در سمت چپ و تصویر مربوطه از نقشه گوگل در سمت راست است:

نقشه های بینگ در مقابل نقشه های گوگل

مقایسه کنار هم نقشه های بینگ در مقابل تصاویر هوایی نقشه های گوگل

چگونه مایکروسافت این فناوری را ساخت

چهار بینش مهم وجود داشت که منجر به موفقیت این مدل شد.

  1. ارزیاب های انسانی
  2. مدل سازی نویز
  3. از دست دادن ادراکی و GAN
  4. Transformers for Vision: Enhance and Zoom

ارزیاب های انسانی

مایکروسافت متوجه شد که معیارهای مورد استفاده برای سنجش موفقیت مدل‌های مرتبط با تصویر با ادراک بصری انسان همخوانی ندارد. بنابراین آنها یک ابزار مقایسه بصری کنار هم ایجاد کردند که از ارزیابی کننده های انسانی برای کمک به ارزیابی موفقیت مدل استفاده می کرد.

مدل سازی نویز

مایکروسافت این رویکرد را در پیش گرفت که با تصاویر با کیفیت بالا شروع کرد و سپس آنها را با اضافه کردن نویز به آنها کاهش داد و سپس به مدل آموزش داد تا تصویر را به حالت اولیه با کیفیت بالا برگرداند.

از دست دادن ادراکی و GAN

این بخشی از تلاش برای همسو کردن نتایج با دید انسان بود.

در بیانیه مایکروسافت آمده است:

ما دریافتیم که بهینه‌سازی مدل‌های ما صرفاً با استفاده از کاهش پیکسل بین تصاویر خروجی و تصاویر حقیقت زمینی برای تولید خروجی بهینه که با ادراک چشم انسان همسو باشد کافی نیست.

در پاسخ، ما همچنین از دست دادن ادراکی و GAN را معرفی کردیم و یک ترکیب وزنی بهینه از سه تلفات را به عنوان یک تابع هدف تنظیم کردیم.

ترانسفورماتور برای ویژن

مایکروسافت از قدرت ترانسفورماتورهایی استفاده کرد که در مدل‌های زبانی استفاده می‌شد و بر روی افزایش و زوم تمرکز داشت.

این به معنای بهبود تصویر و همچنین تمرکز بر افزایش مقیاس تصویر است که انجام آن کاری دشوار است.

به طور معمول کوچک کردن یک تصویر آسان است. اما گرفتن یک تصویر کوچک و بزرگ کردن آن به طور کلی منجر به بزرگنمایی مصنوعات با وضوح پایین تصویر اصلی می شود.

بنابراین کاری که محققان انجام دادند ایجاد سیستمی بود که می‌تواند داده‌های تصویر گمشده را از تصویر با وضوح پایین‌تر محاسبه و «بازیابی» کند و آن را به وضوح بالاتر برساند.

مایکروسافت فرآیند افزایش مقیاس تصویر را DeepZoom می نامد.

لبه: تلویزیون 4K از مرورگرهای وب

مایکروسافت این ویژگی جدید هوش مصنوعی را به عنوان راهی برای ارائه یک تجربه بصری 4K در وب گردی و همچنین بهبود جلسات ویدیویی و عکس های خانوادگی آپلود شده در وب در نظر می گیرد.

این فناوری در حال حاضر در نسخه آزمایشی Edge به نام Edge Canary موجود است.

این ویژگی جدید در ماه‌های آینده برای نسخه اصلی مرورگر Edge عرضه خواهد شد.

نقل قول

اطلاعیه مایکروسافت را بخوانید

وضوح تصویر تورینگ فوق العاده