شروع با چارچوب Vision Apple: چشم انداز یک توسعه دهنده

چارچوب Vision توسط اپل در سال 2017 در WWDC به عنوان بخشی از iOS 11 معرفی شد. پرتاب آن نقطه عطفی در تکامل دید دستگاه و تجزیه و تحلیل تصویر بود و ابزارهای بومی را برای تجزیه و تحلیل محتوای بینایی و انجام پردازش بعدی در صورت لزوم ارائه می دهد.

در سال 2017 ، Vision معرفی شد:

  • تشخیص متن
  • شناخت چهره
  • تشخیص اشکال مستطیل
  • بارکد و تشخیص کد QR

از زمان اولین حضور خود ، اپل به طور مداوم چارچوب بینایی را تقویت کرده است ، و اطمینان حاصل می کند که آن را برای تحقق الزامات مدرن تکامل می بخشد. در پایان سال 2024 ، با انتشار iOS 18 ، Vision Now ارائه می دهد:

  • دقت تشخیص متن با پشتیبانی از تعداد زیادی از زبان ها
  • تشخیص چهره ها و ویژگی های آنها
  • توانایی تجزیه و تحلیل حرکات
  • توانایی تشخیص پوزها ، از جمله موقعیت دست و نقاط کلیدی بدن انسان
  • پشتیبانی از ردیابی اشیاء در ویدیو
  • ادغام بهبود یافته با Coreml برای کار با مدل های یادگیری ماشین سفارشی
  • ادغام عمیق با چارچوب های مرتبط ، مانند Avkit ، Arkit

با ظهور چارچوب Vision ، توسعه دهندگان این امکان را به دست آوردند که بدون تکیه بر راه حل های شخص ثالث ، کارهای پیشرفته تصویر و تجزیه و تحلیل ویدیویی را بصورت بومی انجام دهند. این قابلیت ها شامل اسکن اسناد ، شناخت متن ، شناسایی چهره ها و نکات ، …

Source link