چارچوب Vision توسط اپل در سال 2017 در WWDC به عنوان بخشی از iOS 11 معرفی شد. پرتاب آن نقطه عطفی در تکامل دید دستگاه و تجزیه و تحلیل تصویر بود و ابزارهای بومی را برای تجزیه و تحلیل محتوای بینایی و انجام پردازش بعدی در صورت لزوم ارائه می دهد.
در سال 2017 ، Vision معرفی شد:
- تشخیص متن
- شناخت چهره
- تشخیص اشکال مستطیل
- بارکد و تشخیص کد QR
از زمان اولین حضور خود ، اپل به طور مداوم چارچوب بینایی را تقویت کرده است ، و اطمینان حاصل می کند که آن را برای تحقق الزامات مدرن تکامل می بخشد. در پایان سال 2024 ، با انتشار iOS 18 ، Vision Now ارائه می دهد:
- دقت تشخیص متن با پشتیبانی از تعداد زیادی از زبان ها
- تشخیص چهره ها و ویژگی های آنها
- توانایی تجزیه و تحلیل حرکات
- توانایی تشخیص پوزها ، از جمله موقعیت دست و نقاط کلیدی بدن انسان
- پشتیبانی از ردیابی اشیاء در ویدیو
- ادغام بهبود یافته با Coreml برای کار با مدل های یادگیری ماشین سفارشی
- ادغام عمیق با چارچوب های مرتبط ، مانند Avkit ، Arkit
با ظهور چارچوب Vision ، توسعه دهندگان این امکان را به دست آوردند که بدون تکیه بر راه حل های شخص ثالث ، کارهای پیشرفته تصویر و تجزیه و تحلیل ویدیویی را بصورت بومی انجام دهند. این قابلیت ها شامل اسکن اسناد ، شناخت متن ، شناسایی چهره ها و نکات ، …