OpenAI با آخرین نوآوری خود دوباره موجی در دنیای فناوری ایجاد کرده است: GPT-4 با Vision یا GPT-4V.
دیدگاه GPT-4 برای نوشتن کد با یک طرح: https://t.co/xJy9yFNvKG
– گرگ براکمن (@gdb) 27 سپتامبر 2023
GPT-4V بر روی GPT-4 ساخته شده و قابلیت های بصری را در خود جای داده است و به مدل اجازه می دهد تصاویر ارائه شده توسط مشترکین ChatGPT Plus و Enterprise را تجزیه و تحلیل کند.
در دو هفته آینده برای کاربران پولی عرضه می شود!
– گرگ براکمن (@gdb) 27 سپتامبر 2023
ویژگی جدید پتانسیل بالایی دارد اما خطراتی را نیز برای مشاغل به همراه دارد.
GPT-4 با نمونه های ویژن
همانطور که کاربران بیشتری به ویژگی جدید دسترسی پیدا می کنند، نمونه هایی از نحوه عملکرد GPT-4 با Vision را به اشتراک می گذارند.
GPT-4 با Vision می تواند دست خط را تجزیه و تحلیل کند.
خیلی باحال. هوش مصنوعی در رمزگشایی دست خط بهتر از من است.
پروفسور برین پرسید که آیا GPT-4 با بینایی می تواند دست نوشته رابرت بویل را بخواند؟ این کار را به خوبی انجام می دهد!
احتمالاً برای تعدادی از رشتههای دانشگاهی مشکل بزرگی خواهد بود، به خصوص که هوش مصنوعی میتواند درباره متن «استدلال» کند. https://t.co/n9jUjqeEw3 pic.twitter.com/78jYWfIhCY
— اتان مولیک (@emollick) 27 سپتامبر 2023
می تواند با استفاده از نقاشی دستمال کاغذی برای یک وب سایت کد ایجاد کند.
این باور نکردنی است که مردم چگونه از GPT-4 با Vision استفاده می کنند.
pic.twitter.com/1O3AW7DJDr— Hushen Savani (@hushensavani) 27 سپتامبر 2023
می تواند الگوهای رفتاری را تجزیه و تحلیل کند.
این کاملا وحشی است. من کاملا لال هستم. pic.twitter.com/wGTAx1hFgS
– پیترو شیرانو (@skirano) 27 سپتامبر 2023
علاوه بر این مثال ها، چند تست ساده هم اجرا کردم.
GPT-4 با Vision می تواند توضیحات محصول را برای صفحات فروش شما و لیست آمازون بنویسد.
این می تواند به شما کمک کند تا با کدنویسی اولیه برای یک طراحی وب سایت خاص بر اساس یک اسکرین شات شروع کنید.
می تواند کپشن های خلاقانه اینستاگرام را با پیشنهادات هشتگ بنویسد.
می تواند بر اساس داده های یک وب سایت یا کتاب الکترونیکی، مانند وضعیت SEO 2024، مقاله بنویسد.
مانند تمام محتوای تولید شده با هوش مصنوعی، بررسی خروجی GPT-4 با Vision برای دقت ضروری است. هنوز هم توهم دارد و خطرات دیگری را به همراه دارد.
OpenAI خطرات بالقوه GPT-4V را آشکار می کند
OpenAI مقاله ای را منتشر کرد که خطرات بالقوه مرتبط با استفاده از GPT-4V را بیان می کند که عبارتند از:
- خطرات حریم خصوصی ناشی از شناسایی افراد در تصاویر یا تعیین موقعیت مکانی آنها، به طور بالقوه بر رویههای دادههای شرکتها و مطابقت آنها تأثیر میگذارد. این مقاله خاطرنشان می کند که GPT-4V تا حدی توانایی شناسایی شخصیت های عمومی و مکان یابی تصاویر را دارد.
- سوگیری های احتمالی در طول تجزیه و تحلیل و تفسیر تصویر می تواند بر گروه های جمعیتی مختلف تأثیر منفی بگذارد.
- خطرات ایمنی ناشی از ارائه توصیههای پزشکی نادرست یا غیرقابل اعتماد، دستورالعملهای خاص برای کارهای خطرناک، یا محتوای نفرتانگیز/خشونتآمیز.
- آسیبپذیریهای امنیت سایبری مانند حل کردن CAPTCHA یا جیلبریکهای چندوجهی.
خطرات ناشی از مدل منجر به محدودیت هایی مانند امتناع آن از ارائه تجزیه و تحلیل تصاویر با افراد شده است.
به طور کلی، برندهایی که علاقه مند به استفاده از GPT-4V برای بازاریابی هستند، باید این خطرات و سایر خطرات استفاده از هوش مصنوعی مولد را ارزیابی و کاهش دهند تا از این فناوری به طور مسئولانه استفاده کنند و از تأثیرات منفی بر مصرف کنندگان و شهرت برند جلوگیری کنند.
اولین شریک OpenAI که ورودی تصویر را برای “در دسترس بودن گسترده تر” آماده کرد
OpenAI اعلام کرد که GPT-4 با مدل Vision، یک دستیار دیجیتالی بصری طراحی شده برای افراد کم بینا، Be My Eyes Virtual Volunteer را تامین می کند.
اگرچه این فناوری هنوز در مرحله بتا است، اما احتمالات وسوسه انگیز است. برای مثال، این فناوری میتواند به کسبوکارها در افزایش دسترسی در خدمات مشتری کمک کند.
Be My Eyes قصد دارد این ویژگی را با مشتریان شرکتی آزمایش بتا کند و بر پتانسیل تجاری آن فراتر از مخاطبان اصلی خود تأکید کند.
آینده GPT-4 با چشم انداز
کاربردهای بالقوه GPT-4 With Vision برای مشاغل، بازاریابان و متخصصان سئو می تواند راهگشا باشد.
با این حال، همه کاربران باید به دلیل مشکلات احتمالی حریم خصوصی، انصاف و امنیت سایبری که توسط GPT-4 با Vision و سایر مدلهای هوش مصنوعی ایجاد میشود، محتاط باشند.
تصویر ویژه: Tada Images/Shutterstock