گزینه های برتر برای متن ، تصویر و تولید فیلم

با وجود بسیاری از مدل های هوش مصنوعی امروزه ، تصمیم گیری در مورد شروع کار دشوار است. یک مطالعه جدید از POE Quora راهنمایی هایی را برای کسانی که در مورد انتخاب مدل ها مطمئن نیستند ، ارائه می دهد.

این مطالعه میلیون ها تعامل را برای برجسته کردن محبوب ترین ابزارهای تولید متن ، تصاویر و فیلم ها تجزیه و تحلیل می کند.

با تقریباً هر شرکت فناوری که یک راه حل هوش مصنوعی ارائه می دهد ، به راحتی می توان از انتخاب ها استفاده کرد. داده های پو توضیح می دهد که به کدام مدل ها مورد اعتماد و استفاده گسترده قرار می گیرند.

چه تازه وارد AI باشید و چه با تجربه باشید ، این گزارش روندهایی را نشان می دهد که می تواند به شما در یافتن بهترین مدل ها کمک کند. به یاد داشته باشید که این داده ها مشترکان POE را نشان می دهد و ممکن است جامعه گسترده تر هوش مصنوعی را منعکس نکند.

روند تولید متن

یک مسابقه دو طرفه

این مطالعه نشان می دهد که در بین مشترکان POE ، مدل های انسان شناسی به سرعت به اندازه OpenAI محبوب می شوند ، به خصوص پس از انتشار Claude 3.5 Sonnet. استفاده از مدل های متنی از هر دو ارائه دهنده اکنون تقریباً به طور مساوی تقسیم شده است.

پذیرش سریع نسخه های جدید

کاربران پو اغلب حتی اگر به یک برند خاص وفادار باشند ، به آخرین مدل ها تغییر می کنند. به عنوان مثال ، مردم به سرعت از GPT-4 Openai به GPT-4O یا از Claude 3 به Claude 3.5 حرکت می کنند.

بازیکنان در حال ظهور

R1 و V3 Deepseek حدود 7 ٪ از پیام های POE را ضبط کرده اند. Google Gemini Family شاهد کاهش جزئی در استفاده در بین مشترکان POE بوده اما همچنان یک بازیکن کلیدی است.

روند تولید تصویر

سهم بازار از حرکت دهنده های اولیه

دال E-3 و Stablediffusion زمانی رهبر تولید تصویر بودند ، اما سهام آنها حدود 80 ٪ کاهش یافته است. این کاهش با افزایش تعداد مدل های تولید تصویر از سه به حدود 25 رخ داد.

مدل های پیشرو

خانواده Flux از BlackForestLabs اکنون مدل تصویر پیشرو است و تقریباً 40 ٪ سهم را در اختیار دارد ، در حالی که خانواده Google Imagen3 حدود 30 ٪ سهم دارند.

مدل های کوچکتر

ارائه دهندگان تصویر کوچکتر مانند Playground و Ideogram خدمات خود را به طور مکرر به روز می کنند ، که به آنها کمک می کند تا یک پایگاه کاربر وفادار را حفظ کنند. با این حال ، آنها فقط حدود 10 ٪ از استفاده از تولید تصویر پو را تشکیل می دهند.

روند تولید ویدیویی

یک صنعت نوظهور

تولید فیلم تا اواخر سال 2024 تقریباً در POE وجود نداشت ، اما به سرعت محبوبیت زیادی پیدا کرده است. اکنون ، حداقل هشت ارائه دهنده این توانایی را ارائه می دهند.

باند: بیشترین استفاده از مدل

مدل ویدیویی تک باند 30 تا 50 ٪ از درخواست های تولید فیلم را کنترل می کند. اگرچه استفاده از آن پایین تر از گذشته است ، اما بسیاری از افراد هنوز این مارک را انتخاب می کنند.

بازیکن جدید: VEO-2

از زمان راه اندازی POE ، VEO-2 Google حدود 40 ٪ از بازار را به دست آورده است و نشان می دهد که ترجیحات مشتری به سرعت می تواند تغییر کند. سایر مدل های جدید ، مانند Kling-Pro V1.5 ، Hailuo-Ai ، Hunyuanvideo و WAN-21.1 ، حدود 15 ٪ از بازار را به خود اختصاص داده اند.

غذای کلیدی و نگاه به جلو

داده ها الگوی روشنی از مدل های جدیدتر جایگزین مدل های قدیمی تر در اولویت کاربر را نشان می دهد. اگر می خواهید بهترین عملکرد را داشته باشید ، به جای اینکه به مدل های آشنا اما منسوخ بپردازید ، از آخرین نسخه استفاده کنید.

این که آیا این الگوهای استفاده ثابت نگه داشته می شود یا همچنان به تغییر خود ادامه می دهد ، هنوز دیده نمی شود. در بعضی مواقع ، هزینه مانعی برای پذیرش خواهد بود ، زیرا مدل های جدید تمایل دارند با هر نسخه گرانتر شوند.

در گزارش های آینده ، POE قصد دارد بینش هایی را در مورد چگونگی متناسب با مدل های مختلف و نقاط قیمت به اشتراک بگذارد.


تصویر برجسته: Stokkete/Shutterstock

Source link