ChatGPT почали використовувати для визначення місця, зображеного на фотографіях

Цього тижня OpenAI випустила нові моделі штучного інтелекту o3 та o4-mini, які нібито можуть “осмислювати” зображення. Насправді ці моделі здатні обрізати, обертати й наближувати фотографії – навіть нечіткі й спотворені – для ретельного аналізу, повідомляє Tech Crunch.

Ці спроможності аналізу зображень у поєднанні зі здатністю моделей шукати інформацію в інтернеті створюють потужний інструмент для пошуку місць. Користувачі соцмережі X швидко виявили, що o3, зокрема, дуже добре визначає міста, пам’ятки, а інколи навіть ресторани й бари за неочевидними візуальними підказками. У багатьох випадках моделі не використовують історію раніших взаємодій з ChatGPT або EXIF-дані – метадані, які прикріплюються до фотографій і розкривають, де було зроблено знімок.

Багато користувачів Х оприлюднили результати своїх експериментів, коли вони давали ChatGPT меню ресторанів, фото районів, фасади й власні селфі та просили o3 уявити, що вона грає в GeoGuesser – онлайн гру, яка пропонує гравцям вгадувати місця із зображень Google Street View.

Видання зауважує, що ця функція може призвести до проблем, повʼязаних з конфіденційністю. Ніщо не завадить зловмиснику зробити скріншот, скажімо, сторіс людини в Instagram і використати ChatGPT для доксингу (збирання та публікації особової чи ідентифікувальної інформації про певну особу чи організацію. – Ред.). Звісно, це можна було робити й до запуску o3 та o4-mini.

TechCrunch спробувала пропустити кілька фотографій через o3 і GPT-4o, старішу модель без можливостей аналізу зображень, щоб порівняти спроможність цих моделей вгадувати місце. Неочікувано GPT-4o часто давав правильний результат і працював навіть швидше за o3.

Водночас o3 кілька разів провалив завдання: ходив по колу, не міг надати впевнену відповідь або видавав неправильне місце. Користувачі на X також помітили, що o3 інколи сильно помиляється у своїх припущеннях.

Видання звернулося до OpenAI по коментар і згодом отримало таку заяву:

“OpenAI o3 й o4-mini додають у ChatGPT візуальне мислення, що робить його кориснішим у питаннях доступності, дослідження чи визначення місць у надзвичайних ситуаціях. Ми доклали зусиль, щоб навчити наші моделі відмовляти запитам на приватну чи чутливу інформацію, додали запобіжники, які мають заборонити моделі ідентифікувати приватних осіб на зображеннях, та активно моніторимо й вживаємо заходів проти порушень наших політик використання конфіденційності”.

Як повідомляв ІМІ, у березні популярність функції генерування зображень у стилі Studio Ghibli в чатботі ChatGPT спричинила рекордний сплеск активності програми, перевантаження серверів OpenAI і тимчасові обмеження на користування функцією.

Марія Ігнатьєва, Валентина Троян