ГАРЯЧА ЛІНІЯ(050) 447-70-63
на зв’язку 24 години
Залиште свої дані
і ми зв’яжемося з вами
дякуємо за звернення

Або ж зв’яжіться з нами:

[email protected]

(050) 447-70-63

Подай скаргу

Ideogram генерує на ШІ-зображеннях текст, який можна прочитати

Фото – Bloomberg
Фото – Bloomberg

Новий ШІ-стартап Ideogram дає користувачам змогу створити зображення, до прикладу кота у футболці з дотепним слоганом.

Про це пише Bloomberg.

Cтартап Ideogram, запущений у Торонто в серпні, може за секунди генерувати дуже реалістичні зображення на основі коротких текстових запитів. Але цей генератор також пішов на крок далі й може обробляти текст на цих зображеннях. Він може виробити картинку протестувальника з плакатом або милого котика у футболці, на якій чітко написано: "Спитай мене про мій ШІ-стартап". Розв’язання цієї, здавалося б, незначної технічної проблеми може мати широкі наслідки для всієї індустрії, а також указує на наступну фазу розвитку цієї технології. 

Інші популярні ШІ-генератори зображень на кшталт Midjourney, Dall-E 2 й Stable Diffusion часто видають нісенітницю, зазначає видання.

Втім, нова версія Dall-E від OpenAI, запуск якої заплановано на жовтень і яка наразі доступна через генератор зображень Bing, має схожу функцію. Stability AI також може відображати текст на зображеннях за допомогою програми DeepFloyd IF, але ця опція наразі недоступна для більшості користувачів.

Іншою метою Ideogram є зробити ШІ доступнішим для всіх, хто хоче за його допомогою генерувати переконливі зображення без потреби вигадувати складні описи, які вже отримали назву "запитобудування".

За словами гендиректора й співзасновника Ideogram Мохаммеда Норузі, з моменту запуску їхнього безкоштовного сервісу на нього підписалося 1,1 мільйона людей, які вже згенерували понад 80 мільйонів зображень (новим користувачам доведеться додаватися до списку очікування).

Завдяки своїм функціям Ideogram може згодом скласти конкуренцію маркетологам і творчим фахівцям. Утім, стартап, що дозволяє генерувати текст і спрощує створення будь-яких ШІ-зображень, може також стати інструментом для поширення дезінформації.

Норузі заявляє, що потенційна шкідлива поведінка є "серйозною темою" для Ideogram. Він не хоче, щоб його ШІ використовували для поширення, наприклад, дезінформації про вибори, але, як і багато представників індустрії технологій, наголошує на важливості свободи слова. Команда Ideogram намагається обмежити розповсюдження шкідливого контенту, автоматично фільтруючи деякі генеровані зображення й натомість показуючи картинку з котом, який тримає плакат "може бути небезпечно".

Всі зображення, створені Ideogram, і всі запити користувачів є публічними. Компанія сподівається, що це заохочуватиме пристойну поведінку. Втім, навіть без функції пошуку на їхньому сайті наразі легко знайти картинки, які перебувають на межі між загальноприйнятним і ризиковим контентом, наприклад зображення жінок-зірок, вкритих "фарбою для тіла".

На Discord-каналі компанії, де Норузі часто листується з користувачами, він заявив, що компанія планує дозволити людям генерувати приватні зображення. Функція створення тексту також може згодом допомогти Ideogram заробляти завдяки бізнесам, які хочуть за його допомогою створювати логотипи й інші маркетингові матеріали.

Liked the article?
Help us be even more cool!