Новости Март 26, 2025
Около года назад OpenAI выкатила GPT-4o, и с тех пор модель прокачали, добавив новые фишки. Самая свежая — генерация изображений. Теперь этот ИИ не просто рисует детализированные картинки, но и понимает, что от него хотят, позволяя редактировать результат пошагово, пока картинка в точности не совпадёт с тем, что у вас в голове.
Помните, как старые нейросети справлялись с текстом? Просите сгенерировать вывеску — получаете либо набор букв, который похож на заклинание вызова демона, либо каракули, не имеющие отношения к алфавиту. GPT-4o работает иначе: сначала вы просите создать картинку, потом уточняете детали, меняете элементы, добавляете что-то новое — и так до победного. Можно даже загружать свои изображения и модифицировать их. Например, взяли фото кота, надели на него детективную шляпу и монокль, а потом доработали картинку так, чтобы она выглядела как скриншот из RPG. Можно объединять несколько картинок в одну, перенося элементы из разных источников.


OpenAI утверждает, что GPT-4o гораздо лучше справляется с такими задачами, чем конкуренты. Он способен работать с 10-20 объектами в одной сцене, не теряя логики (для сравнения: другие модели начинают путаться уже после 5-8 предметов). Правда, нейросеть пока не идеальна. Иногда она зачем-то обрезает картинки снизу, выдаёт странные "галлюцинации", с трудом рендерит текст на кириллице и вообще требует времени на шлифовку.
Но потенциал огромный. Простота управления, возможность интерактивного редактирования и высокая детализация делают GPT-4o серьёзным инструментом для художников, дизайнеров и просто тех, кто хочет повеселиться с нейросетью. Вопрос только в том, сколько попыток потребуется, чтобы получить идеальный результат — OpenAI честно признаётся, что многие демонстрационные картинки были выбраны из двух, а то и восьми вариантов.