Китайский техногигант представил новый AI-бот QVQ-Max — модель визуального рассуждения, которая умеет анализировать фото и видео, а затем логически размышлять над ними. То есть это уже не просто болтливый чат-бот, а нечто ближе к цифровому Шерлоку, способному разбирать картинки и видео на смысловые куски.
Meta продолжает активно пихать ИИ куда только можно, даже если этого никто не просил. После провала эксперимента с "персонажами на основе ИИ" (которые оказались криповыми и бесполезными), компания теперь хочет внедрить ИИ в комментарии Instagram. Ну а что, зачем тратить секунды на то, чтобы написать пару слов другу, если за тебя это может сделать алгоритм?
Пока мы тут обсуждаем, как AI отнимает работу у копирайтеров, OpenAI делает следующий шаг — теперь он целится на дикторов и колл-центры. Компания выкатила новые модели для распознавания и синтеза речи, которые, по их словам, станут самой продвинутой основой для голосовых агентов.
В 2025 году технокомпании играют в гонку вооружений, но вместо ракет на орбите — большие языковые модели (LLM), а вместо ядерных испытаний — заявления о скором появлении AGI (искусственного общего интеллекта).
Google снова жмёт на газ в гонке искусственного интеллекта и делает Deep Research доступным бесплатно для всех. Плюс выкатывает свежие экспериментальные модели Gemini 2.0 Flash, 2.0 Pro и Personalisation. Всё это уже можно попробовать на Android, iOS и в браузере.
Пока одни используют ИИ для генерации котиков, другие нашли ему применение поинтереснее. Пользователи соцсетей выяснили, что новый Gemini 2.0 Flash от Google умеет старательно стирать водяные знаки с изображений, включая контент от Getty Images и других стоков.
На следующей неделе в Сан-Хосе стартует GTC 2025 — главная конференция Nvidia, где намечается тонна анонсов.