"Imagen 3 - это наша высококачественная модель преобразования текста в изображение, способная генерировать изображения с еще большей детализацией, более насыщенным освещением и меньшим количеством отвлекающих артефактов, чем наши предыдущие модели", - говорится в официальном анонсе Google.
Google также подчеркнула свою приверженность безопасности и ответственности при разработке и внедрении Imagen 3. Компания внедрила процессы, которые она назвала “обширной фильтрацией и маркировкой данных”, чтобы свести к минимуму вредоносный контент в наборах данных для обучения модели. Кроме того, Google заявила, что провела тщательные оценки, включая упражнения red team, для выявления и устранения потенциальных уязвимостей. Также важно отметить, что Imagen 3 интегрирует SynthID, инструмент водяных знаков Google. SynthID встраивает цифровую подпись непосредственно в пиксели сгенерированных изображений.
Этот водяной знак незаметен человеческому глазу, но обнаруживается специализированным программным обеспечением, обеспечивающим идентификацию контента, созданного искусственным интеллектом. В настоящее время Imagen 3 доступен через платформу Google ImageFX и Vertex AI. Заглядывая в будущее, Google планирует внедрить в Imagen 3 популярные функции редактирования из Imagen 2, такие как inpainting (редактирование элементов изображения) и outpainting (его расширение) в ближайшие месяцы. Компания также объявила о намерениях расширить доступность Imagen 3 в своей более широкой продуктовой экосистеме, включая интеграцию в приложение Gemini, Google Workspace и Google Ads. Этот выпуск является частью более широкой стратегии Google, направленной на внедрение Gemini и технологий искусственного интеллекта практически во все свои сервисы и оборудование. На этой неделе компания представила свою новую линейку Pixel 9, которая была разработана с учетом возможностей искусственного интеллекта.
Новые телефоны Pixel могут выполнять определенные генеративные задачи искусственного интеллекта локально, включая текстовые задачи и генерацию небольших изображений. Выпуск Imagen 3 происходит на фоне бурной активности в сфере генерации изображений искусственного интеллекта. Недавно компания xAI Илона Маска представила Grok 2 с генератором изображений Flux.1, который привлек внимание своей способностью создавать высокореалистичные изображения без цензуры наряду с мощными возможностями генерации текста. Тем временем MidJourney, еще один ключевой игрок в этой области, объявила о скором обновлении своей модели версии 6.2.
Компания также прокомментировала разработку MidJourney v7, выпуск которой запланирован на ближайшие месяцы. Ideogram, еще один претендент на арене генерации изображений искусственного интеллекта, также намекнул на предстоящее обновление своей модели. Наконец. Инициатива "Открытая модель" выбрала Flux.1 в качестве основы для разработки своей современной модели генерации изображений с открытым исходным кодом.