Новинки

Google запускает Whisk для креативного ремикса изображений

Published December 17, 2024

Google представила Whisk, новый инструмент генеративного ИИ, который делает создание изображений более интерактивным и креативным. В отличие от традиционных инструментов ИИ, которые требуют длинные текстовые подсказки, Whisk позволяет начать с изображений. Просто перетащите изображения в интерфейс, и Whisk создаст уникальные композиции, комбинируя ваши визуалы новыми способами.

С помощью Whisk пользователи могут загрузить до трёх изображений: одно для объекта, одно для фона и одно для стиля. Это даёт возможность создавать все, от цифровых мягких игрушек до эмалевых значков и стикеров. Примеры ранних работ включает фантазийную рыбу, игривого моржа и глазированный пончик в виде значка.

В основе Whisk лежит модель Gemini от Google, которая анализирует загруженные изображения и генерирует подробные подписи. Эти подписи обрабатываются через модель Imagen 3, сохраняя суть ваших изображений без точного воспроизведения. Этот процесс позволяет проводить эксперименты с различными вариантами объектов, стилей и фонов. Однако результаты могут иногда отличаться от ожиданий. Google предоставляет возможность редактировать подсказки, созданные ИИ, что даёт больший контроль над итогом.

Whisk создан для быстрого визуального исследования, чтобы художники и дизайнеры могли эффективно обсуждать идеи. С момента запуска пользователи положительно оценивают Whisk за его способность быстро генерировать креативные опции.

Google, искусственный, интеллект