Технология

Apple представляет новый редактор изображений MGIE

Published February 8, 2024

Apple в сотрудничестве с Университетом Санта-Барбары создали новый инструмент в области искусственного интеллекта (ИИ) — редактор изображений MGIE, позволяющий пользователям взаимодействовать с моделью на естественном языке.

Этот метод демонстрирует превосходные результаты по сравнению с другими распространенными методиками, такими как Pix2Pix. Редактор MGIE использует мультимодальные большие языковые модели (MLLMs) для обработки текстовых команд и редактирования изображений.

Используя MGIE, пользователи могут давать подробные инструкции, которые затем превращаются в команды для редактирования изображений. Например, можно изменить цвет волос персоны на фотографии, просто сказав: 'сделай этого человека рыжим'. MGIE распознает команду, сегментирует волосы на картинке и осуществляет изменения.

Открывая свою модель для сообщества как открытое ПО, Apple стремится устанавливать стандарты в индустрии ИИ и привлекать таланты из всего мира.

ИИ, редактирование, язык