Apple представляет новый редактор изображений MGIE
Apple в сотрудничестве с Университетом Санта-Барбары создали новый инструмент в области искусственного интеллекта (ИИ) — редактор изображений MGIE, позволяющий пользователям взаимодействовать с моделью на естественном языке.
Этот метод демонстрирует превосходные результаты по сравнению с другими распространенными методиками, такими как Pix2Pix. Редактор MGIE использует мультимодальные большие языковые модели (MLLMs) для обработки текстовых команд и редактирования изображений.
Используя MGIE, пользователи могут давать подробные инструкции, которые затем превращаются в команды для редактирования изображений. Например, можно изменить цвет волос персоны на фотографии, просто сказав: 'сделай этого человека рыжим'. MGIE распознает команду, сегментирует волосы на картинке и осуществляет изменения.
Открывая свою модель для сообщества как открытое ПО, Apple стремится устанавливать стандарты в индустрии ИИ и привлекать таланты из всего мира.
ИИ, редактирование, язык