Apple выпустила новую нейросеть с функциями графического редактора MGIE
Команда Apple презентовала новую модель искусственного интеллекта под названием MGIE (MLLM-Guided Image Editing). Нейросеть может настраивать, изменять и редактировать изображения по текстовому описанию.
ИИ-модель MGIE имеет открытый исходный код и базируется на больших мультимодальных языковых моделях. Внесение изменений производится на пиксельном уровне с обеспечением высокого уровня четкости изображений.
MGIE предлагает несколько форматов редактирования фото и изображений:
- трансформации подобно графическому редактору Photoshop: изменение размера, обрезка, поворот, добавление фильтров, удаление объектов, изменение фона, объединение изображений и т.п.;
- улучшение фотографий по стандартным параметрам яркости, контрастности, резкости и художественным эффектам;
- точечные исправления в части поправок отдельных объектов, зон или участков.
В качестве демонстрации работы MGIE приведем простой пример: для фотографии стандартной пиццы пользователь вводит текстовую команду: «сделать пиццу более полезной». Нейросеть, используя обучающие навыки, может наложить на исходное фото пиццы полезные продукты — овощи, зелень.
Модель MGIE с открытым кодом, данными и обученными моделями размещена на GitHub. Протестировать модель также можно в режиме онлайн через пробную версию на открытой платформе машинного обучения Hugging Face Spaces.