DeepSeek представляет Janus Pro: конкуренция для DALL-E 3
Всего через неделю после шокирующего выхода своего R1 LLM, компания DeepSeek заявила о новом продукте, который, по ее словам, готов соперничать с DALL-E 3 от OpenAI.
Janus Pro 1B и 7B, выпущенные на Hugging Face, являются группой многомодальных крупных языковых моделей (LLM), способных на генерирование изображений и обработку визуальных задач. Как и DALL-E 3, Janus Pro принимает входные данные и генерирует соответствующее изображение.
Модели заявляют об улучшениях по сравнению с предыдущей версией Janus 1.3B благодаря разделению визуального кодирования. Однако, несмотря на достижения, исследователи подчеркивают, что существует еще много работы, так как разрешение 384x384 пикселя ограничивает производительность в задачах, требующих детальной обработки.
AI, модели, новости