Google анонсировала обновленную модель Gemini 2.0
Компания Google показала новую версию своей многофункциональной модели на базе искусственного интеллекта Gemini 2.0. Модель имеет лучшие результаты по ключевым показателям по сравнению со своей предшественницей Gemini 1.5 Pro и обладает более высокой производительностью.
Gemini 2.0 содержит встроенную поддержку мультимодальных входных данных, среди которых изображения, видео и аудио. Умеет преобразовывать текст в речь на нескольких языках и генерировать изображения по смешанным запросам. Модель также способна использовать для работы дополнительные инструменты, такие как Google Search, Lens и Maps.
В Gemini 2.0 применены новые разработки, которые расширяют агентные возможности систем ИИ. Например, Project Mariner — один из агентов ИИ, который понимает и преобразовывает информацию с экрана при работе в браузере и может самостоятельно управлять интерфейсом. В Projectе Astra создана система, которая способна ориентироваться в пространстве. Для разработчиков предлагается инструмент Jules — это агент для создания кода на базе ИИ, он также помогает находить и исправлять ошибки в программном коде. В Google утверждают, что системы агентного ИИ максимально приближают возможность выполнения отдельных задач вместо человека.
Google планирует постепенно внедрять Gemini 2.0 на всех платформах корпорации. На данном этапе Gemini доступна для первых пользователей через веб-приложение в версии 2.0 Flash. Также Gemini 2.0 Flash появится в приложении чат-бота Gemini в январе 2025 года.