OpenAI представила новую голосовую версию нейросети GPT-4o
OpenAI сообщила о запуске новой версии искусственного интеллекта под названием GPT-4o. Нейросеть наделена возможностью вести диалог в формате голосовых сообщений и в режиме реального времени.
Компания предполагает внедрить новую разработку в чат-бот ChatGPT, который уже имеет голосовой интерфейс. С новой нейросетью акцент будет сделан на обновление системы коммуникаций между человеком и чат-ботом, который должен функционировать, как непосредственный помощник.
Языковая модель GPT-4o способна генерировать текст, звук и изображения. Пользователь сможет не просто разговаривать с чат-ботом, а, например, прервать его, и направить беседу в другое русло. Скорость реагирования нейросети на аудио сигнал соизмерима со скоростью реакции человека при разговоре.
Новая технология снабжена эмоциональной наполненностью и интонационными модуляциями голоса. Всё это она может применять во время разговора. Ещё GPT-4o показала способности к аналитическому мышлению. Её показатель по результатам тестирования общих знаний составил 88,7%.
В OpenAI отметили, что GPT-4o по производительности сопоставима с PT-4 Turbo, но имеет улучшенные показатели по распознанию изображений, скриншотов и аудио текстов по сравнению с действующими моделями.
Буква «о» в названии нейросети обозначает сокращенный вариант от слова «omni» (в переводе на русский — «всесторонний»).
Доступ к GPT-4o предоставлен на более чем 50 языках, русский язык тоже в их числе. Но, пройти верификацию на сайте OpenAI по российскому номеру телефона не получится. Несмотря на то, что нейросетью можно воспользоваться уже с 13 мая, голосовые функции пока доступны ограниченной группе пользователей. С июня доступ к голосовым возможностям GPT-4o будет предоставлен платным подписчикам.