Apr 2
OpenAI заявляет, что работает над ИИ, имитирующим человеческие голоса
OpenAI представила новый инструмент искусственного интеллекта, который может имитировать человеческие голоса с поразительной точностью. ИИ генератор голоса имеет ряд потенциальных применений, включая службы доступности, но также может вызвать опасения о распространении дезинформации и других форм злоупотребления.
OpenAI в пятницу поделилась образцами из ранних тестов инструмента, называемого Voice Engine, который использует 15-секундный образец человеческой речи для создания убедительной копии их голоса.
Пользователи могут предоставить абзац текста, и инструмент будет читать его голосом, сгенерированным ИИ.
Пользователи могут предоставить абзац текста, и инструмент будет читать его голосом, сгенерированным ИИ.
На рынке уже есть несколько сервисов с ИИ-голосами, доступных для общественности, но, как и с чатботом ChatGPT, OpenAI проявила особую способность привлечения широкого внимания к своим ИИ-инструментам.
ИИ-инструмент для преобразования текста в речь может помочь с переводом, помощью в чтении для детей или помощью людям, потерявшим способность говорить, говорит компания. Но некоторые скептики беспокоятся, что это также может способствовать созданию дезинформации или облегчить совершение мошенничества.
OpenAI сообщает, что Voice Engine в настоящее время используется только "небольшой группой доверенных партнеров", включая компании в области образования и здравоохранения, и будет использовать их тесты для определения того, разрешать ли и какую широкую аудиторию его использовать. Эти тестеры согласились не воссоздавать голоса людей без их явного согласия и ясно идентифицировать перед слушателями, что то, что они слышат, создано ИИ, согласно компании.
"Мы осознаем, что создание речи, похожей на голоса людей, несет серьезные риски, которые особенно актуальны в год выборов," — сказал OpenAI в блоге.
Компания признала необходимость крупных изменений по мере того, как синтетическая речь становится более широко доступной, хотя она не планирует немедленно выпускать Voice Engine в публичный доступ. Например, компания предложила отказаться от аутентификации по голосу для банковских счетов.
Компания признала необходимость крупных изменений по мере того, как синтетическая речь становится более широко доступной, хотя она не планирует немедленно выпускать Voice Engine в публичный доступ. Например, компания предложила отказаться от аутентификации по голосу для банковских счетов.
"Любое широкое внедрение синтетической речевой технологии должно сопровождаться опытами аутентификации по голосу, подтверждающими, что оригинальный диктор осознанно добавляет свой голос в службу, и списком неприемлемых голосов, который обнаруживает и предотвращает создание голосов, слишком похожих на выдающихся личностей," — сказал OpenAI.
Voice Engine может использовать образец голоса на одном языке, чтобы создать копию голоса, который может говорить на нескольких других языках.
В их блоге приведен пример аудиофрагмента человеческого чтения текста о дружбе, наряду с аудиофайлами, сгенерированными ИИ, которые звучат так, будто это тот же человек читает тот же текст на испанском, китайском, немецком, французском и японском языках. В каждом из сгенерированных ИИ образцов сохранены тон и акцент оригинального диктора.
Приведены ниже аудиообразцы от OpenAI, демонстрирующие работу Voice Engine. Первый аудиофрагмент — это реальная человеческая речь, которая использовалась как вход для инструмента.
Предварительный просмотр Voice Engine представлен, когда пользователи ожидают публичного выпуска Sora, ИИ-генератора видео, который OpenAI анонсировала в прошлом месяце. Sora может создавать реалистично выглядящие видеоролики длительностью 60 секунд по текстовым инструкциям, с возможностью предоставления сцен с несколькими персонажами, определенными видами движения и развернутыми деталями заднего плана. ChatGPT от OpenAI также может создавать изображения по текстовому запросу.
Отдельно OpenAI также объявила в понедельник, что предоставляет ChatGPT всем без необходимости регистрации для использования службы.
Компания отметила, что может использовать любой текст, загруженный в ChatGPT, для улучшения своих моделей, но сказала, что это можно отключить через настройки даже без учетной записи. Однако без учетной записи пользователи не смогут сохранять или просматривать историю чата или получать доступ к различным функциям, включая голосовые разговоры и настройки.
Latest from our blog
LBC Academy is a learning platform with a vision of providing life-transforming educational experiences to all kind of learners around the world.
Legal
Copyright © 2024