OpenAI стремится собирать данные из большего количества языков и культур

Nov 12

В четверг стартап, занимающийся искусственным интеллектом, объявил о попытке сотрудничать со сторонними организациями в сборе данных, которые отражают человеческое общество.

OpenAI планирует расширить свою работу со сторонними организациями для сбора данных из более широкого спектра языков, тем и культур, чтобы создать общедоступные наборы данных, которые каждый может использовать для обучения инструментам искусственного интеллекта, которые более репрезентативны для мира.

OpenAI планирует расширить свою работу со сторонними организациями для сбора данных из более широкого спектра языков, тем и культур, чтобы создать общедоступные наборы данных, которые каждый может использовать для обучения инструментам искусственного интеллекта, которые более репрезентативны для мира.

Стартап из Сан-Франциско заявил в четверг, что хотел бы, чтобы группы и сообщества связались с ним для сотрудничества в области партнерства в области данных с целью сбора больших объемов данных, которые отражают человеческое общество.

Компания также заявила, что работает над созданием частных наборов данных — например, данных, которыми организации или компании не хотят делиться с другими — которые также можно использовать для обучения ИИ.

Большие языковые модели, такие как GPT-4 от OpenAI, который используется для поддержки ChatGPT, получают из Интернета огромное количество текстов, чтобы они могли определить, как давать пользователям релевантные, человечные ответы, но эти системы искусственного интеллекта обычно непропорционально полагаются на англоязычные данные и игнорируют культуры и языки, которые меньше представлены в Интернете.

В результате эти системы могут закреплять предвзятости или дезинформацию. Некоторые технологические компании, в том числе Microsoft Corp. и Google, обратились к сторонним поставщикам данных , чтобы начать заполнять пробелы в различных языках.

«Мы действительно думаем, что каждый язык, каждое человеческое начинание и деятельность могут принести пользу этим моделям», — сказал президент OpenAI Грег Брокман. «Это своего рода улица с двусторонним движением - чем больше вы можете представить свои данные в модели, тем лучше модель будет работать в этой области».

OpenAI заявила, что хочет включить текст, изображения, аудио и видео, к которым широкой публике пока сложно получить доступ в Интернете.

Компания, занимающаяся искусственным интеллектом, заявила, что уже работала с партнерами над сбором данных обучения из разных стран и отраслей, включая правительство Исландии и технологическую компанию Miðeind ehf , которая использует искусственный интеллект для сохранения исландского языка.

Это позволило OpenAI улучшить способность своей модели ИИ GPT-4 воспринимать подсказки на исландском языке и отвечать на них как на английском, так и на исландском языке, в зависимости от контекста.

На вопрос, будет ли OpenAI платить тем, кто предоставляет данные для этой работы, Брокман ответил, что такие договоренности будут в высшей степени зависеть от партнера.

Latest from our blog

news

Мошенничество с использованием искусственного интеллекта для «клонирования голоса» набирает обороты. Вот как защитить себя.

Жительница Калифорнии заявила, что в этом месяце стала жертвой мошенников и...

Автомобильная промышленность готовится к дефициту моторного масла.

Оптовые цены на моторное масло стремительно растут, а некоторые представители отрасли предупреждают о скором дефиците, вызванном войной с Ираном...

news

Microsoft, Google и xAI позволят правительству протестировать свои модели ИИ перед запуском.

Google, Microsoft и xAI будут предоставлять правительству ещё не выпущенные версии своих ИИ-моделей для снижения киберугроз, сообщил Национальный институт стандартов и технологий США во вторник.

news

Новому генеральному директору Apple предстоит унаследовать высокие показатели продаж и еще более высокие ожидания.

Генеральный директор Apple Tim Cook привык отвечать на вопросы о стратегии компании, тарифах и искусственном интеллекте. Но...

LBC Academy is a learning platform with a vision of providing life-transforming educational experiences to all kind of learners around the world.

Company

Legal

Social