OpenAI планирует расширить свою работу со сторонними организациями для сбора данных из более широкого спектра языков, тем и культур, чтобы создать общедоступные наборы данных, которые каждый может использовать для обучения инструментам искусственного интеллекта, которые более репрезентативны для мира.
Стартап из Сан-Франциско заявил в четверг, что хотел бы, чтобы группы и сообщества связались с ним для сотрудничества в области партнерства в области данных с целью сбора больших объемов данных, которые отражают человеческое общество.
Компания также заявила, что работает над созданием частных наборов данных — например, данных, которыми организации или компании не хотят делиться с другими — которые также можно использовать для обучения ИИ.
Большие языковые модели, такие как GPT-4 от OpenAI, который используется для поддержки ChatGPT, получают из Интернета огромное количество текстов, чтобы они могли определить, как давать пользователям релевантные, человечные ответы, но эти системы искусственного интеллекта обычно непропорционально полагаются на англоязычные данные и игнорируют культуры и языки, которые меньше представлены в Интернете.
В результате эти системы могут закреплять предвзятости или дезинформацию. Некоторые технологические компании, в том числе Microsoft Corp. и Google, обратились к сторонним поставщикам данных , чтобы начать заполнять пробелы в различных языках.
«Мы действительно думаем, что каждый язык, каждое человеческое начинание и деятельность могут принести пользу этим моделям», — сказал президент OpenAI Грег Брокман. «Это своего рода улица с двусторонним движением - чем больше вы можете представить свои данные в модели, тем лучше модель будет работать в этой области».
OpenAI заявила, что хочет включить текст, изображения, аудио и видео, к которым широкой публике пока сложно получить доступ в Интернете.
Компания, занимающаяся искусственным интеллектом, заявила, что уже работала с партнерами над сбором данных обучения из разных стран и отраслей, включая правительство Исландии и технологическую компанию Miðeind ehf , которая использует искусственный интеллект для сохранения исландского языка.
Это позволило OpenAI улучшить способность своей модели ИИ GPT-4 воспринимать подсказки на исландском языке и отвечать на них как на английском, так и на исландском языке, в зависимости от контекста.
На вопрос, будет ли OpenAI платить тем, кто предоставляет данные для этой работы, Брокман ответил, что такие договоренности будут в высшей степени зависеть от партнера.
Стартап из Сан-Франциско заявил в четверг, что хотел бы, чтобы группы и сообщества связались с ним для сотрудничества в области партнерства в области данных с целью сбора больших объемов данных, которые отражают человеческое общество.
Компания также заявила, что работает над созданием частных наборов данных — например, данных, которыми организации или компании не хотят делиться с другими — которые также можно использовать для обучения ИИ.
Большие языковые модели, такие как GPT-4 от OpenAI, который используется для поддержки ChatGPT, получают из Интернета огромное количество текстов, чтобы они могли определить, как давать пользователям релевантные, человечные ответы, но эти системы искусственного интеллекта обычно непропорционально полагаются на англоязычные данные и игнорируют культуры и языки, которые меньше представлены в Интернете.
В результате эти системы могут закреплять предвзятости или дезинформацию. Некоторые технологические компании, в том числе Microsoft Corp. и Google, обратились к сторонним поставщикам данных , чтобы начать заполнять пробелы в различных языках.
«Мы действительно думаем, что каждый язык, каждое человеческое начинание и деятельность могут принести пользу этим моделям», — сказал президент OpenAI Грег Брокман. «Это своего рода улица с двусторонним движением - чем больше вы можете представить свои данные в модели, тем лучше модель будет работать в этой области».
OpenAI заявила, что хочет включить текст, изображения, аудио и видео, к которым широкой публике пока сложно получить доступ в Интернете.
Компания, занимающаяся искусственным интеллектом, заявила, что уже работала с партнерами над сбором данных обучения из разных стран и отраслей, включая правительство Исландии и технологическую компанию Miðeind ehf , которая использует искусственный интеллект для сохранения исландского языка.
Это позволило OpenAI улучшить способность своей модели ИИ GPT-4 воспринимать подсказки на исландском языке и отвечать на них как на английском, так и на исландском языке, в зависимости от контекста.
На вопрос, будет ли OpenAI платить тем, кто предоставляет данные для этой работы, Брокман ответил, что такие договоренности будут в высшей степени зависеть от партнера.
