Global-News.com.ua

Для обучения GPT-4 компания OpenAI транскрибировала более миллиона часов видео с YouTube

Апрель 07
01:47 2024

Недавно мы сообщали о том, что компании, создающие большие языковые генеративные модели, сталкиваются с проблемой недостатка качественных данных для обучения своих ИИ. Как сообщается, OpenAI частично решила проблему благодаря YouTube. 



создано DALL-E

Ещё для обучения GPT-4 компания создала модель транскрипции аудио Whisper и в итоге перевела в текст более миллиона часов видео с YouTube. The New York Times говорит, что OperAI прекрасно понимала, что это серая зона с юридической точки зрения, но всё равно пошла на это. Вполне возможно, сейчас для обучения GPT-5 компания пользуется в том числе этим же методом. 

Источник говорит, что уже для GPT-4 компания OpenAI фактически исчерпала все запасы качественных данных для обучения, причём ещё в 2021 году.  

Статьи по теме

Последние новости

Значок Ferrari на капоте, мотор Mitsubishi и две двери — всего 450 тыс. рублей. В России выставили на продажу необычный ТагАЗ Aquila

Читать всю статью

Наши партнёры

UA.TODAY - Украина Сегодня UA.TODAY