Чат-боты DeepMind, Grok, ChatGPT и другие проваливают тест на юмор
Ведущие технологические компании прилагают значительные усилия для создания более юмористических чат-ботов. Исследователи DeepMind недавно изучили, способны ли модели искусственного интеллекта создавать качественный комедийный контент.
В опубликованной ранее в этом месяце статье исследователи DeepMind опросили 20 профессиональных комиков об их опыте использования чат-ботов для написания шуток. Результаты оказались менее чем впечатляющими.
Комики сочли шутки ИИ скучными, неоригинальными и чрезмерно корректными. Один из них назвал их «комедийным материалом круизных лайнеров 1950-х годов, но менее расистским». Несмотря на то, что некоторые комики признали, что ИИ способен создать сырые черновики, мало кто был доволен окончательным продуктом.
«Наши участники подчеркнули, что комедия — это сугубо человеческое занятие, которое требует от юмористов и исполнителей опираться на личный опыт, социальный контекст и понимание своей аудитории», — отметила исследователь DeepMind Джульетта Лав (Juliette Love). Это ставит новые задачи перед современными моделями ИИ, которые обычно обучаются на неконтекстных данных.
Источник: Dall-E
DeepMind — не единственная компания, которая размышляет о чувстве юмора ИИ. Компания xAI Илона Маска позиционирует Grok как более забавную альтернативу конкурирующим чат-ботам. На минувшей неделе Anthropic выпустила новую модель искусственного интеллекта, Claude 3.5 Sonnet, которая, по заявлениям, помимо других улучшений, значительно лучше улавливает нюансы и юмор. А в одной из недавних демонстраций OpenAI пользователь рассказывает шутку о последней версии GPT с голосовой поддержкой, чтобы узнать, оценит ли её инструмент. Чат-бот «смеялся», хотя, возможно, не совсем убедительно.
«Юмор — крепкий орешек. Я не думаю, что Клод силён, как комик, ради выступления которого люди готовы платить деньги, но я думаю, что мы определённо достигли улучшений», — сказала Даниэла Амодей (Daniela Amodei), президент и соучредитель Anthropic.
Для технологических компаний сделать искусственный интеллект забавным — серьёзное дело. Сейчас основной упор делается на разработку диалоговых чат-ботов, которые могут обрабатывать всё более сложные запросы пользователей, но при этом быть достаточно приятными, чтобы пользователи захотели продолжать взаимодействовать с ними.
«Если подумать о людях, с которыми вам, вероятно, больше всего нравится работать, то они профессиональны, открыты, честны и могут привнести немного юмора в разговор, не так ли?», — сказала Амодей.
В ходе экспериментов с некоторыми ведущими чат-ботами можно обнаружить, что юмор ИИ ограничен. Например, можно попросить Grok рассказать анекдот о генеральном директоре OpenAI Сэме Альтмане. В таком эксперименте Grok «выбрал», возможно, самый скучный вариант: «Почему Сэм Альтман перешёл дорогу? Чтобы перейти на другую сторону революции искусственного интеллекта!»
ChatGPT из OpenAI, Gemini из Google и Клода из Anthropic могут показаться такими же скучными. Claude использовал ту же схему «перехода дороги», но с другой изюминкой: «Чтобы повернуться на другую сторону!»
Gemini были немного оригинальней: «Сэм Альтман заходит в бар и заказывает для всех по коктейлю. Бармен говорит: «Ух ты, это щедро! По какому поводу?» Сэм отвечает: «Просто праздную достижение AGI… снова»».
Основываясь на этих результатах, можно сделать вывод, что чат-ботам с искусственным интеллектом стоило бы быть немного более остроумными, но Лав из DeepMind считает, что такой подход «может увеличить потенциальный вред некоторым группам».
«Мы должны соблюдать тщательный баланс. Граница между смешным и оскорбительным проходит в разных местах для разных аудиторий. Важно свести к минимуму этот риск», — написала она.
Разработка искусственного интеллекта с чувством юмора оказалась сложной задачей для технологических компаний. Хотя такие компании, как DeepMind, Anthropic и OpenAI, достигли прогресса в улучшении понимания и генерации юмора своими моделями, нынешние чат-боты всё ещё далеки от того, чтобы быть действительно забавными.
Причина этого заключается в том, что юмор имеет множество тонкостей и нюансов, которые трудно запрограммировать. Хорошая шутка должна быть не только смешной, но и уместной и не оскорбительной. Чат-боты должны также уметь распознавать и реагировать на различные типы юмора, такие как ирония, сарказм и абсурд. Помимо технических трудностей, существуют также этические соображения, связанные с юмором искусственного интеллекта. Использование уничижительных терминов или стереотипов может оскорбить отдельные лица или группы.
Несмотря на эти проблемы, гонка за созданием искусственного интеллекта с чувством юмора, продолжается. Поскольку технологические компании продолжают улучшать свои модели и разрабатывать новые подходы, вполне возможно, что в скором времени появятся чат-боты, которые действительно смогут рассмешить.