ИИ прошел мемный тест Тьюринга: GPT-4o оказался остроумнее людей

Группа ученых из Германии и Швеции провела исследование, в котором проверила, кто лучше справляется с созданием подписей к мемам — люди или искусственный интеллект. Эксперимент включал три сценария: в первом случае участники самостоятельно придумывали подписи, во втором — могли использовать идеи чат-бота GPT-4o, а в третьем все подписи создавал исключительно ИИ. В качестве основы для мемов были выбраны популярные изображения, а текстовые подписи касались тем работы, еды и спорта.

ИИ прошел мемный тест Тьюринга: GPT-4o оказался остроумнее людей

После этого созданные мемы прошли онлайн-опрос на платформе Prolific. Участники оценивали их по трем критериям: юмор, находчивость и вероятность стать вирусными. Интересно, что мемы, полностью созданные искусственным интеллектом, в среднем получили более высокие оценки по всем параметрам.

Профессор Уортонской школы бизнеса Итан Моллик прокомментировал результаты: «Вынужден сообщить, что мемная версия теста Тьюринга пройдена», имея в виду, что нейросеть успешно конкурирует с человеком в создании юмористического контента. Однако ученые отмечают, что результаты не столь однозначны. Некоторые из самых смешных мемов были написаны людьми, а самые креативные и потенциально вирусные подписи появились при совместной работе человека и ИИ.

Исследование также показало, что участники, использовавшие помощь нейросети, генерировали больше идей за меньшее время, но их подписи не получали более высокие оценки, чем созданные без помощи ИИ. Это подтверждает, что продуктивность не всегда означает лучшее качество. Ученые объясняют это тем, что алгоритмы искусственного интеллекта обучены на больших объемах данных, поэтому создаваемые ими подписи более универсальны. В то же время люди опирались на личный опыт, что иногда давало самые запоминающиеся варианты, но в целом их шутки не могли конкурировать с ИИ по уровню юмора.

Результаты исследования будут представлены на международной конференции в марте 2025 года. Авторы работы подчеркнули, что эксперимент имел определенные ограничения, такие как временные рамки и участие неэкспертных респондентов в оценке мемов. Это будет учтено в будущих исследованиях.

  • Другие новости