На фоне большого количества шумихи вокруг генеративного ИИ новое исследование, проведенное учеными Массачусетского технологического института, проливает свет на влияние этой технологии на работу: выяснилось, что она повышает производительность труда работников, которым поручаются такие задачи, как написание сопроводительных писем, тонких электронных писем и анализ экономической целесообразности.
Исследуемые задачи не были полной копией реальной работы: В них не требовалось точной передачи фактов или понимания контекста, например, целей компании или предпочтений клиента. Тем не менее, многие участники исследования отметили, что задания были похожи на те, которые они писали на своей реальной работе, а польза от них была существенной. Доступ к вспомогательному чат-боту ChatGPT сократил время выполнения заданий на 40%, а качество работы, по оценкам независимых экспертов, выросло на 18%.
Исследователи надеются, что результаты исследования, опубликованные сегодня в открытом доступе в журнале Science, помогут людям понять, какое влияние могут оказать на работников такие инструменты искусственного интеллекта, как ChatGPT.
«Что мы можем сказать точно, так это то, что генеративный ИИ окажет большое влияние на работу «белых воротничков», — говорит Шаккед Ной, аспирант экономического факультета Массачусетского технологического института. «Я думаю, что наше исследование показывает, что такого рода технологии имеют важное применение в сфере труда белых воротничков. Это полезная технология. Но пока еще рано говорить о том, хорошо это или плохо, и как именно это приведет к корректировке общества».
Моделирование работы для чатботов
На протяжении столетий люди беспокоились о том, что новые технологические достижения приведут к массовой автоматизации и потере рабочих мест. Однако новые технологии также создают новые рабочие места, а когда они повышают производительность труда, то могут оказывать чисто положительное влияние на экономику.
«При рассмотрении новых технологических разработок экономисты в первую очередь обращают внимание на производительность труда», — говорит Ной. «Классическая точка зрения в экономике заключается в том, что самое главное, что делает технический прогресс, — это повышает производительность труда, то есть позволяет нам производить экономическую продукцию более эффективно».
Для изучения влияния генеративного ИИ на производительность труда исследователи дали 453 маркетологам, специалистам по написанию грантов, консультантам, аналитикам данных, специалистам по управлению персоналом и менеджерам, имеющим высшее образование, два задания по написанию текстов, характерных для их профессии. Задания длительностью от 20 до 30 минут включали написание сопроводительных писем для заявок на гранты, электронных писем о реструктуризации организации и планов аналитических исследований, помогающих компании решить, каким клиентам отправлять push-уведомления на основе заданных данных о них. Опытные специалисты, занимающие те же должности, что и каждый участник, оценивали каждую работу так, как если бы они сталкивались с ней на рабочем месте. Эксперты не знали, какие именно материалы были созданы с помощью ChatGPT.
Для выполнения второго задания половине участников был предоставлен доступ к чат-боту ChatGPT-3.5, разработанному компанией OpenAI. Эти пользователи справились с заданиями на 11 минут быстрее, чем контрольная группа, а их средняя оценка качества работы выросла на 18%.
Данные также показали, что неравенство в производительности между работниками уменьшилось, то есть работники, получившие более низкую оценку за первое задание, получили больше пользы от использования ChatGPT при выполнении второго задания.
Исследователи утверждают, что задания были в целом похожи на те, с которыми сталкиваются такие специалисты в своей реальной работе, однако они отмечают ряд ограничений. Так как участники исследования были анонимными, исследователи не могли требовать контекстного знания о конкретной компании или клиенте. Кроме того, они должны были давать четкие инструкции к каждому заданию, в то время как реальные задачи могут быть более свободными. Кроме того, исследователи не сочли возможным нанять специалистов по проверке фактов для оценки точности результатов. Точность является одной из основных проблем современных технологий генеративного ИИ.
По мнению исследователей, эти ограничения могут снизить потенциал ChatGPT по повышению производительности в реальном мире. Тем не менее, они считают, что полученные результаты свидетельствуют о перспективности технологии, что подтверждается еще одним выводом исследования: работники, ознакомившиеся с ChatGPT в ходе эксперимента, в два раза чаще сообщали о том, что используют ее на своей реальной работе через две недели после эксперимента.