В конце марта инфлюенсер по ИИ из Технологического университета Суинберн в Мельбурне Джереми Нгуен заметил, что ChatGPT часто использует слово delve (англ. — «углубляться, вникать») в своих ответах. Это слово в тексте не всегда означает, что он был создан ИИ. Однако в более широком контексте ситуация меняется.
Например, на сайте PubMed, профессиональной платформе по биомедицинским исследованиям, слово «delve» используется в 0,5% статей. Это в 10-100 раз больше, чем было несколько лет назад, что может указывать на то, что ChatGPT активно применяется для создания части этих статей.
Тем не менее слово «delve» — это не единственное слово, которое ChatGPT использует часто. Согласно другим данным, в текстах, сгенерированных этим ИИ, также часто встречаются такие слова, как «explore» (англ. — «исследовать»), «tapestry» (англ. — «гобелен»), «testament» (англ. — «завет, завещание») и «leverage» (англ. — «использовать»). Такая особенность не является случайной, скорее всего, это результат способа создания чат-бота.
GPT-4 — это большая модель машинного перевода, обученная на основе большинства англоязычных текстов из интернета. Для превращения ее в полезного чат-бота используется метод обучения с подкреплением на основе отзывов людей. Люди задают вопросы начальной версии модели и дают ей инструкции, а также предоставляют обратную связь в виде оценок «лайк/дислайк» или текстовых ответов.
Этот тип обучения является довольно затратным, поскольку требует большого количества времени и средств. В связи с этим крупные компании часто переносят этот процесс на аутсорсинг в страны с меньшим уровнем экономического развития, где они могут найти квалифицированных специалистов, готовых работать за меньшую плату.
По сравнению с интернетом в целом, ChatGPT использует слово «delve» довольно часто. Однако это слово намного распространеннее в африканской части интернета. В Нигерии, например, слово «delve» используется в деловом английском намного чаще, чем в Великобритании и США. Работники, которые обучали ИИ, представляли информацию на своем родном языке. В результате был создан чат-бот, который использует язык, сходный с африканским вариантом английского языка.