Компания Anthropic, основанная бывшими сотрудниками OpenAI, объявила о выпуске новой модели искусственного интеллекта, генерирующей текстовые сообщения.

Преемник первой коммерческой модели Anthropic, Claude 2 доступен в бета-версии с сегодняшнего дня в США и Великобритании как в Интернете, так и через платный API (в ограниченном доступе). Цена на API не изменилась (~0,0465 долл. США за генерацию 1000 слов), и несколько компаний уже начали пилотное использование Claude 2, включая платформу генеративного ИИ Jasper и Sourcegraph.
«Мы считаем, что важно вывести эти системы на рынок и понять, как люди их используют», — сказал в телефонном интервью TechCrunch Сэнди Банерджи, руководитель отдела по выходу на рынок в компании Anthropic. «Мы отслеживаем, как они используются, как мы можем улучшить производительность, а также пропускную способность — все эти вещи».
Как и старый Claude (Claude 1.3), Claude 2 может осуществлять поиск по документам, обобщать, писать и кодировать, а также отвечать на вопросы по определенным темам. Однако Anthropic утверждает, что Claude 2 превосходит свою старую версию в нескольких областях.
Например, Claude 2 набирает несколько больше баллов в разделе «Множественный выбор» (76,5% против 73% у Claude 1.3). Он способен успешно сдать часть экзамена на получение лицензии на медицинскую деятельность в США. Он также является более сильным программистом, набрав 71,2% в тесте Codex Human Level Python по кодированию по сравнению с 56% у Claude 1.3.
Claude 2 также может правильно отвечать на большее количество математических задач, набрав 88% в сборнике задач GSM8K, что на 2,8% выше, чем у Claude 1.3.
Мы работали над улучшением аргументации и самосознания модели, чтобы она лучше понимала, что «вот как мне нравится выполнять инструкции», «я могу обрабатывать многошаговые инструкции», а также лучше осознавала свои ограничения», — сказал Банерджи.
Claude 2 обучался на более свежих данных — веб-сайтах, лицензированных наборах данных от третьих лиц и добровольно предоставленных пользовательских данных начала 2023 года, примерно 10% которых не на английском языке, — что, вероятно, и способствовало улучшению результатов. В отличие от ChatGPT-4 от OpenAI, Claude 2 не умеет искать информацию в Интернете. Но архитектурно модели не сильно отличаются — Банерджи охарактеризовал Claude 2 как доработанную версию Claude 1.3, продукт двух или около того лет работы, а не новое творение.
«Claude 2 не претерпела значительных изменений по сравнению с предыдущей моделью — это результат нашего непрерывного итерационного подхода к разработке модели», — сказала она. «Мы постоянно обучаем модель … и проводим мониторинг и оценку ее эффективности».