Parallel Domain представила Reactor — генеративный механизм создания синтетических данных на основе ИИ

Платформа синтетических данных Parallel Domain сегодня объявила о запуске Reactor, современного механизма генерации синтетических данных, который объединяет передовые технологии генеративного ИИ с собственными возможностями трехмерного моделирования.

Parallel Domain представила Reactor — генеративный механизм создания синтетических данных на основе ИИ

Платформа призвана обеспечить разработчикам машинного обучения (ML) контроль и масштабируемость, позволяя им генерировать полностью аннотированные данные, которые повышают производительность ИИ и способствуют созданию более безопасных и устойчивых систем ИИ для реальных приложений.

По словам компании, Reactor повышает производительность ИИ в различных отраслях, таких как автономные транспортные средства и беспилотники, за счет генерации высококачественных изображений. Кроме того, инструмент использует возможности генеративного ИИ для создания аннотированных данных, что является важнейшим требованием для задач ML.

«Наша запатентованная технология генеративного ИИ позволяет пользователям создавать синтетические данные и манипулировать ими с помощью интуитивно понятных подсказок на естественном языке, одновременно генерируя соответствующие метки, необходимые для обучения и тестирования ML-моделей», — сказал VentureBeat Кевин Макнамара, генеральный директор и основатель Parallel Domain. «Способность Reactor генерировать разнообразные синтетические примеры привела к значительному повышению производительности в таких задачах, как сегментация пешеходов, обнаружение мусора и детских колясок. Его способность увеличивать разнообразие наборов данных, особенно для редких классов, способствует превосходному обучению моделей».

Быстрая итерация и совершенствование ML-моделей

Компания заявила, что ее инструмент позволяет пользователям создавать широкий спектр синтетических данных для обучения и тестирования моделей восприятия. Это достигается за счет интеграции Python и естественного языка, устранения необходимости в трудоемком создании пользовательских активов и оптимизации рабочего процесса для повышения эффективности. В результате разработчики ML могут быстро итерировать и уточнять свои модели, сокращая время выполнения заказа и ускоряя прогресс в разработке ИИ.

«Интеграция этих технологий в нашу платформу позволяет пользователям генерировать данные с помощью команд Python и естественного языка, повышая гибкость генерации синтетических данных», — сказал Макнамара в интервью VentureBeat. «Reactor предоставляет разработчикам ML контроль и масштабируемость, переопределяя ландшафт генерации синтетических данных. С помощью Reactor пользователи могут генерировать практически любые данные за считанные секунды, используя подсказки на естественном языке».

Parallel Domain представила Reactor — генеративный механизм создания синтетических данных на основе ИИ

Использование генеративного ИИ для улучшения конвейеров синтетических данных

По словам Макнамары, хотя другие компании используют генеративный ИИ для создания визуально привлекательных данных, они непригодны для обучения ML-моделей без аннотаций. Reactor преодолевает это ограничение, генерируя полностью аннотированные данные, что улучшает процесс ML и позволяет разработчикам создавать более безопасные и эффективные системы искусственного интеллекта.

«Мы используем генеративный ИИ и 3D-моделирование для создания огромного количества детальных, реалистичных синтетических данных», — заявил Макнамара в интервью VentureBeat. Генеративный ИИ позволяет создавать разнообразные сценарии и объекты, а 3D-симуляция добавляет физический реализм, обеспечивая надежность моделей ИИ, обученных на этих данных». До сих пор генеративные модели с трудом понимали, что они генерируют, поэтому они очень плохо справлялись с предоставлением аннотаций, таких как ограничивающие рамки и паноптическое сегментирование, которые имеют решающее значение для обучения и тестирования моделей ИИ».

Макнамара отметил, что инструмент предоставляет широкий спектр возможностей настройки данных и сцен. Кроме того, функция адаптивного создания фона позволяет легко изменять сгенерированные сцены, позволяя ML-моделям обобщать различные среды. Например, пользователи могут превратить пригород Калифорнии в оживленную сцену в центре Токио.

Интуитивная генерация изображений

По словам Макнамары, подсказки на естественном языке в Reactor представляют собой интуитивно понятный способ создания вариаций изображений. Пользователи могут изменять существующие изображения с помощью простых подсказок, таких как «сделать это изображение похожим на метель» или «поместить капли дождя на объектив». Такой упрощенный процесс настройки устраняет необходимость ждать создания пользовательских активов, повышая эффективность и время выполнения заказа.

«Функция адаптивного создания фона в Reactor обогащает разнообразие тренировочных сред для ML-моделей», — пояснил эксперт. «Это расширяет сценарии, на которых может обучаться модель, помогая ей лучше распознавать и реагировать на различные реальные условия».

Генеративная архитектура позволяет моделям постигать структуру генерируемых объектов и базовых сцен, облегчая извлечение пиксельного и пространственного семантического понимания из слоев в процессе генерации. Это приводит к полностью автоматическому и точному аннотированию.

Более разнообразные и реалистичные синтетические данные

Используя Python, пользователи могут гибко конфигурировать свои синтетические наборы данных, выбирая различные параметры, такие как местоположение (Сан-Франциско, Токио), окружение (городское, пригородное, шоссе), погодные условия и распределение агентов (пешеходы и автомобили).

После того как базовый набор данных настроен, пользователи могут использовать Reactor для улучшения своих синтетических данных за счет большего разнообразия и реалистичности. Используя подсказки на естественном языке, пользователи могут ввести в сцену широкий спектр объектов и сценариев, таких как «мусорный бак», «картонная коробка, полная солнечных очков, рассыпающихся по земле», «деревянный ящик с апельсинами» или «детская коляска».

Reactor генерирует синтетические данные с необходимыми аннотациями, включая ограничительные рамки и паноптическую сегментацию, что значительно ускоряет обучение и тестирование ML-моделей.

«Генеративные функции быстрой настройки на основе искусственного интеллекта повышают эффективность и увеличивают время выполнения заказа», — добавил Макнамара. «В результате разработчики могут создавать и встраивать новые активы в свои синтетические наборы данных практически мгновенно, что позволяет быстрее проводить итерации и постоянно совершенствовать свои модели».

  • Другие новости