Image default
Робототехника

Waymo использует Genie 3 для обучения роботакси — от торнадо до слонов на дороге

Waymo представила Waymo World Model — генеративную модель для симуляции дорожных сценариев, построенную на базе Genie 3 от Google DeepMind. Модель генерирует фотореалистичные сцены с данными камер и лидаров одновременно, позволяя тренировать автопилот в ситуациях, которые практически невозможно набрать в реальности. На сегодня робомобили Waymo проехали около 200 млн автономных миль на дорогах, но параллельно проезжают миллиарды миль в виртуальных мирах.

Главное преимущество перед классическими симуляторами — знания Genie 3 о мире, полученные при предобучении на огромном массиве видео. Большинство отраслевых моделей для симуляции обучаются с нуля только на данных собственного автопарка. Waymo World Model, напротив, может генерировать сценарии, которых автомобили компании никогда не встречали: торнадо, наводнение, заснеженные тропические улицы, слон на дороге или пешеход в костюме тираннозавра.

Модель управляется тремя способами. Первый — действиями оператора: можно проиграть альтернативный сценарий и проверить, что было бы, если бы робомобиль не уступил, а проехал. Второй — компоновкой сцены: расстановка других машин, изменение разметки, состояния светофоров. Третий — текстовыми промптами: смена времени суток, погоды или генерация полностью синтетической сцены. При этом, в отличие от реконструктивных методов вроде 3D Gaussian Splatting, модель сохраняет реалистичность даже при сильном отклонении от оригинального маршрута.

Читать далее:
Представлен алгоритм учёта состояния пассажира для принятия решений в робомобилях

Модель также умеет превращать обычное видео с видеорегистратора или смартфона в полноценную симуляцию с камерами со всех ракурсов и лидарным облаком точек — как если бы по той же дороге проехал робомобиль Waymo со всеми датчиками. Это позволяет тренировать автопилот на дорогах, где Waymo никогда не ездила, без необходимости отправлять туда машину. Для длинных сценариев компания разработала облегченную версию модели, которая значительно снижает вычислительные затраты при сохранении качества.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Похожие записи

Tesla запатентовала математический трюк как способ повысить производительность устаревающих бортовых компьютеров HW3

admin

«Сбер» представил открытое руководство по созданию архитектуры управления роботами

admin

Блогер представил нейромышечный экзоскелет с автоприцелом

admin