- Что изменилось за последний год
- 1) Архитектуры: от модульных стеков к end-to-end трансформерам
- Модульный стек
- End-to-end (E2E)
- 2) Обучение и данные: self-supervision, симуляция и генеративный ИИ
- 3) Сенсоры: «камеры-только» vs «камеры+лидары+радары»
- 4) Вычисления: от SoC в машине до ИИ-фабрик в облаке
- 5) Регуляции и безопасность: где сегодня «красные линии»
- 6) Картина мира в 2025: кто и что показал
- 7) Сравнительная таблица ключевых подходов и вех (2024–2025)
- 8) Что это значит для отрасли
- 9) Практические рекомендации продакт-и инжиниринг-командам
- 10) Ключевые тренды 2025–2027
- FAQ: частые вопросы о нейросетях и автономном вождении
Что изменилось за последний год
- End-to-end (E2E)-подходы вышли из лабораторий в потребительские продукты: от FSD v12 с «фотоны→управление» до новых E2E-архитектур с трансформерами и world-model планированием в openpilot 0.10. (WIRED)
- Роботакси и грузовые L4-сервисы масштабируются: Waymo отчитывается о 1+ млн поездок в месяц и запускает корпоративные аккаунты, Zoox открывает бесплатный публичный сервис в Лас-Вегасе, а Aurora запустила коммерческие driverless-рейсы фур с весны 2025. (Reuters)
- L3 в серийных авто ускоряется: Mercedes Drive Pilot получил разрешение на 95 км/ч в Германии (раньше — пробочные скорости). Это первый массовый «глаз-вне-дороги» на автобанах. (ADAS & Autonomous Vehicle International)
- Камера-первый «foundation-подход»: Wayve после рекордного раунда $1.05 млрд двигает мультимодальные VLA-модели (LINGO-2), сотрудничает с Nissan (тесты в Токио). (Wayve)
- Автомобильные вычисления переходят на Blackwell-поколение: NVIDIA DRIVE Thor для бортового ИИ и генеративных моделей стал карьерной базой для OEM/AV-партнёров. (NVIDIA)
- Больше трезвого прагматизма: Tesla остаётся L2 (Supervised), параллельно в августе сообщалось о сворачивании проекта Dojo в пользу внешних GPU-стэков. (InsideEVs)
1) Архитектуры: от модульных стеков к end-to-end трансформерам
Модульный стек
Классическая архитектура «восприятие → предсказание → планирование → контроль» понятна и проверяема, хорошо ложится на сертификацию и инженерные процессы. Минус — накопление ошибок и трудности масштабирования, особенно в «краевых» сценариях.
End-to-end (E2E)
E2E-подход обучает одну большую модель (часто трансформер) прямо от сырых сенсоров к действиям, снижая межмодульные зазоры. Варианты:
- Policy-трансформеры (DriveTransformer, др.) — объединяют задачи в единую схему с совместным обучением.
- World models (мировые модели): модель «мечтает» вероятные будущие кадры/состояния и планирует на их основе; активно внедряется в 2025-м (в том числе в openpilot 0.10).
- Vision-Language-Action (VLA) — связывают видение, язык и действия, повышая объяснимость и управляемость (Wayve LINGO-2). (openreview.net)
Плюсы E2E: лучшее обобщение, меньше ручных правил, естественная масштабируемость с датасетом.
Минусы: валидация и сертификация сложнее, нужны огромные объёмы данных/симуляции и методики интерпретации.
2) Обучение и данные: self-supervision, симуляция и генеративный ИИ
- Self-supervised и distillation снижают зависимость от меток; data flywheel: чем больше пробегов на реальных дорогах и в симуляции, тем быстрее улучшается модель.
- Симуляция нового поколения: интерактивные многоагентные среды (WOSAC) позволяют отрабатывать редкие ситуации, корректно «закрывая» хвост рисков. (arXiv)
- Генеративный ИИ и synthetic data: Omniverse/«Cosmos»-подходы генерируют реалистичные сцены, климат и редкости для обучения/валидации, сокращая стоимость сбора. (Инвесторы)
- LLM/VLM в авто: EMMA/Waymo и VLA-подходы связывают перцепцию и планирование с «мировыми» знаниями, двигая объяснимость и устойчивость к новизне. (The Verge)
3) Сенсоры: «камеры-только» vs «камеры+лидары+радары»
- Камера-только (camera-only) снижает цену BOM и усложняет сертификацию в сложной погоде.
- Фузия с лидаром/радаром повышает надёжность и ближе к регуляторной «интуиции безопасности», особенно для L3/L4.
Реальный рынок показывает коэкзистенцию двух школ: Tesla придерживается camera-first (при L2), Waymo/Zoox/Aurora — комбинированные сенсоры (L4), Mercedes L3 — богатый сенсорный набор + HD-карта.
4) Вычисления: от SoC в машине до ИИ-фабрик в облаке
- Бортовой ИИ: переход к NVIDIA DRIVE Thor (Blackwell) — совмещение ADAS/AD, кокпита и генеративного ИИ в централизированную архитектуру с функциональной безопасностью. (NVIDIA)
- Тренировочные кластеры: курс на внешние GPU-стэки (H100/B200) усиливается — в медиа сообщалось о сворачивании Tesla Dojo и переносе фокуса на партнёрские платформы. (Reuters)
5) Регуляции и безопасность: где сегодня «красные линии»
- UNECE R157 (ALKS): позволяет L3 на автомагистралях; в Германии одобрена эксплуатация до 95 км/ч для Mercedes Drive Pilot. (ADAS & Autonomous Vehicle International)
- ISO 21448 (SOTIF): безопасность «задуманных функций» — методики выявления сценариев, где ИИ может ошибиться не из-за отказа железа, а из-за смещения данных/интерпретации. (ISO)
- UL 4600: стандарт «safety case» для автономных продуктов; активно применяется в L4-проектах (включая грузовые). (users.ece.cmu.edu)
6) Картина мира в 2025: кто и что показал
- Waymo: масштабирование роботакси (SF, LA, Phoenix, Austin, Atlanta), 1+ млн поездок/мес и выход на корпоративных клиентов («Waymo for Business»). (Reuters)
- Zoox: публичный запуск в Лас-Вегасе (L4, без руля/педалей, бесплатные поездки по ключевым точкам). (The Verge)
- Mercedes Drive Pilot: L3 при 95 км/ч в Германии — первый «мейнстримный» апгрейд скорости для серийного L3. (ADAS & Autonomous Vehicle International)
- Tesla FSD v12 (Supervised): E2E-подход уже на дорогах, но юридически — уровень L2; вокруг коммуникаций о безопасности активная дискуссия. (WIRED)
- Wayve: $1.05 млрд раунд, VLA-линия (LINGO), пилоты с Nissan в Токио (урбан-L2 сейчас, больший горизонт — позже). (Wayve)
- Aurora (грузовой L4): с мая 2025 идут коммерческие driverless-рейсы (Даллас—Хьюстон) днём и ночью; партнёрства по железу — NVIDIA DRIVE Thor + Continental. (Aurora Innovation, Inc.)
- comma.ai / openpilot: в 2025 серия релизов (0.9.9 → 0.10) с новым world-model-планированием и трансформерными E2E-элементами в потребительском ADAS. (comma.ai blog)
7) Сравнительная таблица ключевых подходов и вех (2024–2025)
Итоги сведены по публичным источникам. Уровни SAE/ODD и сенсорные наборы — обобщены и могут отличаться в конкретных комплектациях/городах.
| Игрок / продукт | Архитектура / ставка | Сенсоры | Уровень SAE / ODD | Зависимость от HD-карт | Ключевая веха 2024–2025 |
|---|---|---|---|---|---|
| Waymo One / Driver | Модульный стек + foundation-модели; масштаб в городах США | Камеры+лидары+радары | L4, роботакси в нескольких городах США | Высокая (семантические карты) | 1+ млн поездок/мес; запуск «Waymo for Business». (Reuters) |
| Zoox | Модульный L4 для собственных шаттлов | Камеры+лидары+радары | L4, Лас-Вегас (публично) | Да | Публичный запуск в LV, бесплатные поездки. (The Verge) |
| Mercedes Drive Pilot | Модульный L3 для автострад | Камеры+лидар+радар+ультразвук | L3, автобаны (условия) | Да (цифровая HD-карта) | Разрешение 95 км/ч в Германии. (ADAS & Autonomous Vehicle International) |
| Tesla FSD v12 (Supervised) | E2E «фотоны→управление», потребительский масштаб | Камеры (camera-first) | L2, вождение под надзором | Низкая | E2E в серийном ПО; обсуждение безопасности/коммуникаций. (WIRED) |
| Wayve + Nissan (урбан-L2) | Foundation-модели / VLA (LINGO) | 11 камер, 5 радаров, 1 лидар (в тестах) | L2, запуск в Японии в 2027 фингод | Умеренная | Тесты на улицах Токио, большой раунд $1.05 млрд. (Reuters) |
| Aurora Driver (trucking) | Модульный L4, фокус — магистрали | Камеры+радары+лидары | L4, межгород (TX) | Да | Регулярные driverless-рейсы Даллас—Хьюстон; Thor в стеке. (Aurora Innovation, Inc.) |
| comma.ai openpilot 0.10 | Потребительский ADAS с world-model и E2E-планированием | Камеры (серийные авто) | L2, широкий автопарк | Низкая | Переход к world-model планированию в релизе 0.10. (comma.ai blog) |
8) Что это значит для отрасли
- E2E уже «на дорогах», но L4 требует фузии сенсоров и строгих ODD.
- Сертификация ускоряется у тех, кто умеет «объяснять» решения модели (VLA/EMMA) и строит убедимый safety case (UL 4600+SOTIF). (users.ece.cmu.edu)
- Генеративная симуляция и synthetic data создают «длинный хвост» сценариев без реального риска, экономя миллионы на тестах. (Инвесторы)
- Вычисления: ставка на Blackwell/Thor и облачные GPU-фермы станет стандартом для OEM/AV в 2025–2027. (NVIDIA)
- Коммерциализация: где есть узкая ODD и понятная ценность (магистральный груз, аэропорты, кампусы), L4 растёт быстрее всего.
9) Практические рекомендации продакт-и инжиниринг-командам
- Стратегия сенсоров: если целитесь в L3–L4 — проектируйте мультисенсорную архитектуру + устойчивость к погоде; camera-only компенсируйте данными/симуляцией.
- Данные и этикет: инвестируйте в data ops (маршрутизация редких кейсов, авто-этикетка, автогенерация сценариев), MLOps и симуляцию.
- Безопасность: выстраивайте safety case по UL 4600 + процессы SOTIF (ISO 21448), готовьте аудит-артефакты и аргументацию изменения рисков при апдейтах. (users.ece.cmu.edu)
- Комплаенс и маркетинг: аккуратно формулируйте уровни SAE и пользовательские обязанности (пример споров вокруг коммуникации систем L2). (WIRED)
- Инфраструктура ИИ: планируйте централизованную вычислительную архитектуру в авто (Drive OS/Thor-класс) и «ИИ-фабрику» в облаке.
10) Ключевые тренды 2025–2027
- E2E-трансформеры с world-model-планированием станут «базовым» паттерном. (openreview.net)
- VLA/MLLM-подсказки для объяснимости, диагностики, быстрой дообучаемости на редких событиях. (The Verge)
- ODD-первый L4 (трек/порт/кампус/магистраль) — быстрее масштабирование, чем универсальный «город-для-всего».
- Серийный L3 расширится географически и по скоростям; в Европе — по линейкам премиум-марок. (ADAS & Autonomous Vehicle International)
- Аппаратно-программная конвергенция (кокпит+ADAS+AD на одном SoC) ускорит OTA-цикл и снизит стоимость внедрения. (NVIDIA)
FAQ: частые вопросы о нейросетях и автономном вождении
1. Чем E2E отличается от «классики»?
E2E учит одну модель «кадры→действие», снижая ошибки стыковки модулей. Классика легче объяснима и проверяема, но хуже масштабируется на редкости. (openreview.net)
2. Правда ли, что «камеры лучше лидаров»?
Зависит от ODD. Для L4-такси и грузовиков фузия (камеры+лидар+радар) повышает robusность. Для L2/L2+ в потребительских авто камера-первый путь экономичнее, но требует больших данных и симуляции.
3. Почему Mercedes получил L3, а Tesla — нет?
Потому что Drive Pilot работает в жёстко ограниченном ODD (автобаны, проверенные участки, погода) и прошёл национальную процедуру допуска; Tesla FSD позиционируется как L2 (Supervised). (ADAS & Autonomous Vehicle International)
4. Что такое SOTIF и UL 4600 простыми словами?
SOTIF — «безопасность задуманной функции»: как убедиться, что ИИ не ошибается из-за данных/дизайна. UL 4600 — как собрать «safety case» и доказать безопасность автономного продукта. (ISO)
5. Где реальный L4 уже едет без водителя?
Роботакси Waymo/Zoox в ограниченных районах США; грузовые фуры Aurora на трассе Даллас—Хьюстон. (Reuters)
6. End-to-end — это «чёрный ящик»?
Частично. Но появляются VLA/EMMA-подходы и инструменты визуализаций/оснований решений; плюс safety-процессы требуют объяснимых артефактов. (The Verge)
7. Какие вычисления нужны?
На борту — SoC уровня DRIVE Thor с избыточностью и функциональной безопасностью; вне борта — крупные GPU-кластеры для обучения и симуляции. (NVIDIA)
8. Как быстро это придёт в массовые авто?
L2/L2+ уже массовы; L3 — постепенно расширяется. Универсальный «городской L4» для частных владельцев — позже, чем L4-сервисы в узких ODD (такси/логистика).
9. Можно ли «доустановить» автономию в подержанный автомобиль?
В пределах L2 — да (послепродажные решения), но L3/L4 требуют глубокой интеграции сенсоров, карт, актуаторов и сертификации.
10. Насколько критичен объём данных?
Критичен. Побеждают команды, у кого «фабрика данных»: миллионы редких кейсов, симуляция и строгая валидация.
2025-й стал годом, когда нейросети реально управляют массовыми автомобилями (пусть и под надзором) и параллельно безводительские сервисы в узких доменах (роботакси/груз) уезжают от пилотов к бизнес-метрикам. Побеждают те, кто совмещает E2E-архитектуры, симуляцию/генерацию данных, строгий safety case и централизованную вычислительную архитектуру — и делает это регулярно, в масштабе и прозрачно.


















