NVIDIA может официально закрепить смену своей многолетней стратегии. Вместо того чтобы продолжать продвигать универсальные графические процессоры «на все случаи жизни», производитель делает ставку на узкоспециализированные решения.
Если с 2022 года основным драйвером рынка были задачи по обучению нейросетей, то теперь фокус смещается на так называемые агентные нагрузки, где ИИ не просто генерирует ответ, а выполняет сложные, многоступенчатые действия. Это предъявляет новые требования к инфраструктуре и универсальные GPU становятся избыточными или недостаточно эффективными для некоторых этапов вычислений. Ожидается, что в рамках архитектуры Vera Rubin NVIDIA предложит гибридные конфигурации вычислительных лотков. В них традиционные GPU будут работать в связке с блоками LPU, соединенных через интерфейс NVLink Fusion. Такая схема позволит разделить нагрузку: LPU возьмут на себя декодирование информации, а GPU — основной математический расчет.
Одновременно с этим в появляются детали о следующем поколении архитектуры под кодовым названием Feynman. По данным инсайдеров, эти чипы будут выпускаться по самому передовому 1,6-нм техпроцессу TSMC A16. Источники полагают, что NVIDIA может стать эксклюзивным заказчиком на этот техпроцесс. Технически новинка станет еще более сложной: предполагается использование гибридной 3D-сборки, при которой чипы LPU будут монтироваться прямо поверх вычислительных кристаллов.
Не обойдется и без апгрейда на уровне целых стоек. Если раньше флагманом считалась конфигурация NVL72, то теперь в разработке находится система NVL576 на базе Rubin Ultra. Это будет стойка на 576 GPU с полностью переработанной компоновкой. Вместо горизонтального размещения инженеры перейдут на вертикальные блейды (напоминающие книги на полке). Произойдет и отказ от медных соединений в пользу оптики CPO (Co-Packaged Optics), что снизит тепловыделение и повысит пропускную способность.
По сути, NVIDIA превращается из производителя видеокарт в поставщика сборных конструкторов для дата-центров, где под каждый тип задачи (тренинг, предобработка, декодирование, инференс) можно собрать свою комбинацию чипов.
Как вы думаете, приведет ли узкая специализация чипов к тому, что небольшим компаниям будет еще сложнее конкурировать с гигантами вроде NVIDIA из-за роста стоимости инфраструктуры? Делитесь мнением в комментариях.

