Image default
Технологии

«Универсальных солдат» больше нет: NVIDIA отказывается от старой стратегию по созданию видеокарт

NVIDIA может официально закрепить смену своей многолетней стратегии. Вместо того чтобы продолжать продвигать универсальные графические процессоры «на все случаи жизни», производитель делает ставку на узкоспециализированные решения.

Если с 2022 года основным драйвером рынка были задачи по обучению нейросетей, то теперь фокус смещается на так называемые агентные нагрузки, где ИИ не просто генерирует ответ, а выполняет сложные, многоступенчатые действия. Это предъявляет новые требования к инфраструктуре и универсальные GPU становятся избыточными или недостаточно эффективными для некоторых этапов вычислений. Ожидается, что в рамках архитектуры Vera Rubin NVIDIA предложит гибридные конфигурации вычислительных лотков. В них традиционные GPU будут работать в связке с блоками LPU, соединенных через интерфейс NVLink Fusion. Такая схема позволит разделить нагрузку: LPU возьмут на себя декодирование информации, а GPU — основной математический расчет.

Одновременно с этим в появляются детали о следующем поколении архитектуры под кодовым названием Feynman. По данным инсайдеров, эти чипы будут выпускаться по самому передовому 1,6-нм техпроцессу TSMC A16. Источники полагают, что NVIDIA может стать эксклюзивным заказчиком на этот техпроцесс. Технически новинка станет еще более сложной: предполагается использование гибридной 3D-сборки, при которой чипы LPU будут монтироваться прямо поверх вычислительных кристаллов.

Читать далее:
Apple выбрала Google Gemini для создания обновленной версии Siri

Не обойдется и без апгрейда на уровне целых стоек. Если раньше флагманом считалась конфигурация NVL72, то теперь в разработке находится система NVL576 на базе Rubin Ultra. Это будет стойка на 576 GPU с полностью переработанной компоновкой. Вместо горизонтального размещения инженеры перейдут на вертикальные блейды (напоминающие книги на полке). Произойдет и отказ от медных соединений в пользу оптики CPO (Co-Packaged Optics), что снизит тепловыделение и повысит пропускную способность.

По сути, NVIDIA превращается из производителя видеокарт в поставщика сборных конструкторов для дата-центров, где под каждый тип задачи (тренинг, предобработка, декодирование, инференс) можно собрать свою комбинацию чипов.

Как вы думаете, приведет ли узкая специализация чипов к тому, что небольшим компаниям будет еще сложнее конкурировать с гигантами вроде NVIDIA из-за роста стоимости инфраструктуры? Делитесь мнением в комментариях.

Похожие записи

DOOM на CSS? Программист заставил браузер рисовать шутер без графического движка

admin

Аналитики оценили готовность россиян доверить выбор покупок ИИ

admin

Sony рассылает владельцам PS4 сообщения с призывом перейти на PS5

admin