Image default
Железо

Micron и NVIDIA нашли способ заставить ИИ отвечать в 2,3 раза быстрее: представлен модуль памяти, который перевернет представление о серверах

Micron представила первые в отрасли модули оперативной памяти формата SOCAMM2 объемом 256 Гбайт. Новые модули используют монолитные кристаллы LPDDR5X емкостью 32 Гбит, что позволило не только нарастить объем в рамках одного модуля, но и значительно сократить физические габариты. По сравнению с традиционной серверной памятью типа RDIMM, новые планки потребляют примерно в три раза меньше энергии и занимают меньше места.

В компании подчеркивают, что разработка велась в тесном сотрудничестве с NVIDIA и основная задача заключалась в том, чтобы снять узкое место, связанное с так называемым KV-кешем (key-value cache) при работе с длинными контекстными окнами. В задачах инференса (вывода моделей) память графического процессора критически важна, но часть данных можно выгружать в общую системную память, но до сих пор это тормозило вычисления из-за недостаточной скорости CPU-памяти.

Стандарт SOCAMM2 призван решить эту проблему и по данным Micron, если оснастить 8-канальный процессор двумя терабайтами такой памяти, то время до выдачи первого токена (ключевой показатель задержки для чат-ботов) сокращается в 2,3 раза, ИИ-ассистенты начнут отвечать быстрее, даже когда речь идет об обработке больших документов или длинной истории переписки.

Модуль представляет собой гибридное решение: с одной стороны, это распаиваемая память (как в ноутбуках или смартфонах), а с другой — она выполнена в виде сменного модуля, что дает производителям серверов гибкость в конфигурации без потерь в энергоэффективности, свойственной LPDDR-стандарту.

Партнеры уже получили инженерные образцы для тестирования. Ожидается, что публичный показ новинки и подробности о внедрении в реальные серверные платформы пройдут на конференции GTC 2026, где NVIDIA традиционно представляет свои решения для ИИ.

Как вы считаете, ощутят ли обычные пользователи разницу в скорости работы ИИ-помощников после внедрения таких модулей в дата-центрах, или SOCAMM2 останется просто памятью для корпоративных клиентов или когда-то ее аналог дойдет до геймеров? Делитесь мнением в комментариях.

Читать далее:
Тесты DLSS 4.5 vs FSR 4: у AMD получилось то, что не смогла сделать NVIDIA в UE5

Похожие записи

Процессоры AMD Zen 6 и Zen 7 могут иметь проблемы совместимости на платах X870 и B850 из-за ограничения BIOS в 64 МБ

admin

Microsoft подтвердила баг Windows 11, из-за которого PC перестали выключаться

admin

47% геймеров не обновляют ПК 5+ лет, а 3% ищут новый апгрейд сразу после покупки: что говорят цифры Steam

admin