AMD официально выпустила Instinct MI350P, новый ускоритель PCIe, предназначенный для корпоративных пользователей, которые ищут вывод ИИ на месте без капитального ремонта существующей инфраструктуры центра обработки данных.С двойным слотом, полная высота и полная длина форм-фактора, эта видеокарта полностью совместима с обычными серверами с воздушным охлаждением.Также это первый выпуск AMD чипа Instinct текущего поколения, предназначенного для стандартных слотов серверов за почти четыре года..
AMD Instinct MI350P
Линейка продуктов AMD Instinct, основанная на PCIe, оставалась в стагнации после запуска MI210 в начале 2022 года. Все последующие поколения, включая MI300X, MI325X и MI350X формата OAM, были выпущены в маркете в маркете в марте 2022 года.принятые модули с сокетами OAM, установленные на специальных универсальных поддонахЭти модули требуют индивидуальных корпусов с надежной подачей энергии и воздушным потоком, чтобы поддерживать до восьми ускорителей класса 1000 Вт в одном подносе.Такая аппаратная архитектура подходит для гипермасштабных облачных провайдеров, которые закупают графические стеллажи в больших количествах, но не может удовлетворить потребности обычных предприятий, не желающих или неспособных развертывать индивидуальные AI-стаканчики для выполнения задач вывода на месте.В этом сегменте NVIDIA не имеет высококлассного конкурента PCIe уровня сервера, оставляя AMD временную эксклюзивность на рынке.
Сравнение оборудования: MI350P против MI350X OAM
MI350P не является уменьшенным вариантом MI350X; AMD разработала независимый оптимизированный чип для этой новой модели.MI350X включает в себя два I/O-прибора, соединенных с восемью комплексами ускорителей (XCD)В отличие от этого, MI350P содержит одну модуль В/В и четыре XCD, что эквивалентно 128 вычислительным единицам.Пиковая часовая частота 2 ГГц как ее аналог более высокого уровняКонфигурация памяти соответствует той же пониженной спецификации: четыре стека HBM3E (против восьми), 4,096-битная шина памяти (с 8,192-битного),наряду с емкостью памяти 144 ГБ и пропускной способностью 4 ТБ/с, по сравнению с 288 ГБ и 8 ТБ/с пропускной способностью MI350X.
Архитектура AMD Instinct MI350P
Пиковая вычислительная производительность также сокращается вдвое. MI350P достигает 4600 MXFP4 TFLOPS по сравнению с MI350X 9.2 PFLOPS, наряду с 2300 FP8 TFLOPS по сравнению с премиальной моделью 4.6 PFLOPS.Показатели производительности для BF16, FP16 и другие стандарты точности следуют за тем же пропорциональным снижением.299 TFLOPS в рамках MXFP4, 1,529 TFLOPS в FP8 и 713 TFLOPS в BF16.где ограничения мощности и ограничения пропускной способности памяти неизбежно снижают теоретическую пиковую производительность.
Редакционная группа ранее оценивала платформу MI350X через программу Jumpstart от Supermicro и признала ее надежные возможности выводной нагрузки.Команда с нетерпением ждет практических испытаний MI350P., анализируя, как этот ускоритель форм-фактора PCIe работает в стандартном шасси сервера товара.
MI350P не имеет снижения мощности на 50%, несмотря на уменьшение кремниевой шкалы вдвое.Эта пиковая мощность достигает верхней границы спецификации PCIe CEMДля серверов с недостаточным охлаждением доступен уменьшенный режим работы 450 Вт, сопровождающийся умеренным снижением производительности.Установлены в одном и том же силовом скобке, MI350P напрямую конкурирует с NVIDIA's H200 NVL и RTX Pro 6000 Server для корпоративных закупок.
В отличие от NVIDIA H200 с высокоскоростными соединениями NVL4, MI350P отключает экспозицию Infinity Fabric.
Воздушно-охлажденное развертывание восьми-GPU
В качестве стандартной карты FHFL PCIe с двумя слотами MI350P совместим с существующими корпоративными серверами.включая ранее рассмотренные Dell PowerEdge XE7740 и HPE ProLiant DL380a Gen12Оптимизированные для 600 Вт ускорителей, эти платформы не требуют пользовательских стеллажей, жидкостного охлаждения или поддонов OAM.
8-картовая конфигурация MI350P обеспечивает 1,152 ГБ HBM3E и 32 ТБ/с совокупной пропускной способности, достаточной для размещения моделей с триллионами параметров в точности MXFP4 в одном воздушно-охлажденном шасси.Он жертвует специальными тканями для нанесения шкалов.В то время как MI350X использует Infinity Fabric для быстрой межмодульной связи, MI350P полагается исключительно на PCIe Gen5.Эта архитектура подходит для узлового локального тензорного параллелизма и кросс-узлового параллелизма данных для выводов, в то время как MI350X, основанный на OAM, остается превосходным для интенсивных по пропускной способности задач по обучению ИИ.
Форматы точности
MI350P унаследовал все форматы точности от MI350X без обновлений.обеспечивает низкую точность обучения с незначительным снижением качества;. MXFP4 обеспечивает более чем в два раза больше скорости, чем FP8, и в четыре раза больше пропускной способности, чем BF16. Реальные случаи, такие как OpenAI gpt-oss и Kimi K2.6, доказывают ценность коренной низкобитной квантования.Поскольку весы MXFP4 и INT4 занимают только 25% пространства памяти BF16, модели с триллионами параметров могут быть развернуты внутри одного восьми-GPU сервера, устраняя громоздкие многоузловые кластеры для предприятий на месте.
Суть
Большинство предприятий на базе ИИ ограничены мощностью, охлаждением, плотностью и бюджетом, а не сырыми вычислительными возможностями.В этом сегменте NVIDIA не имеет флагманского сервера PCIe GPU, AMD пока сохраняет четкое конкурентное преимущество.
Пекинская компания Qianxing Jietong Technology Co., Ltd.
Сэнди Янг, директор по глобальной стратегии
WhatsApp / WeChat: +86 13426366826
Электронная почта: yangyd@qianxingdata.com
Сайт: www.qianxingdata.com/www.storagesserver.com
Бизнес фокус:
Распространение ИКТ-продуктов/интеграция систем и услуги/решения инфраструктуры
Имея более 20-летний опыт распространения ИТ, мы сотрудничаем с ведущими мировыми брендами для предоставления надежных продуктов и профессиональных услуг.
Использование технологий для создания интеллектуального мира Ваш надежный поставщик услуг ИКТ-продуктов!
Сэнди Янг, директор по глобальной стратегии
WhatsApp / WeChat: +86 13426366826
Электронная почта: yangyd@qianxingdata.com
Сайт: www.qianxingdata.com/www.storagesserver.com
Бизнес фокус:
Распространение ИКТ-продуктов/интеграция систем и услуги/решения инфраструктуры
Имея более 20-летний опыт распространения ИТ, мы сотрудничаем с ведущими мировыми брендами для предоставления надежных продуктов и профессиональных услуг.
Использование технологий для создания интеллектуального мира Ваш надежный поставщик услуг ИКТ-продуктов!



