Спецификации DapuStor J5060
| J5060 | |
|---|---|
| Емкость (ТБ) | 61,44 |
| Форм-фактор | U.2 15 мм |
| Интерфейс | PCIe 4.0 x4, NVMe 1.4a, поддержка двух портов |
| Пропускная способность чтения/записи (128K) МБ/с | 7400 / 3000 |
| Случайное чтение/запись (4 КБ) тыс. операций ввода-вывода | 1500 / 30 (16 КБ) |
| Задержка случайного чтения 4K (типичная) R/W мкс | 105 (4 КБ) / 33 (16 КБ) |
| Задержка последовательного чтения 4K (типичная) R/W мкс | 7 (4 КБ) / 12 (16 КБ) |
| Типичное энергопотребление (Вт) | 23 |
| Энергопотребление в режиме ожидания (Вт) | 5 |
| Тип флэш-памяти | 3D Enterprise QLC NAND Flash |
| Ресурс | 0,5 DWPD |
| MTBF | 2 миллиона часов |
| UBER | 1 сектор на 10^17 бит прочитано |
| Гарантия | 5 лет |
Производительность DapuStor J5060
Создание контрольных точек
Для оценки реальной производительности SSD-накопителя Dapustor J5060 в средах обучения ИИ мы использовали эталонный инструмент Data and Learning Input/Output (DLIO). Разработанный Аргоннской национальной лабораторией, DLIO специально предназначен для тестирования шаблонов ввода-вывода в рабочих нагрузках глубокого обучения. Он предоставляет информацию о том, как системы хранения данных справляются с такими задачами, как создание контрольных точек, ввод данных и обучение моделей. Приведенная ниже диаграмма иллюстрирует, как оба накопителя обрабатывают этот процесс в течение 99 контрольных точек. При обучении моделей машинного обучения контрольные точки необходимы для периодического сохранения состояния модели, предотвращая потерю прогресса во время сбоев или отключений питания. Эта потребность в хранении данных требует высокой производительности, особенно при длительных или интенсивных рабочих нагрузках.
Платформой, выбранной для этой работы, был наш Dell PowerEdge R760 под управлением Ubuntu 22.04.02 LTS. Мы использовали эталонную версию DLIO 2.0 от 13 августа 2024 года. Конфигурация нашей системы представлена ниже:
- 2 x Intel Xeon Gold 6430 (32 ядра, 2,1 ГГц)
- 16 x 64 ГБ DDR5-4400
- 480 ГБ Dell BOSS SSD
- Serial Cables Gen5 JBOF
- 61,44 ТБ Dapustor J5060
- 61,44 ТБ Solidigm D5-P5336
Чтобы гарантировать, что наше тестирование отражает реальные сценарии, мы основывали наше тестирование на архитектуре модели LLAMA 3.1 405B. Мы реализовали создание контрольных точек с помощью torch.save() для захвата параметров модели, состояний оптимизатора и состояний слоев. Наша установка имитировала систему с 8 ГП, реализуя гибридную стратегию параллелизма с 4-кратным тензорным параллелизмом и 2-кратной конвейерной параллельной обработкой, распределенной по восьми ГП. Эта конфигурация привела к размеру контрольных точек 1636 ГБ, что соответствует современным требованиям к обучению больших языковых моделей.
В целом, Dapustor J5060 продемонстрировал стабильную производительность на начальном этапе тестирования, со временем около 575,66 секунд для первых 33 контрольных точек. 5060J смог поддерживать более высокую производительность до первого заполнения накопителя. С другой стороны, Solidigm P5336, хотя изначально и был медленнее J5060, продемонстрировал стабильную производительность по мере продолжения тестирования.
При учете общих средних значений, Dapustor J5060 показал время 769,44 секунды, в то время как Solidigm P5336 завершил работу за 640,17 секунды. Это ставит Solidigm P5336 впереди с точки зрения более быстрого сохранения контрольных точек.
В целом, Dapustor J5060 хорошо справляется с короткими операциями, но испытывает трудности с длительными записями продолжительностью более 30 минут. Между тем, Solidigm P5336 является лучшим накопителем для стабильной производительности в течение длительных задач. Эта более слабая производительность записи от Dapustor J5060 очевидна, когда скорость создания контрольных точек ухудшается по мере продолжения теста.
GPU Direct Storage
GPU Direct Storage — это технология, которая обеспечивает прямой обмен данными между устройствами хранения данных и ГП, минуя ЦП и системную память. При традиционной передаче данных данные считываются из хранилища в память ЦП, а затем копируются в память ГП. Этот процесс включает в себя несколько копирований данных, что приводит к увеличению задержки и снижению производительности. ЦП действует как узкое место, поскольку ему необходимо обрабатывать передачу данных между хранилищем и ГП. GDS устраняет это узкое место, позволяя устройствам хранения данных напрямую передавать данные в память ГП и из нее.
Мы систематически тестировали каждую комбинацию следующих параметров в рабочих нагрузках чтения и записи:
- Размеры блоков: 1 МБ, 128 КБ, 16 КБ
- Глубина ввода-вывода: 128, 64, 32, 16, 8, 4, 1
При рассмотрении результатов GDSIO мы анализируем производительность чтения и записи 61,44 ТБ Dapustor J5060 и Solidigm P5336.
Последовательное чтение GDSIO
Dapustor J5060 достигает пиковой пропускной способности чтения 4,2 ГБ/с при размере блока 1 МБ с глубиной ввода-вывода 64 и 128. При наименьшем размере блока (16 КБ) производительность варьируется от 0,1 ГБ/с до 0,8 ГБ/с по мере увеличения глубины ввода-вывода. Это показывает явное предпочтение к большим размерам блоков с высокой глубиной ввода-вывода для оптимальной пропускной способности. Пиковая производительность достигается при больших размерах блоков, что указывает на эффективность накопителя при обработке пакетных передач данных.
Для сравнения, Solidigm P5336 достиг аналогичной максимальной пропускной способности 4,3 ГБ/с при том же размере блока (1 МБ), но достиг этой производительности раньше при глубине ввода-вывода 32 и поддерживал ее стабильно при более высоких глубинах ввода-вывода. Это предполагает несколько лучшую эффективность при обработке больших размеров блоков в более широком диапазоне глубин ввода-вывода для Solidigm P5336.
Чтобы дать лучшее сравнительное представление, у нас есть дифференциальная диаграмма, сравнивающая оба накопителя. Более зеленый оттенок блока показывает преимущество SSD Dapustor, а блок, движущийся к красному спектру, показывает слабость. Здесь J5060 превосходит P5336 при размере блока 128 КБ, за исключением глубин ввода-вывода от 4 до 8. Однако отмечаются падения пропускной способности при более высоких глубинах ввода-вывода с размерами блоков 16 КБ и 1 МБ, что указывает на меньшую эффективность в этих сценариях.
В сравнении задержки последовательного чтения Solidigm P5336 стабильно поддерживает более низкую задержку, чем Dapustor J5060, практически для всех размеров блоков и глубин ввода-вывода. При размере блока 16 КБ разрыв становится более выраженным по мере увеличения глубины очереди: J5060 достигает пика в 2329 мкс при глубине 128, в то время как P5336 остается ниже на уровне 1365 мкс. При 128 КБ Solidigm снова лидирует при большинстве глубин, за исключением высоких нагрузок (4080 мкс на J5060 против 5539 мкс на P5336) при глубине 128. При размере блока 1 МБ оба накопителя испытывают увеличение задержки, как и ожидалось, но P5336 остается немного лучше контролируемым, с 29138 мкс против 29512 мкс при самой высокой глубине очереди.
Последовательная запись GDSIO
Dapustor J5060 показывает стабильную пропускную способность записи от 2,7 до 2,8 ГБ/с для размеров блоков 128 КБ и 1 МБ при всех глубинах ввода-вывода (за исключением 128 КБ, 1 размер глубины ввода-вывода, который показал 2,2 ГБ/с. Для размеров блоков 16 КБ производительность варьируется от 0,5 ГБ/с до 1,4 ГБ/с, в зависимости от глубины ввода-вывода, достигая пика в 1,4 ГБ/с при более высоких глубинах ввода-вывода.
Для сравнения, Solidigm P5336 показывает лучшую производительность при размерах блоков 128 КБ и 1 МБ, достигая пика в 3,2 ГБ/с. Для меньших размеров блоков (16 КБ) Solidigm P5336 также показывает более высокую производительность, достигая пика в 1,4 ГБ/с при глубинах ввода-вывода от 16 до 64. Это указывает на то, что Solidigm P5336 немного более эффективен с меньшими размерами блоков при операциях записи.
Переходя к дифференциальному представлению, мы видим, что разрыв между Dapustor J5060 и производительностью записи Solidigm P5336 увеличивается. Наше сравнение пропускной способности показывает, что J5060 отстает от P5336 в большинстве областей, особенно при больших размерах блоков (1 МБ) при всех глубинах ввода-вывода. Падения пропускной способности достигают -0,5 ГБ/с при 4 глубинах ввода-вывода. Хотя при более высоких глубинах ввода-вывода с размерами блоков 128 КБ наблюдается прирост производительности, он недостаточно значителен, чтобы компенсировать общее снижение производительности.
При сравнении задержки последовательной записи между Dapustor J5060 и Solidigm P5336, оба накопителя демонстрируют схожее поведение при меньших размерах блоков, таких как 16 КБ, при этом Solidigm имеет небольшое преимущество при низких глубинах ввода-вывода, в то время как Dapustor сокращает разрыв при более высоких глубинах (64 и 128). При размерах блоков 128 КБ Solidigm снова лидирует при малых глубинах очереди, но Dapustor стабильно обеспечивает более низкую задержку по мере увеличения глубины ввода-вывода, что указывает на лучшее масштабирование под нагрузкой. Однако при размерах блоков 1 МБ Solidigm сохраняет явное преимущество по задержке при всех глубинах ввода-вывода, демонстрируя значительно более быстрое время отклика при интенсивных последовательных рабочих нагрузках записи. В целом, Solidigm работает более стабильно, в то время как сильные стороны Dapustor более заметны при блоках среднего размера и более глубоких очередях.
Сводка рабочих нагрузок FIO
Flexible I/O Tester (FIO) — это отраслевой эталонный инструмент, используемый для измерения производительности устройств хранения данных в широком спектре сценариев рабочих нагрузок. FIO, которому доверяют за его универсальность и надежность, имитирует реальные условия, предоставляя информацию о возможностях и пределах производительности SSD. StorageReview использует FIO для предоставления комплексных анализов, измеряя пропускную способность, задержку и IOPS в различных шаблонах рабочих нагрузок, размерах блоков и глубинах очереди.
Примененные рабочие нагрузки:
- Последовательное чтение и запись 128 КБ
- Случайное чтение и запись 64 КБ
- Случайное чтение и запись 16 КБ
- Случайное чтение и запись 4 КБ
Эти рабочие нагрузки представляют широкий спектр корпоративных сценариев использования, включая большие последовательные передачи, интенсивный случайный ввод-вывод, типичный для баз данных, и случайный доступ с малыми блоками, часто встречающийся в виртуализированных средах.
Этот раздел производительности обобщает производительность Dapustor J5060 в ключевых синтетических рабочих нагрузках, включая последовательные и случайные операции чтения/записи при различных размерах блоков и глубинах очереди. Метрики извлекаются непосредственно из разобранного вывода fio и включают пропускную способность (МБ/с), IOPS и перцентили задержки до 99,9999%, предоставляя информацию как о пропускной способности, так и о поведении хвоста под нагрузкой.
Производительность последовательного чтения и записи 128 КБ
| Накопитель | Поток/глубина ввода-вывода | Пропускная способность (МБ/с) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Чтение Dapustor J5060 | 1T/64Q | 7 482 | 57 081 | 1,66 мс | 2,02 мс | 2,83 мс |
| Чтение Solidigm P5336 | 1T/64Q | 7 479 | 57 057 | 1,51 мс | 1,66 мс | 1,81 мс |
| Запись Dapustor J5060 | 1T/16Q | 3 023 | 23 063 | 0,69 мс | 0,69 мс | 0,70 мс |
| Запись Solidigm P5336 | 1T/16Q | 3 364 | 25 669 | 2,67 мс | 3,48 мс | 4,42 мс |
Dapustor J5060 обеспечивает впечатляющую производительность последовательного чтения при 128 КБ, достигая 7,48 ГБ/с с точным контролем задержки, даже при более высоких перцентилях. По сравнению с Solidigm P5336, пропускная способность J5060 практически одинакова (7,48 ГБ/с против 7,47 ГБ/с). Однако Solidigm имеет небольшое преимущество в стабильности задержки, демонстрируя незначительно более низкую задержку в хвосте.
При последовательной записи 128 КБ (QD16) J5060 демонстрирует стабильную производительность 3023 МБ/с с очень низкой задержкой. Тем не менее, Solidigm P5336 превосходит его на умеренную величину, достигая 3364 МБ/с, хотя и с заметно более высокой задержкой, особенно при 99,99% перцентиле (4,42 мс против удивительно низких 0,70 мс у Dapustor). Это указывает на то, что J5060 является более сильным кандидатом для сценариев последовательной записи, чувствительных к задержке.
Производительность случайного чтения и записи 64 КБ
| Накопитель | Глубина ввода-вывода | Пропускная способность (МБ/с) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Чтение Dapustor J5060 | 8T/32Q | 7 475 | 114 058 | 20,05 мс | 21,89 мс | 25,82 мс |
| Чтение Solidigm P5336 | 8T/32Q | 7 472 | 114 014 | 21,36 мс | 21,89 мс | 22,68 мс |
| Запись Dapustor J5060 | 8T/32Q | 534 | 8 151 | 574,6 мс | 708,8 мс | 742,39 мс |
| Запись Solidigm P5336 | 8T/32Q | 857 | 13 070 | 196,1 мс | 208,6 мс | 221,24 мс |
При случайном чтении 64 КБ (QD256) Dapustor J5060 превосходно справляется с пропускной способностью около 7,4 ГБ/с и хорошо контролируемой задержкой. Результаты Solidigm очень близки (7,47 ГБ/с) с немного лучшей максимальной перцентильной задержкой. Оба накопителя здесь работают исключительно хорошо, с минимальными практическими различиями.
Производительность записи при случайном чтении 64 КБ — это то, где J5060 заметно испытывает трудности, с резким падением пропускной способности до 534 МБ/с и значительным увеличением задержки (742,39 мс при 99,99%). В сравнении Solidigm P5336 значительно превосходит J5060, обеспечивая 857 МБ/с и значительно более низкую задержку (221,24 мс при том же перцентиле), что делает его гораздо более подходящим для приложений, чувствительных к задержке и длительной пропускной способности записи.
Производительность случайного чтения и записи 16 КБ
| Накопитель | Глубина ввода-вывода | Пропускная способность (МБ/с) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Чтение Dapustor J5060 | 8T/32Q | 7 430 | 453 461 | 5,28 мс | 6,39 мс | 8,16 мс |
| Чтение Solidigm P5336 | 8T/32Q | 7 431 | 453 527 | 5,01 мс | 5,21 мс | 5,47 мс |
| Запись Dapustor J5060 | 8T/32Q | 531 | 32 404 | 143,65 мс | 149,94 мс | 181,40 мс |
| Запись Solidigm P5336 | 8T/32Q | 847 | 51 724 | 57,9 мс | 65,8 мс | 71,8 мс |
При рабочей нагрузке случайного чтения 16 КБ (QD256) Dapustor достигает отличных результатов с 453 тыс. операций ввода-вывода и контролируемой задержкой. Solidigm P5336 практически повторяет эту производительность, немного превосходя Dapustor по задержке (5,47 мс против 8,16 мс при 99,99%), что предполагает немного лучшую стабильность задержки для Solidigm в сценариях интенсивного случайного чтения.
Производительность случайной записи SSD Dapustor значительно снижается до 32 тыс. операций ввода-вывода, а задержка увеличивается до 181,4 мс (99,99%). Здесь снова Solidigm значительно опережает накопитель Dapustor, обеспечивая 51,7 тыс. операций ввода-вывода и значительно улучшенный профиль задержки (71,8 мс при 99,99%), что подчеркивает преимущество Solidigm для чувствительных к задержке случайных рабочих нагрузок записи.
Пекинская компания Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Веб-сайт: www.qianxingdata.com/www.storagesserver.com
Направления деятельности:
Дистрибуция ИКТ-продукции / Системная интеграция и услуги / Инфраструктурные решения
Обладая более чем 20-летним опытом дистрибуции ИТ, мы сотрудничаем с ведущими мировыми брендами, чтобы поставлять надежные продукты и профессиональные услуги.
«Используя технологии для построения интеллектуального мира» Ваш надежный поставщик услуг ИКТ-продукции!



