Мы используем Dell PowerEdge R760 с Ubuntu 22.04.02 LTS в качестве нашей тестовой платформы для всех рабочих нагрузок в этом обзоре.2, E1.S, E3.S, и M.2 SSD. Конфигурация нашей системы изложена ниже:
Производительность CDN
Для моделирования реалистичной рабочей нагрузки CDN с смешанным контентом на SSD была проведена многофазная последовательность эталонов, предназначенная для воспроизведения шаблонов ввода/вывода серверов с высоким содержанием.Процесс тестирования охватывает ряд размеров блоков, больших и малых, распределенных по случайным и последовательным операциям., с различными уровнями одновременности.
Перед основными тестами производительности, каждый SSD завершил полное заполнение устройства с помощью 100% последовательного пропуска записи с использованием блоков 1 МБ. Этот процесс использовал синхронный I / O и глубину очереди четырех,позволяет выполнять четыре работы одновременноПосле последовательного заполнения, была выполнена вторичная трехчасовая рандомизированная фаза насыщения записи, в результате которой устройство получает постоянное состояние, которое отражает реальное использование.используя взвешенное распределение размеров блоков (размер блоков/процент) с сильным акцентом на 128K-трансферы (98Этот шаг эмулирует фрагментированные, неравномерные шаблоны записи, обычно встречающиеся в распределенных средах кэша.
Основной пакет тестирования был сосредоточен на масштабируемых случайных операциях чтения и записи для измерения производительности привода при переменной глубине очереди и одновременности работы.Каждый тест длился пять минут (300 секунд), за которым следует трехминутный период бездействия, чтобы позволить внутренним механизмам восстановления стабилизировать показатели производительности.
Испытания проводились с использованием фиксированного распределения размера блока, предпочитающего 128K (98,51%), а оставшиеся 1,49% операций состояли из меньших размеров передач от 64K до 8K.Каждая конфигурация варьируется по 1, 2 и 4 одновременные работы, с глубиной очереди 1, 2, 4, 8, 16 и 32, для профилирования масштабируемости пропускной способности и задержки при типичных условиях записи на краю.
Также использовался сильно смешанный профиль размеров блоков, имитирующий извлечение контента CDN, начиная с доминирующего компонента 128K (83,21%),за которым следует длинный хвост более 30 меньших размеров блоков (4K до 124K)Это распределение отражает различные шаблоны запросов, встречающиеся при получении видеосегмента, доступе к миниатюрам и поисках метаданных.Эти тесты также были выполнены по всей матрице количества рабочих мест и глубины очереди.
Эта комбинация предварительных условий, насыщения и рандомизированных тестов доступа смешанного размера предназначена для того, чтобы показать, как SSD работают в устойчивых CDN-подобных средах,подчеркивая эффективность и оперативность в условиях высокой пропускной способности, очень параллельные сценарии.
Рабочая нагрузка CDN 1
В наших тестах чтения рабочей нагрузки CDN (1 работа) Kingston DC3000ME предоставил солидную производительность, которая эффективно масштабировалась с увеличением глубины очереди.отставая от SanDisk SN861 примерно на 26%Однако по мере увеличения глубины очереди DC3000ME сократил разрыв и превзошел несколько приводов Gen5. В QD4, Kingston DC3000ME достиг 3390MB/s ≈ примерно на 42% быстрее, чем Micron 9550,40% впереди Pascari X200P, и примерно на 25% быстрее, чем Solidigm PS1010, хотя слегка отстает от SanDisk SN861 примерно на 2,6%.превышает Solidigm PS1010 на ~13% и Micron 9550 на ~20%При максимальной глубине испытания QD32 Kingston достиг 14,131MB/s, эффективно сравниваясь с Micron 9550 и превосходя Solidigm PS1010 на ~15% и SanDisk SN861 почти на 10%.
Kingston DC3000ME - CDN Рабочая нагрузка Читать 1 работу
Рабочая нагрузка CDN 2
В работе по чтению CDN с двумя задачами Kingston DC3000ME поддерживал высокую производительность на всех глубинах очереди.Паскари X200P (1,519 МБ/с) на 22%, и Solidigm PS1010 (2,011 МБ/с) примерно на 8%, хотя и отстает от SanDisk SN861 (2,487 МБ/с) на 34%.
В QD4 Kingston достиг 6,335MB/s, заметно опережая Micron (5,337MB/s), Pascari (5,249MB/s) и Solidigm (5,609MB/s).который занял первое место в 6996 МБ/с.
К QD16 Kingston достиг 14,131MB/s, лидируя в этой точке. В финальной точке испытания (QD32) он достиг небольшого увеличения до 14,336MB/s, последуя за Pascari (15,257MB/s) и Micron (15,257MB/s).052 МБ/с) ~ 6% и 5%, соответственно, сохраняя солидное лидерство над SanDisk (13,619MB/s) и Solidigm (13,721MB/s).
Рабочая нагрузка CDN 4
С четырьмя активными рабочими местами Kingston DC3000ME продолжал удерживать свои позиции в производительности чтения CDN. В QD1 он достиг 3,639MB/s, превзойдя Micron 9550 (3,070MB/s) и Pascari X200P (2,982MB/s),но все еще на 22% отстает от SanDisk SN861К QD4 Kingston показал 10,854MB/s ≈ 15% улучшение по сравнению с Micron (9,427MB/s), на 20% выше Pascari (9,070MB/s) и немного выше Solidigm (9,627MB/s).,Он все еще отставал от SanDisk с скоростью 11,161 МБ/с.
К QD8 Kingston опубликовал 13,926MB/s ≈ почти идентичный Micron и примерно в соответствии с SanDisk (13,619MB/s) и Solidigm (12,800MB/s).233 МБ/с для Кингстона, слегка отставая от Micron и Pascari (оба около 15 052 ‰ 15 257 МБ/с), но все еще удобно впереди SanDisk (13619 МБ/с) и Solidigm (13721 МБ/с).
Рабочая нагрузка CDN Write 1
В нашей CDN нагрузки на запись (1 Работа), Kingston DC3000ME показал последовательное масштабирование в глубине очереди. на QD1, он достиг 2,118MB/s ¢ быстрее, чем Micron 9550 (2,004MB/s), Pascari X200P (1,885MB/s),и Solidigm PS1010 (1,718MB/s), отставая от SanDisk SN861 всего на волос (2,164MB/s).437 МБ/с), но на 10% медленнее Micron (4807 МБ/с) и на 19% медленнее SanDisk (5353 МБ/с).
К QD16 он предоставил 5,880MB/s ≈ выигрывая Pascari (4,921MB/s) на 20% и более чем удвоив Solidigm (2,664MB/s), но все еще на 11% отставая от Micron (6,686MB/s) и на 15% от SanDisk (6,939MB/s)." Кингстон " забил 5 очков., 987 МБ/с снова близко к Pascari (5,913 МБ/с), но отстает от Micron (7,422 МБ/с) и SanDisk (7,521 МБ/с) на ~ 20% и 25%, соответственно.
Kingston DC3000ME - Запись производительности CDN рабочей нагрузки 1 работа
Рабочая нагрузка CDN Write 2
В рабочей нагрузке на запись CDN с двумя задачами, Kingston DC3000ME продемонстрировал стабильную производительность, хотя в целом он отставал от самых быстрых SSD корпоративного класса Gen5.651МБ/с ≈ прямо под микроном 9550 (2,813 МБ/с) и Pascari X200P (2,762 МБ/с), и примерно на 33% отстают от SanDisk SN861 (3,972 МБ/с).
По мере увеличения глубины очереди DC3000ME не отставал от QD4, достигнув 4,807 МБ/с, что на 23% медленнее, чем у Micron 9550 (5,902 МБ/с) и на 13% медленнее, чем у SanDisk SN861 (5,508 МБ/с).но впереди Solidigm PS1010 на 3154 МБ/с.
В QD16 Kingston поставил 5,772MB/s, все еще отставая от Micron (7,896MB/s) и SanDisk (6,709MB/s), но продолжая превосходить модели более низкого уровня, такие как Solidigm PS1010 (3,820 МБ/с) и Pascari X200P (5В QD32 DC3000ME достиг пика в 5,870MB/s, примерно на 32% отставая от Micron 9550 (8,670MB/s) и на 22% ниже SanDisk SN861 (7,537MB/s), но все еще опережает Solidigm PS1010 (2,817 МБ/с) и Паскари (4,585 МБ/с).
Рабочая нагрузка CDN Write 4
В работе по записи CDN с 4-мя задачами Kingston DC3000ME стабильно масштабировался на всех глубинах очереди, хотя в целом он отставал от двух лучших дисков Gen5.202МБ/с2 помещая его за Pascari X200P (2В QD2, Kingston достиг 3,165MB/s, опять отставая от SanDisk (4,4MB/s).863 МБ/с) и Микрон (4,457MB/s), но сохраняет лидерство над Solidigm (2,872MB/s).
При средней глубине очереди Kingston DC3000ME достиг 3,647 МБ/с при QD4 и 4,410 МБ/с при QD8.478 МБ/с) и SanDisk (5В QD16 компания Kingston показала 4,865MB/s с умеренным увеличением по сравнению с QD8, но все еще отстает от SanDisk (6,011MB/s) и Micron (7,474MB/s).DC3000ME достиг своего пика в 5, 307MB/s ), значительно опережая Solidigm (3,894MB/s), но значительно отставая от Micron (7,941MB/s) и SanDisk (7,212MB/s).Двигатель Kingston поддерживал постоянное масштабирование и эффективность.
Сравнительный показатель контрольно-оценочной системы DLIO
Чтобы оценить эффективность SSD в реальном мире в среде обучения ИИ, мы использовали инструмент сравнения Data and Learning Input/Output (DLIO).DLIO специально разработан для тестирования моделей ввода/вывода в процессах глубокого обучения, предоставляя представление о том, как системы хранения справляются с такими проблемами, как проверка пунктов, прием данных и обучение моделей.Диаграмма ниже иллюстрирует, как оба привода обрабатывают процесс через 36 контрольных точекПри обучении моделей машинного обучения контрольные точки имеют решающее значение для периодического сохранения состояния модели, предотвращая потерю прогресса при перебоях или отключении питания.Этот спрос на хранение требует надежной производительностиМы использовали версию 2.0 стандарта DLIO от 13 августа 2024 года.
Чтобы гарантировать, что наш сравнительный анализ отражает реальные сценарии, мы основывали наше тестирование на архитектуре модели LLAMA 3.1 405B. Мы внедрили контрольные точки с использованием torch.save() для захвата параметров модели,состояния оптимизатораНаша установка моделировала восьми-GPU систему, используя гибридную стратегию параллелизма с 4-сторонней тензорной параллелизмом и 2-сторонней трубопроводной параллельной обработки распределены по восьми GPU.Эта конфигурация привела к размерам контрольных пунктов в 1636 ГБ, что соответствует современным требованиям к обучению большим языковым моделям.
В среднем результате прохождения DLIO, Kingston DC3000ME 7.68TB слегка отставал от лучших претендентов, приземлившись в середине пятиприводной пачки.04 секунды после первого пропуска.Хотя он и был быстрее, чем Pascari X200P 7.68TB (который показал самые высокие времена во всех трех проходах), он был быстрее.достигает 674.48 секунд в проходе 3), Kingston DC3000ME отставал от Micron 9550 7.68TB и Solidigm PS1010 7.68TB, оба из которых остались ниже 565 секунд в последнем проходе.
Как показано в таблице ниже, Kingston DC3000ME начал с хорошего результата, с тем, что время на контрольных пунктах близко к тем, что и у конкурентов верхнего уровня.27 секунд прямо за микроном 9550 на 464От контрольного пункта 2 до 4, он поддерживал устойчивый диапазон от 461.92 до 465.44 секунды снова близко к Микрону 9550 и Солидигму PS1010, оба из которых находились в 453 ≈ 465 секундной скобке.
К середине испытаний (пропускные пункты 5 - 8) время на контрольно-пропускных пунктах Kingston DC3000ME увеличилось до 613,01 секунды, что выше, чем на контрольно-пропускных пунктах Micron 9550 (570,0 секунды).42s) и SanDisk SN861 7.68TB (559.56s), хотя и значительно лучше, чем Pascari X200P (который достиг 694.38 секунд в течение того же интервала).Кингстон DC3000ME немного стабилизировался., закончив на 571,36 секунды для контрольного пункта 12, примерно на 28 секунд медленнее, чем Micron 9550, но все еще опередив Pascari X200P (который закрылся на 689,68 секунды)..68TB продемонстрировал стабильную производительность и оставался в пределах конкурентоспособного диапазона на протяжении всей нагрузки на контрольно-пропускные пункты, что ставит его в середине пакета.
Сравнительный показатель эффективности FIO
Чтобы измерить производительность хранения каждого SSD по общепринятым отраслевым показателям, мы использовали FIO.включая предварительный шаг из двух полных заполнений диска с последовательной нагрузкой на записьПо мере того, как каждый тип рабочей нагрузки менялся, мы выполняли еще одно предварительное заполнение этого нового размера передачи.
В этом разделе мы сосредоточимся на следующих показателях FIO:
-128K последовательный
- 64K случайный
- 16K случайный
- 4K случайный
С высокопроизводительными QLC SSD, предназначенными для больших размеров передач, наши тесты скорости записи ограничены 16K случайным.мы использовали предварительно заполненное состояние от 16K рабочей нагрузки для измерения только 4K случайного чтения производительности.
128K последовательное предварительное условие (IODepth 256 / NumJobs 1)
В этом тяжелом тесте предварительного обустройства в глубине очереди Kingston DC3000ME поддерживал постоянную пропускную способность записи 8,944.9 МБ/с на протяжении 1000 секунд (заканчивая чуть выше отметки 800 секунд).Kingston DC3000ME продемонстрировал постоянную пропускную способность с минимальными отклонениями.
128K последовательная задержка предварительных условий (IODepth 256 / NumJobs 1)
В тесте задержки 128K Sequential Write Precondition Kingston DC3000ME показал среднюю задержку 3,577 мс (остается стабильным с течением времени с минимальными колебаниями),Поставив его на второе место за приводом Micron.
128K последовательная запись (IODepth 16 / NumJobs 1)
В тесте 128K последовательной записи Kingston DC3000ME достиг 8,477.4МБ/с, разместив его сразу за Micron 9550 (который возглавлял группу на 10,354Kingston DC3000ME превзошел Pascari X200P и сохранил солидное лидерство как над Solidigm PS1010, так и над SanDisk SN861 (каждый колеблется около 7100MB/s).Выступление Кингстона отражает сильный баланс между скоростью и последовательностью.
128K последовательная задержка записи (IODepth 16 / NumJobs 1)
В тесте 128K Sequential Write Latency, Kingston DC3000ME дал солидный результат со средней задержкой 235,6 мкм. Это ставит его впереди как SanDisk SN861 (280,0 мкм), так и SanDisk SN861 (280,0 мкм).7μs) и Solidigm PS1010 (280Несмотря на то, что он был не таким быстрым, как Micron 9550 (который был впереди на 192,9 мкм), Kingston DC3000ME оставался конкурентоспособным.
128K последовательное чтение (IODepth 64 / NumJobs 1)
В тесте 128K Sequential Read при глубине очереди 64 с одной работой, Kingston DC3000ME достиг 13,513.8MB/s. Несмотря на то, что он занял четвертое место среди испытанных дисков, он все равно обеспечивал высокую пропускную способность (с минимальными различиями в реальном мире).242.1MB/s) на ~ 5,1%, Solidigm PS1010 (14,163.3MB/s) на 4,6%, а микроном 9550 (14,050.1MB/s) на ~3,8%, но комфортно превосходил SanDisk SN861 (12,631В целом, результаты Kingston DC3000ME были хорошими, с минимальным снижением по сравнению с прошедшими испытаниями.
128K последовательная задержка чтения (IODepth 64 / NumJobs 1)
Для задержки, Kingston DC3000ME зарегистрировал средний 591.6μs, поместив его в середине группы.На 4% ниже, чем у Solidigm PS1010 (564Pascari X200P незначительно возглавлял на 561,4 мкм, в то время как SanDisk SN861 показал самый медленный ответ на 633,0 мкм.Kingston DC3000ME поддерживал относительно низкую задержку в условиях высокой глубины чтения очереди.
64K Случайная запись
В тесте Random Write 64K Kingston DC3000ME постоянно обеспечивал высокую производительность в различных глубинах очереди и комбинациях нитей, достигнув пика в 6,649MB/s в конфигурации 32 (глубина IO)/8 (число рабочих мест).
На протяжении всей диаграммы, Kingston DC3000ME поддерживал стабильную тенденцию пропускной способности от 4000 до 5000 МБ/с, с особенно сильными показателями в средних и высоких настройках одновременности (например, 32/4 на 5,380 МБ/с и 16/8 при 5По сравнению с другими накопителями, Kingston DC3000ME обычно лидировал или оставался рядом с вершиной в большинстве точек тестирования,предлагает как высокую пиковую пропускную способность, так и постоянную производительность.
64K случайная задержка записи
В тесте 64K Random Write Latency, Kingston DC3000ME последовательно обеспечивал низкие сроки ответа на большинстве глубин очереди и комбинаций заданий,демонстрирует высокую эффективность записи даже при большой нагрузке.
Например:
- На 4/1, показано 49 мкм
- На 8/1, задержка осталась низкой на 102 мкм
- При 16/4, он измерял 1,486 мкм.
- И при самой высокой испытательной нагрузке, 32/8, он достиг 2402 мкм.
Эти результаты показывают, что Kingston DC3000ME масштабируется предсказуемо, избегая серьезных скачков задержки, наблюдаемых в других накопителях, особенно в моделях Pascari и Solidigm,которые демонстрировали нерегулярные прыжки выше 3, 000 ‰ 6 000 μs (особенно при 16/8).
64K Случайное чтение
В тесте Random Read 64K Kingston DC3000ME показал сильную, последовательную производительность по всей матрице IOdepth / NumJobs, заняв четвертое место к концу теста (небольшим отрывом).Пик пропускной способности достигнут 13,515MB/s на 32/4, с аналогично высокой пропускной способностью на 16/4 (13,482MB/s) и 32/8 (13,512MB/s)Kingston DC3000ME с измерением 2298 МБ/с и 2234 МБ/с соответственно.
64K случайная задержка чтения
Продолжительность работы Kingston DC3000ME с 64K оставалась относительно низкой во всех точках тестирования.хотя SanDisk SN861 достиг пика заметно выше, чем другие в конце тестаНачиная с 1/2, Kingston DC3000ME измерял 106μs, затем 108μs на 1/4, 131μs на 8/1, 133μs на 4/4, и 177μs на 8/4. При более высокой параллельности он увеличивался до 305μs на 16/4, 174μs на 32/1,301 мкс при 32/2В целом, профиль задержки Kingston DC3000ME находится в тесном контакте с лучшими производителями.с минимальным джиптом или отклонениями (общие для всех испытуемых приводов).
16K Случайная запись
В тесте Random Write 16K Kingston DC3000ME обеспечил высокую пропускную способность в полном диапазоне глубины очереди и количества нитей, заняв второе место среди конкурирующих дисков.592 IOPS в конфигурации 32/16Другие высокопроизводительные точки включали 338,521 IOPS на 32/8, 251,428 IOPS на 16/4, и 226,606 IOPS на 1/8 все показывая отличную эффективность контроллера при различных параллельных нагрузках.Даже при умеренной нагрузке (2/16 и 1/4)В целом, Kingston DC3000ME последовательно достигал IOPS выше 160 000 на протяжении всей матрицы испытаний (за исключением нескольких областей),что делает его одним из более сбалансированных приводов в этой нагрузке.
16K случайная задержка записи
Высокие показатели включали 14 мкм на 1/1, 18 мкм на 2/1, и более высокие показатели - 14 мкм на 1/2.19 мкс при 1/4По мере увеличения нагрузки, Kingston поддерживал сильный профиль латентности: 126 мкм на 8/4, 146 мкм на 2/16, 254 мкм на 16/4, и 575 мкм на 16/8.латентность оставалась контролируемой на 1197 мкм.
16K Случайное чтение
В условиях случайного чтения 16K Kingston DC3000ME демонстрировал стабильно высокую производительность до достижения 8/8, после чего он начал слегка отставать.Пик IOPS упал чуть ниже 800K (648, 686) в QD32 с четырьмя рабочими местами, за которыми следуют 641K IOPS в QD4 с 16 рабочими местами и 623K в QD16 с четырьмя рабочими местами.Kingston DC3000ME закончил внизу таблицы лидеров рядом с SanDisk.
16K случайная задержка чтения
При пиковой пропускной способности (QD8/8), задержка Kingston DC3000ME измерялась всего в 99 мкм, оставаясь в узкой полосе с низкой задержкой в большинстве конфигураций до 16/8, когда она начала колебаться.Наилучшая латентность наблюдалась при QD1/4 (74μs)При более тяжелых нагрузках (например, QD32/16),Kingston DC3000ME показал 826μs ≈ значительно выше, чем другие испытанные диски (кроме SanDisk).
Случайное чтение 4K
В тесте случайного чтения 4K, Kingston DC3000ME показал отличную масштабируемость в диапазоне теста, достигнув пика на 1,957.92K IOPS в конфигурации 16/16.923.42K IOPS на 32/8, 1,361.32K IOPS на 8/16, и 1,326.03K IOPS на 16/8 ′′постоянно занимает первое место в рейтинге вместе с Solidigm и Micron.
4K случайная задержка чтения
Kingston DC3000ME поддерживал низкую задержку на протяжении всего