StorageReview восстановила престижную вычислительную корону, вычислив π до удивительных 314 триллионов цифр, побив предыдущий мировой рекорд.Современная гонка за точностью π превратилась из первоначальных облачных экспериментов в полномасштабную демонстрацию инфраструктурных способностей и инженерной изобретательности.
Еще в 2022 году Google Cloud попал в заголовки газет, вычислив π до 100 триллионов цифр.Проект использовал десятки петабайт данных I/OВ то время эта веха являлась окончательным эталоном для определения верхних пределов того, что может достичь традиционная инфраструктура.
В начале 2024 года мы обновили нашу систему, установив новый рекорд в 105 триллионов цифр, поддерживаемый почти 1 петабайтом твердотельных накопителей Solidigm QLC.Это достижение установило новый критерий масштабаВсего несколько месяцев спустя мы продвинули границы еще дальше до 202 триллионов цифр.Этот прорыв подтвердил, что высокая плотность флэш-хранилища, в сочетании с тщательной системой настройки, может превзойти гипермасштабную облачную инфраструктуру для этой очень требовательной конкретной нагрузки.
Впоследствии Linus Media Group и KIOXIA завоевали титул, вычислив π до 300 триллионов цифр.Их настройка опиралась на большой кластер общего хранения Weka, оснащенный 2PB флэш-хранения.Несмотря на то, что это демонстрировало потенциал традиционной инфраструктуры с большим объемом хранилищ, это привело к значительным компромиссам: полный рафт оборудования, значительное потребление энергии,и сложные требования к охлаждениюМы были полны решимости не допустить, чтобы этот рекорд остался неоспоримым.
Сегодня StorageReview с гордостью объявляет о нашей новой победе: π рассчитана на 314 триллионов цифр.оснащенный двумя 192-ядерными процессорами AMD EPYC и сорока 61Мы завершили сборку и настройку системы в июле, начав расчетный запуск 31 июля 2025 года.что делает этот новый рекорд высокопроизводительных вычислений еще более своевременным.
Скалирование y-cruncher до 314 триллионов цифр
Как только масштаб вычислений превышает сотни триллионов цифр, y-cruncher превращается из традиционного эталона в изнурительное стрессовое испытание инфраструктуры на большие расстояния.Основная логика программы остается простой., но его взаимодействие с оборудованием в этом масштабе становится решающим фактором.Вся операция зависит от способности системы поддерживать тысячи многоточных операций, работающих бесперебойно, без задержки процессоров или перегрузки слоя храненияНа самом деле, этот новый рекорд был действительно выигран в слое хранения.
Мы развернули 40 микронов 6550 Ion Gen5 NVMe SSD, из которых 34 выделены исключительно для запуска y-cruncher.Это дает y-cruncher достаточное хранилище для вычисления и обработки 314 триллионов цифр π.Остальные 6 SSD сконфигурированы в программный RAID10 объем, специально используется для хранения окончательных 314-триллионных цифр результатов.
Улучшения дизайна между 16-м и 17-м поколениями серверов Dell PowerEdge также сыграли ключевую роль в повышении производительности для этого рекордного 314-триллионного цифр.В нашей предыдущей попытке с 202 триллионами цифр использовался Dell PowerEdge R760В отличие от серверов PowerEdge 17-го поколения, PowerEdge-серверы, которые были разработаны с использованием PCIe-сдвига на заднем плане привода для повышения плотности привода.такие как R770 на основе Intel и R7725 на основе AMD, оснащенные планами с прямым подключением, предлагающими 2 или 4 полосы PCIe на отсек.
PowerEdge R7725, оснащенный 40-устье Gen5 E3.S задней плоскости, обеспечивает 2 PCIe полосы на слот SSD.Платформа все еще может обеспечивать впечатляющие скорости.: до 280 ГБ/с одновременного чтения и записи при полном использовании всех 40 полос.
Используя внутренний стандарт хранения y-cruncher, мы измерили производительность хранения каждой платформы в ее соответствующей конфигурации.мы наблюдали улучшения производительности хранения от 72% до 383%, с хорошо сбалансированными показателями чтения и записи, подтверждающими превосходство сервера PowerEdge 17-го поколения для высокомасштабных вычислений с интенсивным использованием памяти.
| Метрический | Система 202T (старая запись) | Система 314T (новая запись) | Процентная разница (314T против 202T) |
|---|---|---|---|
| Последовательное письмо | 470,0 GiB/s | 107 ГБ/с | +127,7% |
| Последовательное чтение | 560,7 ГБ/с | 127 Гбит/с | +124,0% |
| Установление порога | 62.2 Гиб/с | 107 ГБ/с | +72,0% |
| Предельный уровень чтения | 200,9 ГиБ/с | 101 Гбит/с | +383,3% |
Dell PowerEdge R7725 гораздо больше, чем просто хранилище данных; он ярко сияет как двустворчатая платформа AMD Turin с исключительным вычислительным потенциалом.Мы оснастили нашу систему 192-ядерными процессорами AMD EPYC 9965Чтобы обеспечить эту производительность, мы обновили запасное решение для охлаждения воздухом на холодильные пластины CoolIT SP5 с жидкостным охлаждением,охлажденный CoolIT AHx10 Liquid-to-Air CDU (распределитель охлаждающего вещества).
Эта стратегическая модернизация охлаждения принесла три ключевых преимущества: она позволила ЦПУ поддерживатьустойчивые высокие часовые частоты, держал вентиляторы шасси сервера работают на удивительно низком30% PWM(Модуляция ширины импульса) и обеспечил, чтобы среднее потребление электроэнергии системы оставалось стабильным примерно на уровне1600 Вт.
Оптимизация программного обеспечения и системы
Для слоя программного обеспечения, мы отступили от прошлых практик, выбравУбунту 24.04.2 Сервер LTSЭто решение оказалось важным для максимизации стабильности системы и значительного повышения производительности нагрузки.
Прежде чем начать запись запуска, мы провели строгие тестовые итерации и тонко настроить конфигурацию.4 из 384 доступных ядерВ результате мы не просто побили предыдущий рекорд пи.Мы уничтожили его.Наш ход не имеет себе равных по производительности, энергоэффективности, и самое впечатляющее, в его безупречной надежности.Мы гордимся тем, что единственная попытка установить мировой рекорд пи в большом масштабе была завершена снулевое время простоя; расчет прошел беспрепятственно от начала до конца без необходимости возобновления.
Рекордное энергоэффективность
Основной принцип, лежащий в основе каждой из попыток записи пи StorageReview, заключается в минимизации сложности системы и оптимизации энергоэффективности.Предыдущий рекорд 300T опирался на распределенный кластер хранения с высокоскоростной сетью, что требовало больших бюджетов на электроэнергию и охлаждение.
Мы приняли принципиально иной подход.экстремальная плотность храненияЭтот архитектурный выбор был ключевым в резком сокращении общей мощности и охлаждения.
В ходе полного 314-триллионного расчета, наш Dell PowerEdge R7725 потреблял в общей сложности4,3040,662 кВт·чЭто эквивалентно необыкновенному130,70 кВт/ч на триллион цифр∙ ∙ размещая наше решение среди самых энергоэффективных масштабных вычислений пи когда-либо выполненных.подход к одному серверу и энергоемкий распределенный кластерный метод сразу понятен, как показано в таблице сравнения ниже.
| Беги. | Общее количество кВтч | Стоимость @ $0,12/kWh | Стоимость @ $0,20/kWh |
|---|---|---|---|
| 300T Weka Cluster Run (Векская групповая пробежка) | 33,600 кВт·ч (в эквиваленте) | 4 доллара.032 | 6 долларов.720 |
| 314T Односерверное запуск | 4,3040,662 кВт·ч | $517 | $861 |
Важно подчеркнуть, что во время нашего 314-триллионного расчета мы использовали SSD в JBOD (Just a Bunch of Disks) конфигурации, которая не включает в себя встроенную устойчивость данных.Это решение было основано на двух основных приоритетах:: оптимизация потребления энергии и максимизация общей производительности системы.Это также вызвало важный разговор о адаптации решений хранения к конкретным требованиям рабочей нагрузки.Каждая рабочая нагрузка уникальна.Некоторые могут быть перезагружены с минимальным воздействием на работу и поэтому не требуют такого же высокого уровня терпимости к ошибкам, как задачи критического назначения.Мы сосредоточились на защите окончательного вывода данных через традиционное программное обеспечение RAID настройки, обеспечивая целостность пи-цифр, не нарушая эффективности системы.
110 дней непрерывной работы
Несмотря на то, что мы вычислили больше цифр, чем любая предыдущая попытка записи π, время работы наших часов было значительно короче, чем предыдущий показатель.Предыдущая 300-триллионная запись потребовала примерно 225 суток для завершения, что эквивалентно 175 фактическим вычислительным дням, если исключить время простоя.В отличие от этого, наш 314-триллионный цифрный цикл достиг 110 дней непрерывной работы.надежная и стабильная операционная система, минимизированная фоновая нагрузка для предотвращения конфликта ресурсов, сбалансированная топология NUMA (неравномерный доступ к памяти) для оптимальной связи CPU-памяти,и скретч массив специально разработанный для обработки уникальных моделей доступа к данным, генерируемых y-cruncher в этом беспрецедентном масштабе.
Технические особенности
- Общее количество вычисленных цифр: 314,000,000,000,000
- Используемое оборудование: Dell PowerEdge R7725 с 2x AMD EPYC 9965 процессорами, 1,5 ТБ DDR5 DRAM, 40x Micron 61.44 ТБ 6550 Ion
- Программное обеспечение и алгоритмы"Y-Cruncher V0". - "Y-Cruncher V0". - "Y-Cruncher V0".8.6.9545Чудновский.
- SSD Wear по SMART: 7.3PB записывается на диск или 249.11PB на 34 SSD, используемых для обмена
- Логически самый большой контрольный пункт: 850,538,385,064, 992 (774 TiB)
- Логический пик использования диска: 1,605,960,520,636,440 (1,43 PiB)
- Читать байты логического диска: 148,356,635,606,263,504 (132 PiB)
- Записанные байты логического диска: 126,658,805,195,776,600 (112 PiB)
- Дата началаВ четверг, 31 июля, 17:1642 2025 год
- Дата окончанияВо вторник, 18 ноября.57:08 2025 год
- Пи:8793223.144 секунды, 101,773 дня
- Общее время вычисления: 9274878.580 секунд
- Время на стене от начала до конца: 9463226.454 секунды
Заключительные мысли
На протяжении десятилетий экстремальные расчеты π служили витриной компьютерных мастерств, в центре внимания каждого периода находилось "большое железо".Ранние записи опирались на высокопроизводительные настольные компьютеры и внешние массивы храненияВ последующем внимание было сосредоточено на локальных предприятиях.где такие инициативы, как 100-триллионный запуск Google, продемонстрировали, что грубая сила, вооруженная тысячами экземпляров и массивной пропускной способностью I/O, может обеспечить рекордЗатем мы увидели появление больших кластеров совместного хранения, приоритетом для которых является необработанная параллельность, а не простота, но за счет значительного потребления энергии и сложных требований к охлаждению.
Наше путешествие пошло в противоположном направлении: на протяжении последовательных рекордов, мы рассматривали рабочую нагрузку y-cruncher как критическую, долгосрочную задачу HPC, а не разовый трюк.Кампании 105T и 202T сыграли важную роль в выявлении основных узких мест: оптимизация запоминающейся емкости, обеспечение постоянной нагрузки на процессор без перегрузки уровня ввода/вывода и укрепление системы для обеспечения надежной производительности в течение нескольких месяцев.314T - это кульминация этого труднодостижимого опыта.Это не просто большое число, этоболее зрелый дизайн для производства.
Данные говорят сами за себя. мы преодолели барьер в 300 триллионов цифр на одном 2U Dell PowerEdge R7725, оснащенном 40 микронами 6550 Ion SSD и двумя 192-ядерными процессорами AMD EPYC.Система работала безупречно 110 дней подряд.Пропускная способность хранилища более чем удвоилась по сравнению с нашей платформой 202T, но сервер сохранил скромное среднее потребление энергии в 1,600 ВтЭто приводит к удивительно эффективным 13,70 кВт·ч на триллион цифр, что составляет лишь долю от расчетной мощности предыдущего 300Т кластера.Короче говоря..., мы достигли больше работы с меньшим количеством узлов, меньшей сложности и более низких затрат на энергию.
Контактная информация
Beijing Qianxing Jietong Technology Co., Ltd.
Контактное лицо: Ms. Sandy Yang
Телефон: 13426366826



