Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

ANALYSIS OF INCREASING THE DATA CENTERS ENERGY EFFICIENCY METHODS

Sviridov A.N. 1 Demkin V.I. 1
1 National Research University of Electronic Technology
The paper considers the methods for improving the energy efficiency of Data Centers. The efficiency ratio PUE (Power Utilization Efficiency) is the key identification of the data center energy efficiency. The article provides an analysis of methods for improving energy efficiency by optimizing the distribution of computing load between servers and optimizing the operation of Air Conditioning systems. Optimization decisions are made using telemetry data from IPMI (Intelligent Platform Management Interface) servers based on the x86 architecture. The data was obtained from temperature sensors, power sensors and data on the utilization of server computing resources. Based on the results of modeling in CAD Autodesk CFD using computational fluid dynamics, the effectiveness of optimization methods is evaluated. The first step is to consolidate the load on the servers and put the least loaded servers into power saving mode. The second step is load balancing between the active servers. The third step is to optimize the cooling systems by using air conditioners with variable frequency drive. At each step, simulations are performed to evaluate the effectiveness of the optimization. The effectiveness of the optimization methods is evaluated by the calculated energy consumption of IT equipment, the energy consumption of cooling systems and the total energy consumption.
PUE
power utilization efficiency
CFD
computational fluid dynamics
DC

Центры обработки данных стали ключевыми компонентами современной ИТ-инфраструктуры. Росту российского рынка ЦОД способствует национальная программа «Цифровая экономика Российской Федерации» [1].

Требования к потреблению энергии и охлаждению в центрах обработки данных являются критическими проблемами как с точки зрения растущих эксплуатационных расходов, так и с точки зрения их воздействия на окружающую среду.

Одним из основных параметров центров обработки данных является энергоэффективность. Энергоэффективность ЦОД определяется отношением общей мощности, потребляемой ЦОД, к мощности, потребляемой ИТ-оборудованием. Основным фактором, влияющим на энергоэффективность ЦОД, является эффективность систем охлаждения [2].

При определении требований к центрам обработки данных необходимо учитывать тенденции развития информационных систем и телекоммуникаций. Для решения задачи управлениями ресурсами требуются динамические методы. Технологии, используемые в современных серверных платформах на базе архитектуры x86, позволяют в режиме реального времени контролировать энергопотребление, выделяемое тепло от оборудования и утилизацию вычислительных ресурсов. Эти данные доступны в интерфейсе IPMI (Intelligent Platform Management Interface). На основе этих данных возможно принятие взвешенных решений по оптимизации вычислительной нагрузки на оборудование.

Основными методами повышения энергоэффективности ЦОД являются:

- консолидация вычислительной нагрузки;

- балансировка вычислительной нагрузки;

- использование кондиционеров с частотно-регулируемым приводом.

Консолидация нагрузки заключается в том, чтобы сконцентрировать вычислительную нагрузку на наиболее производительных серверах, а менее производительные серверы перевести в режим ожидания. Снижение потребления мощности основано на переводе менее загруженных и менее производительных серверов в состояние пониженного энергопотребления.

Балансировка рабочей нагрузки – это метод, направленный на создание единого профиля по стойкам и рядам (Uniform Outlet Profile, UOP), чтобы уменьшить количество горячих и холодных точек в ЦОД. Наличие горячих и холодных точек в ЦОД нарушает распространение охлажденного воздуха от кондиционеров и значительно снижает эффективность систем охлаждения.

Применение кондиционеров с частотно-регулируемым приводом (Variable Frequency Drive, VFD) – это метод, подразумевающий модификацию систем охлаждения. Управление кондиционерами с частотно-регулируемым приводом позволяет снижать мощность систем охлаждения в наименее нагруженных частях центров обработки данных.

Цель исследования заключается в оценке эффективности применении методов повышения энергоэффективности ЦОД на основе данных телеметрии, полученной с интерфейса IPMI.

Материал и методы исследования

Оценка эффективности применении методов повышения энергоэффективности ЦОД состояла из нескольких этапов:

- настройка тестового стенда и подключение к платформе Intel DCM Energy Director;

- проведение нагрузочного тестирования на стенде и фиксация данных об энергопотреблении и тепловыделении посредством платформы Intel DCM Energy Director;

- моделирование полученных данных ЦОД в САПР Autodesk CFD.

Тестовый стенд состоит из двух серверных стоек 42U. В стойках размещены коммутаторы Arista DCS-7050T, серверы Dell PowerEdge R540 и серверы Dell PowerEdge R240 на базе Intel Xeon E-2200. Схема расположения оборудования в стойках представлена на рисунке 1.

Был проведен анализ имитационной модели со случайным распределением вычислительной нагрузки без применения каких-либо методов повышения энергоэффективности ЦОД. После чего проводился анализ с последовательным применением каждого из методов:

- консолидации нагрузки;

- балансировки вычислительной нагрузки;

- использования кондиционеров с частотно-регулируемым приводом.

В таблице 1 отображен результат применения метода консолидированного распределения вычислительной нагрузки. Указана средняя мощность (указано за год). Температура усредняется по 14 блокам CRAC.

Данные, собранные в ходе нагрузочного тестирования, были использованы для создания имитационной модели машинного зала, состоящего из:

- 300 серверных стоек 42U;

- 15 блоков распределения питания (Power Distribution Unit, PDU PDU).

- 14 блоков кондиционирования воздуха в серверных помещениях (Computer Room Air Conditioner, CRAC).

Схема машинного зала представлена на рисунке 2. Имитационная модель построена на архитектуре центра обработки данных с чередующимися горячими и холодными коридорами [3].

Полученные данные использовались для оптимизации распределения вычислительной нагрузки на основе телеметрии вычислительной платформы. Затем полученные данные были применены к имитационной модели, которая состоит из методов вычислительной гидродинамики (Computational Fluid Dynamics, CFD) для оценки влияния оптимизации распределения вычислительной нагрузки на энергопотребление и тепловыделение центра обработки данных в среде Autodesk CFD.

Метод консолидации вычислительной нагрузки значительно повлиял на общее потребление мощности и количество серверов. Благодаря консолидации нагрузки удалось освободить примерно 24 серверные стойки.

После этого к модели, оптимизированной при помощи метода консолидации нагрузки, был применен метод балансировки вычислительной нагрузки (UOP), чтобы уменьшить количество горячих и холодных точек в машинном зале.

missing image file

Рис. 1. Схема тестового стенда, используемого для сбора данных

missing image file

Рис. 2. Схема машинного зала, используемого для исследования

Таблица 1

Сравнение результатов моделирования при случайном распределении нагрузки и при консолидированном распределении нагрузки

Показатель

Случайное распределение нагрузки

Консолидированное распределение нагрузки

Общая мощность (МВт·ч/год)

10,643

10,340

Мощность системы охлаждения (МВт·ч/год)

3,622

3,608

Мощность ИТ-оборудования (МВт·ч/год)

5,517

5,253

Температура холодного коридора (°C)

23

22

Поток охлаждающего воздуха (м3/час)

240,167

240,154

Активные серверы (шт.)

3,704

2,701

Среднее значение IOPS (106·с-1)

2,824

2,744

Таблица 2

Сравнение результатов моделирования при консолидированном распределении нагрузки и при балансировке нагрузки после консолидации

Показатель

Консолидированное распределение нагрузки

Балансировка нагрузки после консолидации

Общая мощность (МВт·ч/год)

10,340

10,188

Мощность системы охлаждения (МВт·ч/год)

3,608

3,601

Мощность ИТ-оборудования (МВт·ч/год)

5,253

5,120

Температура холодного коридора (°C)

22

23

Поток охлаждающего воздуха (м3/час)

240,154

246,161

Активные серверы (шт.)

2,701

2,701

Среднее значение IOPS (106·с-1)

2,744

3,191

Таблица 3

Сравнение результатов моделирования при балансировке нагрузки после консолидации и при использовании кондиционеров с VFD

Показатель

Балансировка нагрузки после консолидации

Применение кондиционеров с VFD

Общая мощность (МВт·ч/год)

10,188

8,794

Мощность системы охлаждения (МВт·ч/год)

3,601

2,810

Мощность ИТ-оборудования (МВт·ч/год)

5,120

5,121

Температура холодного коридора (°C)

23

25

Поток охлаждающего воздуха (м3/час)

246,161

154,113

Активные серверы (шт.)

2,701

2,701

Среднее значение IOPS (106·с-1)

3,191

3,183

В таблице 2 отображен результат применения метода балансировки вычислительной нагрузки после применения метода консолидированного распределения вычислительной нагрузки.

Таблица 2 не показывает существенного изменения энергопотребления. Однако достигнуто повышение производительности вычислительного оборудования по показателю IOPS.

Основным преимуществом балансировки вычислительной нагрузки является устранение горячих и холодных точек в машинном зале. Равномерность тепловыделения в машинном зале позволяет использовать кондиционеры с частотно-регулируемым приводом [4].

В таблице 3 отображен результат применения в блоках CRAC кондиционеров с частотно-регулируемым приводом.

Таблица 4

Результаты оптимизации

Этапы

Оптимизированный ресурс

Результат оптимизации

Этап 1. Консолидированное распределение нагрузки

Пространство

Освобождение 8% стоек

Этап 2. Балансировка нагрузки

Производительность серверов

Увеличение производительности на 16%

Этап 3. Применение кондиционеров с VFD

Энергопотребление

Уменьшение энергопотребления системой охлаждения на 22%

missing image file

Рис. 3. Энергопотребление неоптимизированного и оптимизированного ЦОД

Таблица 3 демонстрирует существенное изменение использования ресурсов ЦОД в первую очередь за счет снижения энергопотребления системы охлаждения. Это изменение связано с применением метода UOP и кондиционеров с VFD.

Результаты исследования и их обсуждение

Оптимизация центров обработки данных – это поиск нерационально использующихся ресурсов. Основные результаты, достигнутые путем поэтапного применения трех методов оптимизации:

- уменьшилось количество активных серверов;

- увеличилась производительность активных серверов;

- уменьшилось энергопотребление системы охлаждения.

Достигнутые результаты представлены в таблице 4.

На рисунке 3 представлено энергопотребление в центре обработки данных до применения методов оптимизации и после трех этапов оптимизации. Разница энергопотребления составила 22%.

Основным показателем энергоэффективности центра обработки данных является PUE [2]:

PUE = EDC / EIT.

В результате применения методов оптимизации PUE моделируемого центра обработки данных улучшился с 1,93 до 1,71 [2].

Необходимо учитывать ряд ограничений при использовании представленного анализа методов повышения энергоэффективности на примере имитационной модели:

- имитационная модель построена на архитектуре центра обработки данных с чередующимися горячими и холодными коридорами [3];

- практические результаты будут зависеть от ряда условий, в первую очередь от архитектуры ЦОД и моделей вычислительного оборудования;

- для использования данных телеметрии с вычислительного оборудования необходим интерфейс IPMI (он есть на большинстве современных серверных платформ);

- использование кондиционеров с частотно-регулируемым приводом подразумевает аппаратную модификацию блоков CRAC;

- методы консолидации вычислительной нагрузки и балансировка вычислительной нагрузки в среде виртуализации подразумевают под собой миграцию виртуальных машин, которая может вызвать деградацию производительности [5].

Заключение

Результаты оценки эффективности методов оптимизации, полученные в итоге имитационного моделирования, могут применяться в центрах обработки данных. Использование телеметрии, полученной через интерфейсы IPMI, позволяют эффективно управлять нагрузкой на вычислительное оборудование и системами охлаждения. Важно отметить, что практические результаты будут зависеть от ряда условий. В первую очередь от архитектуры ЦОД и моделей вычислительного оборудования ЦОД.