Научный журнал
Современные наукоемкие технологии
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,899

ПЕРСПЕКТИВЫ РАЗВИТИЯ АППАРАТНОЙ ПЛАТФОРМЫ КОМПЬЮТЕРОВ

Коваленко С.М. 1 Романов А.М. 1 Петушков Г.В. 1
1 ФГБОУ ВО «МИРЭА – Российский технологический университет»
В работе рассмотрены перспективы развития аппаратной платформы компьютеров в целях наращивания производительности современных компьютерных средств. Наращивание производительности компьютерных средств может осуществляться за счет совершенствования элементной базы компьютеров и за счет наращивания числа вычислительных модулей на основе микропроцессоров в вычислительной системе. В работе рассматриваются оба направления. В частности, рассматриваются проблемы перехода к памяти на мемристорах и замены медных проводников на фотонику для соединения процессоров с памятью. Использование мемристоров позволит серьезно улучшить характеристики памяти компьютеров по быстродействию и сделать большую ее часть энергонезависимой. Увеличение числа ядер в применяемых микропроцессорах повышает их производительность при обработке данных, однако требует сетевых средств для объединения ядер в систему на кристалле. Использование фотоники в соединениях не только повышает скорость передачи информации, но и позволяет эффективно наращивать число модулей в высокопроизводительных системах. В работе рассмотрены перспективы квантовых вычислительных систем, описаны наиболее известные проекты по развитию квантовых вычислений и приведены ожидаемые технические характеристики для подобных систем. Выбор оптимального числа модулей зависит как от производительности самих модулей, так и от скоростей передачи информации между ними. В работе приведены оценки оптимального числа модулей в высокопроизводительной вычислительной системе для вариантов выполнения межмодульных связей проводом и оптическими соединителями. Переход на оптические соединители упрощает масштабирование высокопроизводительных микропроцессорных вычислительных систем.
память компьютера
микропроцессоры
оптические соединения
структура многопроцессорных систем
производительность вычислений
масштабирование высокопроизводительных систем
1. Кирк Б., Шарад С., Стенли В. Как преуспеть в условиях экономики изобилия памяти? // Открытые системы. СУБД. 2016. № 2. С. 25–32.
2. Черняк Л. The Machine будущее сегодня // Открытые системы. СУБД. 2014. № 6. URL: http://www.osp.ru/os/2014/06/13042318 (дата обращения: 22.10.2018).
3. Горшечников А., Чандлер Б., Снайдер Г., Левейль Д., Картер Д., Версаче М., Мухаммад Шакил Куреши, Эмерсон Р., Эймс Х., Хишам Абдалла, Шон Патрик, Эннио Минголла. Применение мемристоров для создания электронного мозга // Открытые системы. СУБД. 2011. № 3. С. 48–53.
4. Гоц Р. Escala двадцать лет спустя // Открытые системы. СУБД. 2016. № 4. С. 44–51.
5. Лилитко Е. Есть ли жизнь после закона Мура // Суперкомпьютеры. 2014. № 3. С. 47–51.
6. Черняк Л. Шесть лет из жизни серверов на ARM // Суперкомпьютеры. 2014. № 3. С. 14–15.
7. 1000-ядерный процессор [Электронный ресурс]. URL: http://www.cnews.ru/news/top/2016-06-20 (дата обращения: 22.10.2018).
8. Кроссбар-архитектура, исследуемая компанией HP [Электронный ресурс]. URL: http://www.cnews.ru/news/top/2016-03-16 (дата обращения: 22.10.2018).
9. Google D-Wave [Электронный ресурс]. URL: http://www.geektimes.ru/post/2894916 (дата обращения: 22.10.2018).
10. Коваленко С.М. О влиянии характеристик сети передачи данных на организацию работы параллельных вычислительных систем // Вестник МГТУ МИРЭА. Электронный журнал. 2014. № 2. С. 49–52.

Развитие информационных технологий требует постоянного наращивания производительности современных компьютерных средств, поскольку на повестку дня ставятся все более сложные задачи в таких областях, как наука, управление, разработка новых систем средствами САПР. Наращивание производительности компьютерных средств может осуществляться за счет совершенствования элементной базы компьютеров и за счет наращивания числа вычислительных модулей на основе микропроцессоров в высокопроизводительной вычислительной системе. Наращивание числа вычислительных модулей должно производиться с учетом соответствующего роста «накладных» расходов на передачу данных между модулями. В работе рассматриваются оба подхода и устанавливается, что для получения эффекта роста производительности эти подходы надо использовать в комплексе.

Целью исследования является установление того, насколько может повыситься производительность вычислительных систем при использовании новой элементной базы в виде мемристоров в памяти компьютеров, насколько уменьшатся «накладные» расходы на передачу данных при использовании высокоскоростных оптических соединителей, и того, как можно изменить структуру высокопроизводительной вычислительной системы при использовании новых оптических соединителей и многоядерных микропроцессоров для повышения производительности и улучшения масштабирования вычислительной системы.

Материалы и методы исследования

Технологии памяти последние годы развивались «в тени» технологий микропроцессоров (МП). Главной идеей «перезагрузки» мира вычислений исследователи из фирмы Hewlett-Packard (НР) предлагают сделать преобразование памяти компьютеров. Изменение иерархии запоминающих устройств (ЗУ), наращивание их объемов позволит, по их мнению, вывести на новый уровень производительность вычислений [1, 2].

В целом инициатива «TheMachine» фирмы НР включает три основных компонента: первое – переход от нынешней иерархии компьютерной памяти (кэш-память, оперативная память, диски) к памяти на мемристорах; второе – замена медных проводников на фотонику для соединения МП с оперативным ЗУ; третье – использование набора специализированных устройств в чипе МП наряду с универсальными процессорами.

В исследовательской лаборатории HP Labs выполнено множество работ, причем к числу наиболее важных относятся работы, связанные с мемристорами [3]. Память на мемристорах представляет из себя энергонезависимое устройство, способное хранить большие объемы данных и работающее со скоростью оперативного ЗУ. В основе мемристоров лежит уникальное свойство диоксида титана – электрическим сопротивлением этого полупроводника можно управлять за счет подачи тока разного направления. В результате в материале полупроводника возникает эффект гистерезиса (аналогичный магнитному гистерезису), необходимый для сохранения двух устойчивых состояний (хранение единицы и нуля). Размеры мемристора составляют несколько нанометров, а скорость срабатывания измеряется наносекундами. Исследователи фирмы НР сообщают о том, что принципиально решили технологические проблемы создания мемристоров с воспроизводимыми свойствами.

Вероятно, что компьютеры, разрабатываемые в проектах «TheMachine», сохранят кэш-память МП, расположенную на кристалле МП [1], но главное то, что разрабатываемое ЗУ на мемристорах позволит отказаться от остальных уровней памяти, заменив их быстрым оперативным ЗУ большого объема на мемристорах. Кроме таких очевидных преимуществ, как возможность ускорить доступ к данным и неограниченное масштабирование, мемристоры позволят заметно сократить энергопотребление. В современных системах ЗУ большая часть энергии уходит не на обработку, а на перемещение данных между уровнями памяти, тогда как ЗУ на мемристорах снизит эти потери.

Что касается второго направления инициативы: в 2006 г. корпорация Intel продемонстрировала кремниевый лазер, объединяющий излучение и распространение света по кремниевому волноводу. Оптические каналы обладают большей пропускной способностью, чем существующие медные, а теоретический предел скорости передачи данных по оптоволокну оценивается в 10 ТБ/с (Б – байт). Исследователями HP Labs сообщалось о создании оптической шины с пропускной способностью 1 ТБ/с. Для реализации технологии полупроводниковой фотоники необходимы несколько основных компонентов на основе лазера. Все принципиальные проблемы в этой области решены.

Третий компонент инициативы можно рассматривать как МП, собираемый из универсальных ядер и ядер специального назначения. Такой вариант называют гетерогенными компьютерными структурами. Вначале обращение к гетерогенным структурам казалось способом ускорить параллельные вычисления за счет использования потенциала графических процессоров. Вскоре стало ясно, что это направление перспективно во многих применениях. Ведущие производители МП развивают гетерогенные структуры на процессорном уровне: NVIDIA в проекте Project GPU; AMD в микропроцессоре Kaveri, МП производства IBM Power8 имеет в ядре два арифметических устройства (АУ) для выполнения операций с фиксированной точкой, АУ для операций с плавающей точкой, 2 АУ для выполнения векторных операций и еще одно АУ – для криптографических операций [4].

Инициатива «TheMachine» в целом делает память сердцем компьютера. Концепцию компьютерной системы, стержнем которой является память, называют Memory Driven Computing (MDC) [1]. Операционные системы общего назначения можно адаптировать к новой среде, насыщенной быстрой памятью. Например, это будет ОС Linux, провести быструю трансформацию которой позволит динамичное сообщество разработчиков. Как MDC изменит компьютерные приложения? Благодаря меньшей задержке доступа и увеличенной пропускной способности памяти нового типа, разработчики смогут добиться повышения производительности систем. Это даст возможность ставить и решать новые задачи по обработке данных. Например, «умная» видеокамера, содержащая алгоритмы машинного обучения, может записывать видеопоток высокого разрешения в память, сохраняя недели и месяцы съемки видео в полном качестве и одновременно создавая шаблоны распознавания лиц.

Основным направлением развития современных высокопроизводительных микропроцессоров (МП) по-прежнему остается наращивание числа ядер на кристалле микропроцессора. Фирма Intel в своих процессорах XeonPhi использует на кристалле до 60 ядер, работающих на частоте 1,1 ГГц [5, 6]. В середине 2016 г. исследователи из Калифорнийского университета в Дейвисе представили 1000-ядерный процессор KiloCore [7]. При изготовлении МП корпорация IBM использовала 32-нм технологический процесс. Каждое ядро процессора может работать самостоятельно и выполнять свою микропрограмму. Каждое ядро работает на своей собственной тактовой частоте и может быть отключено для экономии энергии. Максимальная тактовая частота ядер ограничена значением 1,78 ГГц. Проблемой для таких многоядерных кристаллов является обмен информацией между ядрами. Использовать общую память на кристалле в виде кэша 2 или 3 уровня невыгодно, поскольку общая память становится узким горлышком при обработке данных. В предыдущих разработках фирмы IBM, процессорах серии Cell, для обмена данными между процессорами на кристалле использовались сетевые средства на основе сети TokenRing, замыкавшие в кольцо связи между ядрами процессора (рис. 1).

koval1.tif

Рис. 1. Кольцо связи между ядрами процессора

Таким образом сети пришли уже на уровень отдельного кристалла.

Компания Hewlett-Packard разрабатывает прототип процессора, основанного на элементах, выполняемых по структуре, получившей название «кроссбар» [8].

Кроссбар структура представляет собой набор параллельных проводников шириной около 50 нм, которые пересекаются другим набором таких же проводников (рис. 2).

koval2.tif

Рис. 2. Кроссбар структура, исследуемая компанией Hewlett-Packard

Между ними находятся прокладки из материала (мономолекулярное соединение), который под действием приложенного напряжения может изменять свою проводимость. Регулярная структура из проводников делает их изготовление достаточно простым. В местах пересечения проводников формируются структуры, аналогичные интегральным транзисторам, на основе чего можно создавать МП по уже освоенным архитектурам.

Помимо этих разработок, ученые-физики предлагают производителям аппаратной и программной платформ перейти на выпуск совершенно новых устройств – программируемых квантовых процессоров.

Состав квантового процессора сводится к набору элементов, которые под воздействием управляющих электродов и волноводов способны принимать взаимозависимые квантовые состояния. В технологии производства такие устройства не требуют дополнительных ресурсов, поскольку, как и большинство современных процессоров, они создаются на основе кремния. Работы по созданию квантовых систем ведутся уже достаточно давно. Преимуществом квантовых компьютеров является высокая скорость обработки информации для определенных классов задач, которая позволит им решать задачи, непосильные для классических компьютеров.

В 2017 г. команда Google заявила, что планирует разработать квантовый чип, который сможет обогнать по скорости вычислений существующие компьютеры [9]. Google уже опубликовала отчет об использовании чипа с 9 кубитами, выстроенными линейно. Цель команды Google – создать массив из 49 кубитов для проведения эксперимента. Такое количество позволит достигнуть так называемого квантового превосходства, когда ни один классический компьютер не сможет сравниться с квантовым по мощности вычислений.

В 2014 г. в мире уже существовал компьютер D-Wave, который в том числе приобрели и в Google. Однако такую систему нельзя считать полноценным квантовым компьютером. У D-Wave было 512 кубитов, которые не были связаны между собой.

В 2017 г. появлялись сообщения о других группах и компаниях, получивших результаты в создании квантового компьютера. В частности, о создании 50-кубитного квантового компьютера сообщила фирма IBM. Однако подробной информации о своих разработках они не раскрывают. Компания Intel сообщила о разработке первого экспериментального 17-кубитного квантового чипа. Основной целью новых исследований станет поиск метода коррекции ошибок в коде для квантового кристалла. Новый метод коррекции ошибок поможет не только улучшению существующего 17-кубитного процессора Intel, но и сделает возможным расширение возможностей квантовых вычислительных систем. Кроме того, Intel применила ряд инноваций в архитектуре. Основной отличительной чертой чипа является метод «укладки» кубитов.

Самой главной проблемой сверхпроводящих кубитов является их структура и взаимное расположение. Они весьма чувствительны к помехам в виде электромагнитных волн, а влияние этих помех можно устранить благодаря правильному их взаимному расположению. Сами кубиты работают при температуре 20 милликельвинов, что уже является экстремальными условиями для полупроводниковых чипов. Кроме того, Intel применила технологию «перевернутого кристалла», что улучшает работу чипа в условиях сверхнизких температур. По заявлению Intel, в теории компания может создать чип с миллионом кубитов, однако, еще нет надежных и эффективных технологий управления ими в таком количестве.

Увеличится эффективность высокопроизводительных вычислений (HPC) для задач, выполняемых на многопроцессорных системах при алгоритмах, имеющих сильные связи по данным. Одним из авторов работы проводилось исследование влияния характеристик сети передачи данных на организацию работы параллельных вычислительных систем [10]. В упоминаемой работе получено выражение для оценки оптимального значения числа вычислительных модулей (ВМ) в многопроцессорной вычислительной системе, в которой выполняется расчетная задача, имеющая сильные связи по данным, т.е. требующая сравнительно больших объемов обменов данных между отдельными ВМ, выполненными на основе МП и блоков локальной оперативной памяти. Структура вычислительной системы, состоящей из набора ВМ, объединенных сетью связи, приведена на рис. 3.

koval3.tif

Рис. 3. ВС, состоящая из набора ВМ, объединенных сетью

В работе [8] получено, что оптимальное значение числа ВМ K, определяющее минимальное время выполнения программы, прямо пропорционально корню квадратному значения скорости передачи данных V, обеспечиваемому в сети передачи данных вычислительной системы. Для значений V = 1 Гбайт/с, значения К для современных вычислительных систем получены в интервале 1–10 ВМ [9]. Использование оптической шины со скоростью передачи информации V = 1 Тбайт/св сети передачи данных поднимет оптимальное число ВМ более чем в 30 раз (33–330 ВМ), что сильно увеличивает эффективность работы многопроцессорной и многомодульной вычислительной системы.

Результаты исследования и их обсуждение

Приведенный пример показывает, что эффективность работы аппаратной платформы компьютеров и систем может быть серьезно увеличена при использовании перспективных решений как в области разработки памяти компьютера, так и в области совершенствования сети передачи данных вычислительной системы. Совершенствование сети передачи данных позволяет снизить «накладные» расходы на передачу данных и более эффективно проводить масштабирование высокопроизводительных вычислительных систем.

Выводы

К основным выводам по данной работе можно отнести следующие положения:

1. В вычислительных системах на основе современных МП сети для объединения вычислителей в систему уже проникли на все уровни: на кристалле сети объединяют ядра, в ВМ сети объединяют МП в систему, на уровне вычислительной системы сетями объединяют ВМ. Снижение задержек в связях непосредственно влияет на повышение производительности систем, причем задержки в связях становятся более значимыми по мере роста числа ядер в МП и числа ВМ в вычислительной системе.

2. Снижение задержек в связях между ВМ позволяет более эффективно масштабировать вычислительные системы, поскольку рост числа ВМ в системе не ведет к существенному возрастанию «накладных» расходов на передачу данных.


Библиографическая ссылка

Коваленко С.М., Романов А.М., Петушков Г.В. ПЕРСПЕКТИВЫ РАЗВИТИЯ АППАРАТНОЙ ПЛАТФОРМЫ КОМПЬЮТЕРОВ // Современные наукоемкие технологии. – 2018. – № 12-1. – С. 67-70;
URL: https://top-technologies.ru/ru/article/view?id=37264 (дата обращения: 18.09.2021).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074