XtremIO X2: выгода новой архитектуры NVRAM

В этой заметке — о том, как XtremIO X2  стал компактнее, проще в эксплуатации, надежнее и эффективнее благодаря новой архитектуре NVRAM.

Если вы еще не знаете что такое XtremIO — вам сюда или сюда.

Если знаете — читайте дальше.

Защита оперативного журнала XtremIO X2, рабочий экземпляр которого находится DRAM,  организована при помощи синхронной копии на энергонезависимой карточки (NVRAM),  установленной в каждом контроллере.

Журнал в оперативной памяти нужен для того, чтобы все дата-сервисы, такие как дедупликация, компрессия и формирование XDP страйпов осуществлялись именно на лету, т.е. до того, как данные будут записаны на флэш-модули. Важно отметить, кстати, что NVRAM используется только для удержания и безопасного сохранения синхронной копии. Вся обработка данных журнала происходит именно в оперативной памяти, т.е. с наименьшим возможным временем отклика.

NVRAM это PCIe карточка, которая содержит 16ГБ DRAM для синхронной копии журнала и 32ГБ флэша для сохранения в случае сбоя питания.

Защита памяти от сбоя питания обеспечена отдельно устанавливаемым суперконденсатором, тоже в каждом контроллере.

3 NVRAM

 

Сделано именно так, чтобы можно было держать в NVRAM синхронную копию журнала без ухудшения времени отклика хоста. Время отклика флэша на запись существенно выше, чем у DRAM.

Журнал каждого контроллера XtremIO зеркалируется в свой NVRAM и в NVRAM другого контроллера. Передача данных в другой контроллер выполняется через RDMA вызов по Infiniband, после чего хосту отправляется подтверждение, что запись прошла успешна.

Сам флэш в NVRAM используется только во время сбоя питания. Ему совершенно незачем быть постоянно перезаписываемым, пока питание в норме.

В обычное время от него ничего не требуется, кроме того, чтобы быть постоянно готовым. Для этого флэш NVRAM тщательно проверяется, включая еженедельное полное сканирование.

Почему нельзя просто зеркалировать данные контроллерами без NVRAM? Потому что не будет защиты от полного сбоя питания.

Почему нельзя зеркалировать журнал только в 1 NVRAM? Потому что при отказе этого NVRAM не будет защиты от полного сбоя питания. К тому же, раз он в каждом контроллере все равно стоит – можно же поставить немного больше памяти в каждый, пусть зеркалируют друг дружке. Надежней многократно.

По сравнению с XtremIO X1 получились более самодостаточные и полностью защищенные контроллеры, которые могут друг друга резервировать даже в рамках одного X-Brick.

В случае сбоя NVRAM карточки контроллер остается работоспособным, но на нем перестает вестись оперативный журнал. Он содержит только зеркальную копию своего партнера. Таким образом, кластер XtremIO X2 остается работоспособным при отказе до 50% NVRAM карт.

В чем принципиальная разница с X1?

Многие наверняка помнят, что в кластерах XtremIO первого поколения брики зеркалировали память друг друга, а защита по питанию осуществлялась при помощи выделенных ИБП на каждую пару контроллеров. При сбое питания журнал из памяти записывался на выделенные SSD в каждом контроллере.

 

Зеркалирование журналов (кроме однобрикового клсастера) делалось именно между разными бриками, защищенными, соответственно, разными ИБП.

Это было надежно, но накладывало определенные ограничения на масштабирование кластера – он мог состоять только из четного количества бриков (не считая первого). Т.е. 1, 2, 4, 6 и 8.

В X2 это ограничение снято именно потому, что контроллерам теперь не нужно зеркалировать журналы между бриками, а они могут их зеркалировать в рамках своего брика без какого-либо риска.

Теперь организация питания кластера стала проще, а защита памяти — надежней.

Так благодаря новой архитектуре NVRAM XtremIO X2  стал

  • Компактнее – не требует место в стойке под ИБП
  • Проще в эксплуатации – нет лишних проводов ИБП
  • Надежнее – суперконденсаторы более долговечны
  • Эффективнее — может содержать нечетные количества бриков

 

И это еще не все, поскольку отвязав сохранение журнала от флэш-дисков и возложив эту задачу на NVRAM c суперконденсатором, разработчики по ходу дела решили еще одну интересную техническую задачу. Но об этом в следующей заметке. Следите за новостями.

Оставьте комментарий