Skalowalne systemy przechowywania danych w DataCenter

Skalowalne systemy (scale-out) składowania danych to koncepcja tworzenia i rozbudowy przestrzeni dyskowej, zakładająca zwiększanie pojemności z jednoczesnym powiększaniem pojemności systemu przez dokładanie kolejnych bloków tworzących macierz. Każdy z bloków tworzących macierz posiada swoje zasoby procesorowe, pamięciowe oraz dyski i przyłącza wejścia/wyjścia, które są ze sobą połączone przy użyciu szerokopasmowych sieci o niskim opóźnieniu.  

Systemy typu scale-out są odpowiedzią na przyrost danych, pochodzących z najprzeróżniejszych źródeł, używających różnorodnych protokołów dostępu czy nieustrukturalizowanych formatów danych. Na przykład macierz plikowa powinna umożliwiać łatwą rozbudowę, automatyczne dostosowanie obciążenia do zmiennych warunków pracy oraz umożliwiać wymianę informacji pomiędzy różnorodnymi systemami. Przykładem takiej macierzy jest EMC Isilon – macierz, która dzięki unikatowemu systemowi plików OneFS umożliwia składowanie danych w ogromnych ilościach, przy użyciu różnorodnych protokołów dostępu – nfs, rest api, smb, fttp, http czy hdfs. Dzięki zastosowaniu takiego podejścia dzielenie się wiedzą i informacjami w organizacji staje się łatwiejsze – EMC definiuje takie rozwiązanie jako „Data Lake”. Jest to rezerwuar danych, który można dopasować w elastyczny sposób, przy jednoczesnym zachowaniu spójności i bezpieczeństwa przechowywanych informacji. Rozbudowa takiego systemu odbywa się przez dołączanie kolejnych elementów, które razem tworzą jeden ciągły system plików.              

Zarządzanie systemem odbywa się przy pomocy zarówno łatwego do opanowania graficznego interfejsu użytkownika lub przy użyciu rest api, który umożliwia zarówno integrację z innymi systemami (integracja zarządzania) jak i dostęp do danych składowanych na macierzy. Całość jest połączona przy użyciu sieci Infiniband, zapewniającej szybki transfer informacji pomiędzy węzłami klastra przy jednoczesnym zminimalizowaniu opóźnień wynikających z rozproszonej architektury systemu.

Macierz Isilon, produkcji EMC jest świetnym przykładem skalowalnego systemu przechowywania plikowego. Nie oznacza to faktu, iż nie istnieją blokowe systemy przechowywania informacji. Sztandarowym przykładem skalowalnej macierzy blokowej jest XtremIO – wysokowydajnej, automatycznie strojącej się macierzy dyskowej wykorzystującej wyłącznie dyski flash.

EMC XtremIO to innowacyjna koncepcja zapisu danych na dyskach półprzewodnikowych, których konstrukcja i sposób wykorzystania jest inny, niż zwykłych dysków obrotowych. Pod uwagę należy wziąć przede wszystkim sposób kasowania danych – przy użyciu stron – jak i brak opóźnień związanych z obracającym się dyskiem.            

Macierz XtremIO wykorzystuje unikalny sposób organizacji danych na dyskach – przy użyciu zaawansowanych i zoptymalizowanych pod kątem pracy z dyskami SSD algorytmami deduplikacyjnymi i kompresją. Urządzenie analizuje przychodzące bloki danych i zapisuje wyłącznie unikalne porcje danych na dyskach jednocześnie przy równomiernym zapisie danych pomiędzy wszystkimi dostępnymi dyskami w macierzy.   

XtremIO zbudowane jest z użyciem bloków, zwanych X-Brick. W każdym z takich bloków znajduje się półka dyskowa, dwa kontrolery wyposażone oparte o otwarty system operacyjny Linux oraz zestaw baterii podtrzymujących pamięć kontrolerów. Każdy z kontrolerów jest wyposażony w przyłącza FC, iSCSI, RDMA do komunikcji wewnątrz X-Brick oraz Infiniband do realizacji połączeń w ramach macierzy. Rozbudowa zarówno pojemności jak i wydajności odbywa się przez dodanie kolejnego modułu i podłączenie go do infrastruktury. Dane zostają automatycznie rozlokowane tak, aby maksymalnie zwiększyć wielościeżkowość dostępu, zarówno po stronie dysków jak i po stronie przyłączy. Taka konstrukcja macierzy umożliwia osiąganie wysokiej wydajności przy jednoczesnym przewidywalnym czasie odpowiedzi i zwiększonym czasie życia dysków SSD.

Jednym z aspektów, które piszący te słowa bardzo docenia w skalowalnych systemach przechowywania danych jest ich modularność. S4E często wypożycza sprzęt do różnorodnych testów – trzeba przyznać, iż logistyka kilku standardowych pudełek EMC Isilon (2U wysokości) jest zdecydowanie łatwiejsza niż jednego dużego pudła z klasyczną macierzą Unified. 

Autor: 

Krzysztof Sprawnik

Dell EMC solution architect

+48 785 055 453

Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.