Единна система за съхранение на данни. Системи за съхранение на Intel

Единна система за съхранение на данни.  Системи за съхранение на Intel
Единна система за съхранение на данни. Системи за съхранение на Intel

С ежедневната сложност на мрежовите компютърни системи и глобалните корпоративни решения, светът започна да изисква технологии, които да дадат тласък на ренесанса корпоративни системиСъхранение на информация (системи за съхранение). И така, една единствена технология носи в световната съкровищница от напредък в съхранението безпрецедентна скорост, огромна мащабируемост и изключителни ползи от общата цена на притежание. Обстоятелствата, които се оформиха с появата на стандарта FC-AL (Fibre Channel - Arbitrated Loop) и SAN (Storage Area Network), която се развива на негова основа, обещават революция в компютърните технологии, ориентирани към данни.

„Най-значимото развитие в съхранението, което сме виждали от 15 години“

Data Communications International, 21 март 1998 г

Официалната дефиниция на SAN в тълкуването на Асоциацията на индустрията за мрежи за съхранение (SNIA):

„Мрежа, чиято основна задача е да прехвърля данни между компютърни системи и устройства за съхранение на данни, както и между самите системи за съхранение. SAN се състои от комуникационна инфраструктура, която осигурява физическа връзка, и също така отговаря за нивото на управление (управленски слой), който съчетава комуникации, съхранение и компютърни системипрехвърляне на данни безопасно и сигурно."

Технически речник SNIA, авторско право Storage Network Industry Association, 2000

Опции за организиране на достъп до системи за съхранение

Има три основни опции за организиране на достъп до системи за съхранение:

  • SAS (Server Attached Storage), съхранение, прикрепено към сървъра;
  • NAS (Network Attached Storage), съхранение, свързано към мрежата;
  • SAN (Storage Area Network), мрежа за съхранение.

Разгледайте топологиите на съответните системи за съхранение и техните характеристики.

SAS

Система за съхранение, прикрепена към сървъра. Познатият, традиционен начин за свързване на система за съхранение към високоскоростен интерфейс в сървър, обикновено паралелен SCSI интерфейс.

Фигура 1. Сървърно прикрепено хранилище

Използването на отделен корпус за системата за съхранение в рамките на SAS топологията не е задължително.

Основното предимство на хранилището, свързано към сървъра, в сравнение с други опции е ниска ценаи висока производителност в размер на едно хранилище за един сървър. Такава топология е най-оптималната в случай на използване на един сървър, чрез който се организира достъпът до масива от данни. Но тя все още има редица проблеми, които накараха дизайнерите да търсят други възможности за организиране на достъп до системи за съхранение на данни.

Характеристиките на SAS включват:

  • Достъпът до данни зависи от операционната система и файловата система (като цяло);
  • Сложността на организирането на системи с висока наличност;
  • Ниска цена;
  • Висока производителност в рамките на един възел;
  • Намалена скорост на отговор при зареждане на сървър, който обслужва съхранение.

NAS

Система за съхранение, свързана към мрежата. Този вариант на организация на достъпа се появи сравнително наскоро. Основното му предимство е удобството за интегриране на допълнителна система за съхранение в съществуващи мрежи, но само по себе си не носи никакви радикални подобрения в архитектурата за съхранение. Всъщност NAS е чист файлов сървър и днес можете да намерите много нови реализации на NAS тип съхранение, базирано на технологията Thin Server.


Фигура 2. Мрежово съхранение.

Характеристики на NAS:

  • Специализиран файлов сървър;
  • Достъпът до данни е независим от операционната система и платформата;
  • Лекота на администриране;
  • Максимална лекота на монтаж;
  • Ниска скалируемост;
  • Конфликт с LAN/WAN трафик.

Съхранение, изградено чрез NAS технология, е идеална опция за евтини сървъри с минимален набор от функции.

SAN

Мрежите за съхранение започват да се развиват интензивно и се въвеждат едва от 1999 г. Основата на SAN е мрежа, отделна от LAN/WAN, която служи за организиране на достъпа до данни от сървъри и работни станции, участващи в тяхната директна обработка. Тази мрежа е базирана на стандарта Fibre Channel, който дава на системите за съхранение предимствата на LAN / WAN технологиите и способността да организират стандартни платформи за системи с висока наличност и голямо търсене. Почти единственият недостатък на SAN днес е относително високата цена на компонентите, но общата цена на притежание за корпоративни системи, изградени с помощта на SAN технология, е доста ниска.


Фигура 3. Мрежа за съхранение.

Основните предимства на SAN включват почти всички негови характеристики:

  • Независимост на SAN топология от системи за съхранение и сървъри;
  • Удобно централизирано управление;
  • Няма конфликт с LAN/WAN трафик;
  • Удобно архивиране на данни без натоварване на локалната мрежа и сървъри;
  • Висока производителност;
  • Висока мащабируемост;
  • Висока гъвкавост;
  • Висока наличност и устойчивост на грешки.

Трябва също да се отбележи, че тази технология е все още доста млада и в близко бъдеще трябва да претърпи много подобрения в областта на стандартизацията на управлението и методите за взаимодействие между SAN подмрежи. Но може да се надяваме, че това само заплашва пионерите с допълнителни перспективи за шампионата.

FC като основа за изграждане на SAN

Подобно на LAN, SAN може да бъде създаден с помощта на различни топологии и медии. При изграждането на SAN може да се използва както паралелен SCSI интерфейс, така и Fibre Channel или, да речем, SCI (Scalable Coherent Interface), но Fibre Channel дължи своята все по-голяма популярност на SAN. В дизайна на този интерфейс участваха специалисти със значителен опит в разработването на двата канала и мрежови интерфейси, и те успяха да комбинират всички важни положителни характеристики на двете технологии, за да получат нещо наистина революционно ново. Какво точно?

Основен Основни функцииканал:

  • Ниска латентност
  • високи скорости
  • Висока надеждност
  • Топология от точка до точка
  • Малки разстояния между възлите
  • Зависимост от платформа
и мрежови интерфейси:
  • Многоточкови топологии
  • дълги разстояния
  • Висока мащабируемост
  • Ниски скорости
  • Големи закъснения
обединени във Fibre Channel:
  • високи скорости
  • Независимост на протокола (0-3 нива)
  • дълги разстояния
  • Ниска латентност
  • Висока надеждност
  • Висока мащабируемост
  • Многоточкови топологии

Традиционно интерфейсите за съхранение (това, което се намира между хоста и устройствата за съхранение) са пречка за скоростта и растежа на съхранението. В същото време приложните задачи изискват значително увеличаване на хардуерния капацитет, което от своя страна води до необходимостта от увеличаване честотна лентаинтерфейси за комуникация със системи за съхранение. Именно проблемите с изграждането на гъвкав високоскоростен достъп до данни са тези, които Fibre Channel помага да се решат.

Стандартът Fibre Channel беше окончателно дефиниран през последните няколко години (от 1997 до 1999 г.), през които беше извършена огромна работа за хармонизиране на взаимодействието на производителите на различни компоненти и беше направено всичко необходимо за трансформиране на Fibre Channel от чисто концептуална технология в реални, които получиха подкрепа под формата на инсталации в лаборатории и компютърни центрове. През 1997 г. бяха проектирани първите търговски образци на основните компоненти за изграждане на FC-базирана SAN, като адаптери, хъбове, комутатори и мостове. Така още от 1998 г. FC се използва за търговски цели в бизнеса, в производството и в мащабни проекти за внедряване на системи, които са критични за откази.

Fibre Channel е отворен индустриален стандарт за високоскоростен сериен интерфейс. Осигурява връзка на сървъри и системи за съхранение на разстояние до 10 km (използвайки стандартно оборудване) със скорост 100 MB / s (на Cebit "2000 бяха представени мостри на продукти, които използват нов стандарт Fibre Channel при 200 MB/s на пръстен, а лабораторните реализации на новия стандарт вече работят при 400 MB/s, което е 800 MB/s при използване на двоен пръстен). (По времето на тази статия редица доставчици вече са започнали да доставят 200 MB/s FC NIC и комутатори.) Fibre Channel поддържа едновременно набор от стандартни протоколи (сред които TCP/IP и SCSI-3) на едно физическо средно, което потенциално опростява изграждането на мрежова инфраструктура, освен това предоставя възможности за намаляване на разходите за инсталиране и поддръжка. Използването на отделни подмрежи за LAN/WAN и SAN обаче има няколко предимства и е препоръчителната настройка по подразбиране.

Едно от най-важните предимства на Fibre Channel, заедно с параметрите на скоростта (които, между другото, не винаги са основните за потребителите на SAN и могат да бъдат реализирани с помощта на други технологии), е способността за работа на дълги разстояния и гъвкавостта на топологията , който влезе в новия стандарт от мрежови технологии. По този начин концепцията за изграждане на топология на мрежа за съхранение се основава на същите принципи като традиционните мрежи, обикновено базирани на хъбове и комутатори, които помагат за предотвратяване на спадове на скоростта с увеличаване на броя на възлите и създават възможности за удобно организиране на системи без единична точка на повреда.

За по-добро разбиране на предимствата и характеристиките на този интерфейс, представяме сравнителна характеристика FC и паралелен SCSI като таблица.

Таблица 1. Сравнение на Fibre Channel и паралелни SCSI технологии

Стандартът Fibre Channel предполага използването на различни топологии, като точка до точка (Point-to-Point), пръстен или FC-AL хъб (Loop или Hub FC-AL), опорен комутатор (Fabric / Switch) .

Топологията от точка до точка се използва за свързване на една система за съхранение към сървър.

Loop или Hub FC-AL - за свързване на множество устройства за съхранение към множество хостове. При организиране на двоен пръстен скоростта и устойчивостта на грешки на системата се увеличават.

Превключвателите се използват за осигуряване на максимална производителност и устойчивост на грешки за сложни, големи и разклонени системи.

Благодарение на гъвкавостта на мрежата, изключително важна функция е вградена в SAN – удобната възможност за изграждане на устойчиви на грешки системи.

Като предлага алтернативни решения за съхранение и възможност за комбиниране на множество хранилища за резервиране на хардуер, SAN помага за защита на устройствата и софтуерните системи от хардуерни повреди. За да демонстрираме, ще дадем пример за създаване на система с два възела без точки на отказ.


Фигура 4. Няма единична точка на отказ.

Изграждането на системи с три или повече възли се извършва чрез просто добавяне на допълнителни сървъри към FC мрежата и свързването им към двата хъба / комутатора).

Когато се използва FC, изграждането на устойчиви на грешки системи става прозрачно. Мрежовите канали както за съхранение, така и за локална мрежа могат да бъдат положени на базата на влакна (до 10 км или повече с помощта на усилватели на сигнала) като физически носител за FC, като същевременно се използва стандартно оборудване, което прави възможно значително намаляване на разходите за такова системи.

С възможността за достъп до всички компоненти на SAN от всяко място в SAN имаме изключително гъвкава мрежа за данни за управление. В същото време трябва да се отбележи, че SAN осигурява прозрачност (възможност да се виждат) всички компоненти до дискове в системите за съхранение. Тази функция подтикна производителите на компоненти да използват своя значителен опит в изграждането на LAN/WAN системи за управление, за да широки възможностиза наблюдение и управление във всички компоненти на SAN. Тези възможности включват наблюдение и управление на отделни възли, съхранение на компоненти, заграждения, мрежови устройстваи мрежови подструктури.

Системата за управление и мониторинг на SAN използва отворени стандарти като:

  • SCSI набор от команди
  • SCSI Enclosure Services (SES)
  • Технология за анализ и докладване на SCSI за самонаблюдение (S.M.A.R.T.)
  • SAF-TE (устойчиви на грешки кутии с достъп до SCSI)
  • Прост протокол за управление на мрежата (SNMP)
  • Уеб базирано корпоративно управление (WBEM)

Системите, изградени с помощта на SAN технологии, не само предоставят на администратора възможността да наблюдава развитието и състоянието на ресурсите за съхранение, но също така отварят възможности за наблюдение и контрол на трафика. С тези ресурси софтуерът за управление на SAN прилага най-ефективното планиране на съхранение и схеми за балансиране на натоварването за системни компоненти.

SAN са перфектно интегрирани в съществуващите информационни инфраструктури. Прилагането им не изисква никакви промени в вече съществуващи мрежи LAN и WAN, но само разширява възможностите съществуващи системи, освобождавайки ги от задачи, фокусирани върху преноса на големи количества данни. Освен това, когато интегрирате и администрирате SAN, е много важно ключовите елементи на мрежата да поддържат гореща смяна и инсталиране, с възможности за динамична конфигурация. Така администраторът може да добави този или онзи компонент или да го замени, без да изключва системата. И целият този процес на интегриране може да бъде визуално показан в графична системаУправление на SAN.

След като разгледахме горните предимства, можем да подчертаем редица ключови точки, които пряко засягат едно от основните предимства на Storage Area Network - общата цена на притежание (Total Cost Ownership).

Невероятната мащабируемост позволява на предприятие, което използва SAN, да инвестира в сървъри и съхранение, ако е необходимо. И също така спестете вашите инвестиции във вече инсталирано оборудване при смяна на технологични поколения. Всеки нов сървър ще има високоскоростен достъп до съхранение и всеки допълнителен гигабайт място за съхранение ще бъде достъпен за всички сървъри в подмрежата по команда на администратора.

Големите възможности за изграждане на устойчиви на грешки системи могат да донесат директни търговски ползи от минимизиране на времето за престой и спасяване на системата в случай на природно бедствие или някакъв друг катаклизъм.

Управляемостта на компонентите и прозрачността на системата осигуряват възможност за централно администриране на всички ресурси за съхранение, а това от своя страна значително намалява разходите за тяхната поддръжка, чиято цена по правило е повече от 50% от цената на оборудване.

Влияние на SAN върху приложенията

За да стане по-ясно на нашите читатели колко практични са технологиите, обсъждани в тази статия, ще дадем няколко примера за приложни проблеми, които биха били решени неефективно без използването на мрежи за съхранение, биха изисквали огромни финансови инвестиции или не биха били решени изобщо по стандартните методи.

Архивиране и възстановяване на данни

Използвайки традиционния SCSI интерфейс, потребителят се сблъсква с редица сложни проблеми при изграждането на системи за архивиране и възстановяване на данни, които могат много лесно да бъдат решени с помощта на SAN и FC технологии.

По този начин използването на мрежи за съхранение извежда решението на проблема с архивирането и възстановяването на ново ниво и предоставя възможност за архивиране няколко пъти по-бързо от преди, без да натоварва локалната мрежа и сървърите с работа по архивиране на данни.

Клъстериране на сървъри

Една от типичните задачи, за които SAN се използва ефективно, е групирането на сървъри. Тъй като един от ключовите моменти при организирането на високоскоростни клъстерни системи, които работят с данни, е достъпът до съхранение, с появата на SAN, изграждането на клъстери с множество възли на хардуерно ниво се решава чрез просто добавяне на сървър, свързан към SAN (това може да се направи без дори да се изключва системата, тъй като FC превключвателите поддържат горещо включване). С паралелен SCSI интерфейс, който има значително по-лоша свързаност и мащабируемост от FC, центрираните към данни клъстери биха били трудни за създаване с повече от два възела. Паралелните SCSI комутатори са много сложни и скъпи устройства, а за FC това е стандартен компонент. За да създадете клъстер, който няма да има нито една точка на повреда, е достатъчно да интегрирате огледален SAN в системата (технология DUAL Path).

В рамките на клъстерирането една от технологиите RAIS (Redundant Array of Inexpensive Servers) изглежда особено привлекателна за изграждане на мощни мащабируеми системи за интернет търговия и други видове задачи с повишени изисквания за мощност. Според Alistair A. Croll, съосновател на Networkshop Inc, използването на RAIS е доста ефективно: „Например, за $12 000-15 000 можете да купите около шест евтини едно-два процесорни (Pentium III) Linux/Apache сървъра. Мощността, мащабируемостта и устойчивостта на грешки на такава система ще бъдат значително по-високи от например един сървър с четири сокета, базиран на процесори Xeon, а цената е същата.

Едновременен видео достъп и споделяне на данни (едновременно поточно видео, споделяне на данни)

Представете си задача, когато трябва да редактирате видео на няколко (да кажем > 5) станции или просто да работите върху огромни данни. Ще ви отнеме няколко минути, за да прехвърлите файл от 100 GB през локалната мрежа и обща работанад него ще бъде много предизвикателна задача. Когато се използва SAN, всяка работна станция и мрежов сървър имат достъп до файл със скорост, еквивалентна на локален високоскоростен диск. Ако имате нужда от друга станция/сървър за обработка на данни, можете да я добавите към SAN, без да изключвате мрежата, като просто свържете станцията към SAN комутатора и й предоставите права за достъп до съхранение. Ако вече не сте доволни от скоростта на подсистемата за данни, можете просто да добавите още едно хранилище и да използвате технология за разпространение на данни (например RAID 0), за да получите двойно по-висока скорост.

Основни SAN компоненти

сряда

За свързване на компоненти в рамките на стандарта Fibre Channel се използват медни и оптични кабели. И двата вида кабели могат да се използват едновременно при изграждане на SAN. Преобразуването на интерфейса се извършва с помощта на GBIC (гигабитов интерфейсен конвертор) и MIA (медиен интерфейсен адаптер). И двата вида кабели днес осигуряват една и съща скорост на трансфер на данни. Меден кабел се използва за къси разстояния (до 30 метра), оптичен - както за къси разстояния, така и за разстояния до 10 км или повече. Използвайте многомодови и едномодови оптични кабели. Многомодовият кабел се използва за къси разстояния (до 2 км). Вътрешният диаметър на влакното на многомодов кабел е 62,5 или 50 микрона. За скорости на предаване от 100 Mb/s (200 Mb/s дуплекс) при използване на многомодово влакно дължината на кабела не трябва да надвишава 200 метра. Едномодовият кабел се използва за дълги разстояния. Дължината на такъв кабел е ограничена от мощността на лазера, използван в предавателя на сигнала. Едномодовото влакно има вътрешен диаметър от 7 или 9 микрона, което позволява преминаването на един лъч.

Конектори, адаптери

За свързване на медни кабели се използват конектори DB-9 или HSSD. HSSD се счита за по-надежден, но DB-9 се използва също толкова често, защото е по-прост и по-евтин. Стандартният (най-често срещаният) конектор за оптични кабели е SC конекторът, който осигурява висококачествена и ясна връзка. Многомодовите SC конектори се използват за нормална връзка, а едномодовите конектори за отдалечена връзка. Многопортовите адаптери използват микроконектори.

Най-често срещаните адаптери за FC шина PCI 64 бита. Също така се произвеждат много FC адаптери за S-BUS шината, за специализирана употребаналични са адаптери за MCA, EISA, GIO, HIO, PMC, Compact PCI. Най-популярните са еднопортови, има двупортови и четирипортови карти. На PCI адаптери, като правило, използвайте конектори DB-9, HSSD, SC. Също така често срещани са GBIC-базирани адаптери, които се доставят със или без GBIC модули. Fibre Channel адаптерите се различават по класовете, които поддържат, и по различни функции. За да разберем разликите, представяме сравнителна таблица на адаптерите, произведени от QLogic.

Fibre Channel Host Bus Adapter Family Chart
SANblade64 битаFCAL Publ. Pvt LoopFL портКлас 3F портклас 2точка до точкаIP/SCSIпълен дуплексЛента F.CPCI 1.0 Hot Plug SpecSolaris Dynamic ReconfigVIB2GB
Серия 210033 и 66MHz PCIххх
Серия 220033 и 66MHz PCIххххххххх
33MHz PCIхххххххххх
25MHZ Sbusххххххххх х
2300 серия66MHZ PCI/ 133MHZ PCI-Xххххххххх хх

Хъбове

Fibre Channel HUB (концентратори) се използват за свързване на възли към FC пръстена (FC Loop) и имат структура, подобна на Token Ring хъбовете. Тъй като прекъсването на пръстена може да доведе до повреда на мрежата, модерните FC хъбове използват портове за байпас на пръстена (байпасна верига на PBC-порт), които ви позволяват автоматично да отваряте / затваряте пръстена (свързвате / изключвате системи, свързани към хъба). Обикновено FC HUB поддържат до 10 връзки и могат да подреждат до 127 порта на пръстен. Всички устройства, свързани към HUB, получават обща честотна лента, която могат да споделят помежду си.

Превключватели

Превключвателите на Fibre Channel (превключватели) имат същите функции като познатите на читателя LAN превключватели. Те осигуряват пълна скорост, неблокираща свързаност между възлите. Всеки възел, свързан към FC комутатора, получава пълна (с мащабируемост) честотна лента. Тъй като броят на портовете в комутираната мрежа се увеличава, пропускателната способност се увеличава. Превключвателите могат да се използват заедно с хъбове (които се използват за сайтове, които не изискват специална честотна лента на възел), за да се постигне най-доброто съотношение цена/производителност. Благодарение на каскадирането комутаторите потенциално могат да се използват за създаване на FC мрежи с 2 24 адреса (над 16 милиона).

Мостове

FC Bridges (мостове или мултиплексори) се използват за свързване на паралелни SCSI устройства към базирана на FC мрежа. Те осигуряват превод на SCSI пакети между Fibre Channel и паралелни SCSI устройства, примери за които са Solid State Disk (SSD) или лентови библиотеки. Трябва да се отбележи, че напоследък почти всички устройства, които могат да се изхвърлят в SAN, производителите започват да произвеждат с вграден FC интерфейс за директна връзка към мрежи за съхранение.

Сървъри и съхранение

Въпреки факта, че сървърите и хранилището далеч не са най-маловажните компоненти на SAN, ние няма да се спираме на тяхното описание, тъй като сме сигурни, че всички наши читатели са запознати с тях.

В заключение бих искал да добавя, че тази статия е само първата стъпка към мрежите за съхранение. За пълно разбиране на темата, читателят трябва да обърне много внимание на особеностите на внедряването на компоненти от производителите на SAN и софтуерни инструментиуправление, защото без тях Storage Area Network е просто набор от елементи за превключване на системи за съхранение, които няма да ви донесат пълните предимства от внедряването на мрежа за съхранение.

Заключение

Днес Storage Area Network е сравнително нова технология, която скоро може да стане основна сред корпоративните клиенти. В Европа и САЩ предприятия, които имат доста голям парк от инсталирани системи за съхранение, вече започват да мигрират към мрежи за съхранение за съхранение с най-добра обща цена на притежание.

Според прогнозите на анализаторите през 2005 г. значителен брой от средния клас и Най-високо нивоще се предлага предварително инсталиран с интерфейс Fibre Channel (тенденция, която може да се види днес) и само вътрешни връзки на устройства в сървъри ще използват паралелен SCSI интерфейс. Още днес, когато изграждате системи за съхранение и придобивате сървъри от средно и високо ниво, трябва да обърнете внимание на тази обещаваща технология, особено след като днес тя прави възможно изпълнението на редица задачи много по-евтино от използването на специализирани решения. В допълнение, инвестирането в SAN технология днес няма да загуби вашата инвестиция утре, тъй като характеристиките на Fibre Channel създават страхотни възможности за използване на днешните инвестиции в бъдещето.

P.S.

Предишната версия на статията е написана през юни 2000 г., но поради липсата на масов интерес към SAN технологията, публикацията беше отложена за бъдещето. Това бъдеще е сега и се надявам, че тази статия ще насърчи читателя да осъзнае необходимостта от преминаване към SAN технологията като най-новата технология за изграждане на системи за съхранение и организиране на достъпа до данни.

Ако сървърите са универсални устройстваизпълнявайки в повечето случаи
- или функцията на сървъра на приложения (когато сървърът работи специални програмии се извършват интензивни изчисления),
- или функцията на файлов сървър (т.е. място за централизирано съхранение на файлове с данни)

след това SHD (системи за съхранение на данни) - устройства, специално проектирани да изпълняват такива сървърни функции като съхранение на данни.

Необходимостта от закупуване на хранилище
обикновено се среща в доста зрели предприятия, т.е. тези, които мислят как
- съхранява и управлява информация, най-ценният актив на компанията
- осигуряване на непрекъснатост на бизнеса и защита от загуба на данни
- повишаване на адаптивността на ИТ инфраструктурата

Съхранение и виртуализация
Конкуренцията принуждава МСП да работят по-ефективно, без прекъсване и с висока ефективност. Промяна на производствените модели тарифни планове, видове услуги се случва все по-често. Целият бизнес на съвременните компании е "обвързан" с информационни технологии. Бизнес нуждите се променят бързо и мигновено се отразяват в ИТ – изискванията за надеждност и адаптивност на ИТ инфраструктурата нарастват. Виртуализацията предоставя тази възможност, но изисква евтини и лесни за поддръжка системи за съхранение.

Класификация на системите за съхранение по тип връзка

DAS. Първите дискови масиви са свързани със сървъри чрез SCSI интерфейс. В същото време един сървър може да работи само с един дисков масив. Това е връзка с директно свързано хранилище (DAS).

NAS. За по-гъвкава организация на структурата компютърен център- така че всеки потребител да може да използва всяка система за съхранение - трябва да свържете системата за съхранение към локална мрежа. Това е NAS - Network Attached Storage). Но обменът на данни между сървъра и системата за съхранение е многократно по-интензивен, отколкото между клиента и сървъра, следователно в тази версия имаше обективни трудности, свързани с честотната лента на Ethernet мрежата. И от гледна точка на сигурността не е напълно правилно да се показват системи за съхранение в обща мрежа.

SAN. Но можете да създадете своя собствена, отделна, високоскоростна мрежа между сървъри и системи за съхранение. Тази мрежа беше наречена SAN (Storage Area Network). Скоростта се осигурява от факта, че физическата преносна среда там е оптика. Специални адаптери (HBA) и оптични FC-превключватели осигуряват трансфер на данни със скорости от 4 и 8Gbit / s. Надеждността на такава мрежа беше увеличена чрез резервиране (дублиране) на канали (адаптери, комутатори). Основният недостатък е високата цена.

iSCSI. С навлизането на евтините 1Gbit/s и 10Gbit/s Ethernet технологии, 4Gbit/s оптиката вече не е толкова привлекателна, особено като се има предвид цената. Поради това протоколът iSCSI (Internet Small Computer System Interface) все повече се използва като SAN среда. iSCSI SAN може да бъде изграден върху всеки достатъчно бърз IP активиран физически гръбнак.

Класификация на системите за съхранение на данни по обхват:

Клас описание
лични

Най-често те са обичайните 3,5 "или 2,5" или 1,8" HDDпоставени в специален калъф и оборудвани USB интерфейсии/или FireWire 1394 и/или Ethernet и/или eSATA.
По този начин имаме преносимо устройство, което може да се свърже с компютър / сървър и да изпълнява функциите външен диск. Понякога към устройството се добавят функции за удобство. безжичен достъп, принтер и USB портове.

малка работна група

Обикновено това е стационарно или преносимо устройство, в което можете да инсталирате няколко (най-често от 2 до 5) твърди дискове SATA, с възможност за гореща смяна или без възможност за гореща смяна, с Ethernet интерфейс. Дисковете могат да бъдат организирани в масиви - RAID на различни нива за постигане на висока надеждност на съхранение и скорост на достъп. Системата за съхранение има специализирана операционна система, обикновено базирана на Linux, и ви позволява да диференцирате нивото на достъп по потребителско име и парола, да организирате квоти за дисково пространство и т.н.
Такива системи за съхранение са подходящи за малки работни групи, като заместител на файловите сървъри.

работна група

Устройство, обикновено монтирано в 19" шкаф за монтаж, което приема 12-24 HotSwap SATA или SAS твърди диска. Има външен Ethernet интерфейс и/или iSCSI. Дисковете са организирани в масиви - RAID за постигане на висока надеждност на съхранение и скорост на достъп системата за съхранение се доставя със специализиран софтуер, който ви позволява да диференцирате нивото на достъп, да организирате квоти за дисково пространство, да организирате BackUp (архивиране на информация) и т.н.
Тези системи за съхранение са подходящи за средни и големи предприятия и се използват заедно с един или повече сървъри.
предприятие
Фиксирано или 19" устройство за монтиране в багажник, което може да побере до стотици твърди дискове.
В допълнение към предишния клас системи за съхранение, те могат да бъдат надграждани, надграждани и заменени без спиране на системата, системи за наблюдение. Софтуерът може да поддържа "моментни снимки" и други "разширени" функции.
Тези системи за съхранение са подходящи за големи предприятия и осигуряват повишена надеждност, скорост и защита на критични данни.

предприятие от висок клас

В допълнение към предишния клас, паметта може да поддържа хиляди твърди дискове.
Такива системи за съхранение заемат няколко 19" шкафа, общото тегло достига няколко тона.
Системите за съхранение са предназначени за непрекъсната работа с най-висока степен на надеждност, съхранение на стратегически важни данни на ниво държава / корпорации.

История на въпросите.

Първите сървъри комбинираха в един корпус всички функции (като компютрите) - както изчислителни (сървър за приложения), така и съхранение на данни (файлов сървър). Но с нарастването на търсенето на изчислителна мощност от една страна и с нарастването на количеството обработени данни от друга страна, стана просто неудобно да се постави всичко в един пакет. Оказа се по-ефективно дисковите масиви да се поставят в отделни кутии. Но тогава възникна въпросът за свързването на дисковия масив към сървъра. Първите дискови масиви са били свързани със сървъри чрез SCSI интерфейс. Но в този случай един сървър може да работи само с един дисков масив. Хората искаха по-гъвкава организация на структурата на центъра за данни - така че всеки сървър да може да използва всяка система за съхранение. Свързването на всички устройства директно към локалната мрежа и организирането на обмен на данни чрез Ethernet е, разбира се, просто и универсално решение. Но обменът на данни между сървъри и системи за съхранение е многократно по-интензивен, отколкото между клиенти и сървъри, следователно в тази версия (NAS - вижте по-долу) има обективни трудности, свързани с пропускателната способност на Ethernet мрежата. Имаше идея да се създаде отделна високоскоростна мрежа между сървъри и системи за съхранение. Такава мрежа се нарича SAN (виж по-долу). Подобен е на Ethernet, само че физическата среда за предаване е оптика. Има и адаптери (HBA), които се инсталират в сървъри и комутатори (оптични). Стандарти за скорост на пренос на данни по оптика - 4Gbit/s. С появата Ethernet технологии 1Gbit/s и 10Gbit/s, както и протокола iSCSI, Ethernet все повече се използва като SAN среда.

Зависимостта на бизнес процесите на предприятието от ИТ сектора непрекъснато нараства. Днес въпросът за непрекъснатостта на ИТ услугите се обръща внимание не само от големите компании, но и от представители на среден и често малък бизнес.

Един от централните елементи за осигуряване на устойчивост на грешки е системата за съхранение на данни (DSS) - устройство, на което цялата информация се съхранява централно. Системата за съхранение се характеризира с висока мащабируемост, отказоустойчивост, възможност за извършване на всички сервизни операции без спиране на работата на устройството (включително подмяна на компоненти). Но цената дори на базовия модел се измерва в десетки хиляди долари. Например, Fujitsu ETERNUS DX100с 12 диска Nearline SAS 1Tb SFF (RAID10 6TB)ред на стойност 21 000 USDкоето е много скъпо за малка фирма.

В нашата статия предлагаме да разгледаме бюджетни опции за съхранение, която не губи по отношение на производителност и надеждност на класическите системи. За да го приложим, предлагаме да използваме CEPH.

Какво е CEPH и как работи?

CEPH– хранилище, базирано на безплатен софтуер, което представлява комбинация от дискови пространства на няколко сървъра (броят на сървърите на практика се измерва в десетки и стотици). CEPH ви позволява да създавате силно мащабируемо хранилище с висока производителност и излишък на ресурси. CEPH може да се използва както като обектно хранилище (служи за съхраняване на файлове), така и като блоково устройство (раздава виртуални твърди дискове).

Толерантността към грешки при съхранение се осигурява чрез репликация на всеки блок от данни към множество сървъри. Броят на едновременно съхраняваните копия на всеки блок се нарича фактор на репликация, по подразбиране неговата стойност е 2. Схемата за съхранение е показана на фигура 1, както виждаме, информацията е разделена на блокове, всеки от които е разпределен в два различни възли.

Фигура 1 - Разпределение на блокове данни


Ако сървърите не използват устойчиви на грешки дискови масиви, се препоръчва използването на по-висока стойност на коефициента на репликация за надеждно съхранение на данни. В случай на повреда на един от сървърите, CEPH коригира недостъпността на блоковете данни (Фигура 2), които се намират на него, изчаква определено време (параметърът е конфигуриран по подразбиране 300 секунди), след което започва да пресъздава липсващите блокове информация на друго място (Фигура 3).

Фигура 2 - Повреда на един възел


Фигура 3 - Възстановяване на излишъка


По същия начин, ако към клъстера се добави нов сървър, съхранението се балансира отново, за да се запълнят равномерно дисковете на всички възли. Механизмът, който контролира разпределението на блокове информация в клъстера CEPH, се нарича CRUSH.

За да се постигне висока производителност на дисковото пространство в CEPH клъстери, се препоръчва да се използва функционалността за подреждане на кеша (кеширане на много нива). Смисълът му е да се създаде отделен високопроизводителен пул и да се използва за кеширане, докато основната информация ще бъде поставена на по-евтини дискове (Фигура 4).

Фигура 4 - Логическо представяне на дискови пулове


Многослойното кеширане ще работи по следния начин: клиентските заявки за запис ще бъдат записани в най-бързия пул и след това преместени в нивото на съхранение. По същия начин за заявките за четене - при достъп информацията ще бъде издигната до ниво на кеширане и ще бъде обработена. Данните продължават да остават на ниво кеш, докато не станат неактивни или изтекат (Фигура 5). Струва си да се отбележи, че кеширането може да бъде настроено само за четене, в който случай заявките за запис ще бъдат записвани директно в пула за съхранение.

Фигура 5 - Принципът на работа на кеша


Нека да разгледаме сценарии от реалния живот за използване на CEPH в организация за създаване на склад за данни. Като потенциален клиент се разглеждат малките и средни предприятия, където тази технология ще бъде най-търсена. Изчислихме 3 сценария за използване на описаното решение:

  1. Производствено или търговско предприятие с изискване за наличие на вътрешна ERP система и съхранение на файлове 99,98% годишно, 24/7.
  2. Организация, която трябва да разположи локален частен облак за своите бизнес нужди.
  3. Много евтино решение за организиране на устойчиво на грешки блоково съхранение на данни, напълно независимо от хардуерс 99,98% наличност на година и евтино мащабиране.

Случай на използване 1. Склад за данни, базиран на CEPH

Нека да разгледаме пример от реалния живот за това как CEPH се използва в една организация. Например, имаме нужда от устойчиво на грешки 6 TB високопроизводително хранилище, но цената дори на основен модел за съхранение с дискове е от порядъка на $21 000 .

Ние събираме съхранение въз основа на CEPH. Предлагаме да използвате решението като сървъри Supermicro Twin(Фигура 6). Продуктът се състои от 4 сървърни платформи в един 2-модулен висок корпус, като всички основни компоненти на устройството са дублирани, което гарантира непрекъснатата му работа. За да изпълним нашата задача, ще бъде достатъчно да използваме 3 възела, 4-тият ще бъде на склад за в бъдеще.




Фигура 6 - Supermicro Twin


Завършваме всеки от възлите, както следва: 32 GB RAM, 4 ядрен процесор 2,5 GHz, 4 SATA устройство 2 TB за пула за съхранение се комбинират в 2 масива RAID1, 2 SSD устройствоза пула за кеширане, ние също го комбинираме в RAID1. Цената на целия проект е показана в таблица 1.

Таблица 1. Аксесоари за съхранение на CEPH

Аксесоари Цена, USD Кол Цена, USD
4 999,28 1 4 999,28
139,28 6 835,68
Процесор Ivy Bridge-EP 4-ядрен 2.5GHz (LGA2011, 10MB, 80W, 22nm) тава 366,00 3 1 098,00
416,00 12 4 992,00
641,00 6 3 846,00
ОБЩА СУМА 15 770,96

Заключение:В резултат на изграждането на хранилището ще получим 6Tb дисков масив с цена на поръчката $16 000 , Какво 25% по-малкоотколкото закупуването на минимална система за съхранение, докато при текущия капацитет можете да стартирате виртуални машини, работещи със съхранение, като по този начин спестявате закупуването на допълнителни сървъри. Всъщност това е цялостно решение.

Сървърите, от които е изградено хранилището, могат да се използват не само като контейнер за твърди дискове, но и като носители за съхранение виртуални машиниили сървъри за приложения.

Случай на използване 2: Изграждане на частен облак

Предизвикателството е да се разгърне инфраструктурата за изграждане на частен облак с минимални разходи.

Изграждането дори на малък облак, състоящ се от например 3 носителя на около $36 000 : $21,000 - цена за съхранение + $5,000 за всеки сървър с 50% съдържание.

Използването на CEPH като хранилище ви позволява да комбинирате изчислителни и дискови ресурси на един и същ хардуер. Тоест, не е необходимо да купувате място за съхранение отделно - дискове, инсталирани директно на сървъри, ще се използват за хостване на виртуални машини.

Бърза справка:
Класическата облачна структура е клъстер от виртуални машини, чиято работа се осигурява от 2 основни хардуерни компонента:

  1. Изчислителна част (compute) - сървъри, пълни с RAM и процесори, ресурсите на които се използват виртуални машиниза изчисления
  2. Система за съхранение (съхранение) - устройство, изпълнено с твърди дискове, който съхранява всички данни.

Взимаме същите сървъри Supermicro като оборудване, но инсталираме повече мощни процесори8-ядрен с честота 2,6 GHz, както и 96 GB RAM във всеки възел, тъй като системата ще се използва не само за съхраняване на информация, но и за работа на виртуални машини. Взимаме набор от дискове, подобни на първия сценарий.

Таблица 2. Компоненти за частен облак, базиран на CEPH

Аксесоари Цена, USD Кол Цена, USD
Supermicro Twin 2027PR-HTR: 4 системи (възли) с възможност за горещо включване в 2U форм фактор. Двоен сокет R (LGA 2011), до 512GB ECC RDIMM, интегриран IPMI 2.0 с KVM и специална LAN. 6x 2.5" SATA HDD отделения с гореща смяна. 2000W резервни захранвания 4 999,28 1 4 999,28
Модул памет на samsung DDR3 16GB регистриран ECC 1866Mhz 1.5V двоен ранг 139,28 18 2 507,04
Процесор Intel Xeon E5-2650V2 Ivy Bridge-EP 8-ядрен 2.6GHz (LGA2011, 20MB, 95W, 32nm) тава 1 416,18 3 4 248,54
Твърд диск SATA 2TB 2.5" Enterprise Капацитет SATA 6Gb/s 7200rpm 128Mb 512E 416 12 4 992,00
в твърдо състояние SSD устройство 2.5"" 400GB DC S3710 серия. 641 6 3 846,00
ОБЩА СУМА 20 592,86

Събраният облак ще има следните ресурси, като се вземе предвид запазването на стабилността в случай на повреда на 1-ви възел:

  • RAM: 120 GB
  • Дисково пространство 6000 GB
  • Процесорни ядра физически: 16 бр.

Сглобеният клъстер ще може да поддържа около 10 средни виртуални машини със следните характеристики: 12 GB RAM / 4 процесорни ядра / 400 GB дисково пространство.

Също така си струва да се има предвид, че всичките 3 сървъра са запълнени само на 50% и, ако е необходимо, те могат да бъдат недостигнали, като по този начин ресурсният пул за облака се увеличава 2 пъти.

Заключение:Както можете да видите, получихме както пълноценен отказоустойчив клъстер от виртуални машини, така и излишно съхранение на данни - отказът на някой от сървърите не е критичен - системата ще продължи да функционира без спиране, докато цената на решението е около 1,5 пъти по-нискаотколкото да купуват място за съхранение и отделни сървъри.

Случай на употреба 3: Изграждане на изключително евтино хранилище за данни

Ако бюджетът е много ограничен и няма пари за закупуване на описаното по-горе оборудване, можете да закупите използвани сървъри, но не трябва да пестите от дискове - силно се препоръчва да закупите нови.

Предлагаме да разгледаме следната структура: закупени 4 сървърни възела, всеки сървър има 1 SSD диск за кеширане и 3 SATA диска. Supermicro сървъри с 48 GB RAM и процесори от серия 5600 вече могат да бъдат закупени за около $800 .

Дисковете няма да бъдат събрани в масиви за преодоляване на отказ на всеки сървър, а ще бъдат представени като отделно устройство. В тази връзка, за да увеличим надеждността на хранилището, ще използваме коефициент на репликация 3. Тоест всеки блок ще има 3 копия. С тази огледална архитектура SSD устройствакеш паметта не се изисква, тъй като информацията автоматично се дублира към други възли.

Таблица 3. Аксесоари за съхранение

Заключение:Ако е необходимо, в това решение можете да използвате по-големи дискове или да ги замените със SAS, ако трябва да получите максимална производителност за СУБД. IN този примеррезултатът е 8 TB място за съхранение с много ниска цена и много висока устойчивост на грешки. Оказа се цената на един терабайт 3,8 пъти по-евтиноотколкото с $21 000 промишлено съхранение.

Финална маса, заключения

Конфигурация Съхранение Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) Съхранение Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) + Supermicro Twin Нашият сценарий 1: CEPH-базирано съхранение Нашият сценарий 2: Изграждане на частен облак Нашият сценарий 3: Изграждане на хранилище на изключително ниска цена
Използваем обем, GB 6 000 6 000 6 000 6000 8 000
Цена, USD 21000 36000 15 770 20 592 7 324
Цена на 1 GB, USD 3,5 6 2,63 3,43 0,92
Брой IOP* (четене 70%/запис 30%, размер на блока 4K) 760 760 700 700 675
Предназначение съхранение Съхранение + изчисление Съхранение + изчисление Съхранение + изчисление Съхранение + изчисление

*Изчисляването на броя на IOPs е извършено за създадените масиви от NL SAS дискове на системата за съхранение и SATA дискове на CEPH паметта, кеширането е деактивирано за чистотата на получените стойности. Когато използвате кеширане, IOP ще бъдат значително по-високи, докато кешът не се напълни.

В резултат на това можем да кажем, че въз основа на клъстера CEPH можете да изградите надеждни и евтини складове за данни. Както показаха изчисленията, използването на клъстерни възли само за съхранение не е много ефективно - решението е по-евтино от закупуването на системи за съхранение, но не много - в нашия пример цената на съхранението на CEPH беше с около 25% по-ниска от Fujitsu DX100. Усещат се реални спестявания в резултат на комбинирането на изчислителната част и съхранението на едно и също оборудване - в този случай цената на решението ще бъде 1,8 пъти по-малка, отколкото при изграждането на класическа структура, използваща специално място за съхранение и отделни хост машини.

EFSOL прилага това решение според индивидуалните изисквания. Можем да използваме оборудването, с което разполагате, което допълнително ще намали капиталовите разходи за внедряване на системата. Свържете се с нас и ние ще проверим вашето оборудване за използването му при създаване на системи за съхранение.

Директно свързаните системи за съхранение (DAS) реализират най-известния тип връзка. Когато използвате DAS, сървърът има лична връзка със системата за съхранение и почти винаги е единственият потребител на устройството. В този случай сървърът получава блоков достъп до системата за съхранение на данни, тоест има директен достъп до блокове данни.

Системите за съхранение от този тип са доста прости и обикновено евтини. недостатък директен методвръзката е кратко разстояниемежду сървър и устройство за съхранение. Типичен DAS интерфейс е SAS.

Мрежово съхранение (NAS)

Мрежови системи за съхранение (NAS), известни също като файлови сървъри, предоставят своите мрежови ресурси на клиенти през мрежата под формата на споделени файлове или точки за монтиране на директории. Клиентите използват мрежови протоколи за достъп до файлове като SMB (по-рано известен като CIFS) или NFS. Файловият сървър от своя страна използва протоколи за блокиране на достъп до вътрешното си хранилище, за да обработва заявки за файлове от клиенти. Тъй като NAS е свързан в мрежа, хранилището може да бъде много далеч от клиентите. Многобройни мрежови системи за съхранение предоставят допълнителни функциикато например съхранение на изображения, дедупликация или компресиране на данни и други.

Мрежа за съхранение (SAN)

Мрежата за съхранение (SAN) предоставя на клиентите блокиран достъп до данни през мрежа (като Fibre Channel или Ethernet). Устройствата в SAN не принадлежат към един сървър, но могат да се използват от всички SAN клиенти. Възможно е дисковото пространство да се раздели на логически томове, които се разпределят на отделни хост сървъри. Тези томове са независими от SAN компонентите и тяхното разположение. Клиентите имат достъп до хранилището, като използват блоков тип достъп, точно като DAS връзка, но тъй като SAN използва мрежа, устройствата за съхранение могат да бъдат разположени далеч от клиентите.

В момента SAN архитектурите използват протокола SCSI (Small Computer System Interface) за предаване и получаване на данни. Fibre Channel (FC) SAN капсулират SCSI протокола в рамки на Fibre Channel. SAN, използващи iSCSI (Internet SCSI), използват TCP/IP пакети като SCSI транспорт. Fibre Channel over Ethernet (FCoE) капсулира протокола Fibre Channel в Ethernet пакети, използвайки относително нова технология DCB (Data Center Bridging), който носи набор от подобрения на традиционния Ethernet и в момента може да бъде разгърнат на 10GbE инфраструктура. Тъй като всяка от тези технологии позволява на приложенията да осъществяват достъп до хранилището на данни, използвайки един и същ SCSI протокол, става възможно да се използват всички в една компания или да мигрират от една технология към друга. Приложенията, работещи на сървъра, не могат да разграничат FC, FCoE, iSCSI и дори да разграничат DAS от SAN.

Има много дискусии относно избора на FC или iSCSI за изграждане на мрежа за съхранение. Някои компании се фокусират върху ниските първоначални разходи за внедряване на iSCSI SAN, докато други избират високата надеждност и достъпност на Fibre Channel SAN. Въпреки че iSCSI решенията от нисък клас са по-евтини от Fibre Channel, с увеличаване на производителността и надеждността на iSCSI SAN, ценовото предимство изчезва. Има обаче някои FC реализации, които са по-лесни за използване от повечето iSCSI решения. Следователно изборът на конкретна технология зависи от бизнес изискванията, съществуващата инфраструктура, експертизата и бюджета.

Повечето големи организации, които използват SAN, избират Fibre Channel. Тези компании обикновено изискват доказана технология, нуждаят се от висока честотна лента и разполагат с бюджет за закупуване на най-надеждния и способен хардуер. Освен това те разполагат с персонал за управление на SAN. Някои от тези компании планират да продължат да инвестират във Fibre Channel инфраструктура, докато други инвестират в iSCSI решения, особено 10GbE, за своите виртуализирани сървъри.

По-малките компании са по-склонни да изберат iSCSI поради ниската входна цена, като същевременно могат да мащабират допълнително SAN. Нискотарифните решения обикновено използват 1GbE технология; 10GbE решенията са значително по-скъпи и обикновено не се считат за SAN от начално ниво.

унифицирано съхранение

Универсалните системи за съхранение (Unified Storage) комбинират NAS и SAN технологии в едно интегрирано решение. Тези многофункционални хранилища позволяват както блоков, така и файлов достъп до споделени ресурси и са по-лесни за управление със софтуер за централизирано управление.

В най-простия случай SAN се състои от системи за съхранение, комутатори и сървъри, свързани чрез оптични комуникационни канали. В допълнение към директните дискови системи за съхранение в SAN можете да свържете дискови библиотеки, лентови библиотеки (стримери), устройства за съхранение на данни на оптични дискове (CD / DVD и други) и др.

Пример за високо достъпна инфраструктура, в която сървърите са свързани едновременно към локална мрежа (вляво) и мрежа за съхранение (вдясно). Такава схема осигурява достъп до данни, разположени в системата за съхранение, в случай на повреда на който и да е процесорен модул, комутатор или път за достъп.

Използването на SAN ви позволява да предоставите:

  • централизирано управление на ресурсите на сървъри и системи за съхранение на данни;
  • свързване на нови дискови масиви и сървъри без спиране на работата на цялата система за съхранение;
  • използване на закупено преди това оборудване във връзка с нови устройства за съхранение;
  • бърз и надежден достъп до дискове с данни, разположени на голямо разстояние от сървърите, * без значителни загуби на производителност;
  • ускоряване на процеса на архивиране и възстановяване на данни - BURA.

История

Развитието на мрежовите технологии доведе до появата на две мрежови решенияза системи за съхранение - мрежи за съхранение Storage Area Network (SAN) за обмен на данни на ниво блок, поддържани от клиентски файлови системи, и сървъри за съхранение на данни на ниво файл Network Attached Storage (NAS). За да се разграничат традиционните системи за съхранение от мрежовите системи за съхранение, беше предложен друг ретроним - Direct Attached Storage (DAS).

Последователно появяващите се на пазара DAS, SAN и NAS отразяват развиващите се вериги от връзки между приложенията, които използват данни и байтовете на носителя, съдържащ тези данни. Някога самите приложни програми четат и записват блокове, след което драйверите се появяват като част от тях операционна система. В съвременните DAS, SAN и NAS веригата се състои от три връзки: първата връзка е създаването на RAID масиви, втората е обработката на метаданни, която позволява интерпретиране на двоични данни под формата на файлове и записи, а третата е услуги за предоставяне на данни към приложението. Те се различават по това къде и как се изпълняват тези връзки. В случая на DAS, съхранението е „голо“, то предоставя само възможност за съхраняване и достъп до данни, а всичко останало се извършва от страната на сървъра, като се започне от интерфейси и драйвери. С появата на SAN предоставянето на RAID се прехвърля към страната за съхранение, всичко останало остава същото като в случая с DAS. И NAS е различен по това, че метаданните също се прехвърлят към системата за съхранение, за да осигурят достъп до файлове, тук клиентът трябва само да поддържа услуги за данни.

Появата на SAN стана възможна след като протоколът Fibre Channel (FC) беше разработен през 1988 г. и одобрен от ANSI като стандарт през 1994 г. Терминът Storage Area Network датира от 1999 г. С течение на времето FC отстъпи място на Ethernet и IP-SAN мрежите с iSCSI връзка станаха широко разпространени.

Идеята за мрежов сървър за съхранение NAS принадлежи на Brian Randall от Newcastle University и е внедрена в машини на UNIX сървър през 1983 г. Тази идея беше толкова успешна, че беше подета от различни компании, включително Novell, IBM и Sun, но в крайна сметка смени лидерите от NetApp и EMC.

През 1995 г. Гарт Гибсън разработва принципите на NAS и създава системи за съхранение на обекти (Object Storage, OBS). Той започна, като раздели всички дискови операции на две групи, като едната съдържа по-честите операции, като четене и запис, а другата, по-редките, като операциите за именуване. Тогава той предложи друг контейнер в допълнение към блокове и файлове, той го нарече обект.

OBS се отличава с нов тип интерфейс, той се нарича обект. Клиентските услуги за данни взаимодействат с метаданните чрез Object API. В допълнение към съхраняването на данни, OBS също поддържа RAID, съхранява метаданни, свързани с обекти, и поддържа обектен интерфейс. DAS и SAN и NAS и OBS съществуват едновременно с времето, но всеки тип достъп е по-подходящ за определен тип данни и приложение.

SAN архитектура

Мрежова топология

SAN е високоскоростна мрежа за данни, предназначена да свързва сървъри с устройства за съхранение. Разнообразие от SAN топологии (от точка до точка, арбитражен контур и превключване) заместват традиционните шинни връзки сървър към хранилище и осигуряват повече гъвкавост, производителност и надеждност от тях. Концепцията за SAN се основава на възможността за свързване на всеки от сървърите към всяко устройство за съхранение, работещо по протокола Fibre Channel. Принципът на взаимодействие на възли в SAN с топологии от точка до точка или комутация е показан на фигурите. В SAN с арбитражен цикъл прехвърлянето на данни се извършва последователно от възел на възел. За да започне пренос на данни, предавателното устройство инициира арбитраж за правото да използва средата за пренос на данни (оттук и името на топологията - Arbitrated Loop).

Транспортната основа на SAN е протоколът Fibre Channel, който използва както медни, така и връзки с оптични устройства.

SAN компоненти

SAN компонентите са разделени на следните:

  • Ресурси за съхранение на данни;
  • Устройства, които реализират SAN инфраструктурата;

Адаптери за хост шина

Ресурси за съхранение

Ресурсите за съхранение включват дискови масиви, лентови устройства и библиотеки на Fibre Channel. Ресурсите за съхранение реализират много от своите възможности само когато са включени в SAN. Така дискови масиви по-горен класможе да репликира данни между масиви през мрежи на Fibre Channel, а лентовите библиотеки могат да прехвърлят данни към лента директно от дискови масиви с интерфейс на Fibre Channel, заобикаляйки мрежата и сървърите (безсървърно архивиране). Най-популярни на пазара са дисковите масиви от EMC, Hitachi, IBM, Compaq (семейството Storage Works, наследено от Compaq от Digital), а сред производителите на лентови библиотеки трябва да се споменат StorageTek, Quantum / ATL, IBM.

Устройства, внедряващи SAN инфраструктура

Устройствата, които реализират SAN инфраструктурата, са превключватели на Fibre Channel (превключватели на Fibre Channel, FC превключватели), хъбове (хъб на Fibre Channel) и рутери (рутери на Fibre Channel-SCSI). Хъбовете се използват за комбиниране на устройства, работещи в арбитражната верига на Fibre Channel ( FC_AL ). Използването на хъбове ви позволява да свързвате и изключвате устройства в цикъл, без да спирате системата, тъй като хъбът автоматично затваря цикъла, ако дадено устройство е изключено, и автоматично отваря цикъла, ако към него е свързано ново устройство. Всяка промяна на цикъла е придружена от сложен процес на неговата инициализация. Процесът на инициализация е многоетапен и преди да приключи, обменът на данни в цикъла не е възможен.

Всички съвременни SAN са изградени на комутатори, които ви позволяват да реализирате пълноценна мрежова връзка. Превключвателите могат не само да свързват устройства с Fibre Channel, но и да ограничават достъпа между устройствата, за които на превключвателите се създават така наречените зони. Устройствата, поставени в различни зони, не могат да комуникират помежду си. Броят на портовете в SAN може да бъде увеличен чрез свързване на комутатори един към друг. Група от свързани комутатори се нарича Fibre Channel Fabric или просто Fabric. Връзките между комутаторите се наричат ​​Interswitch Links или накратко ISL.

Софтуер

Софтуерът ви позволява да реализирате излишък на пътища за достъп на сървъра до дискови масиви и динамично разпределение на натоварването между пътищата. За повечето дискови масиви има лесен начин да се определи дали портовете, достъпвани през различни контролери, са за един и същ диск. Специализиран софтуерподдържа таблица с пътища за достъп до устройства и гарантира, че пътищата са деактивирани в случай на авария, динамично свързване на нови пътища и балансиране на натоварването между тях. По правило производителите на дискови масиви предлагат специализиран софтуер от този тип за своите масиви. VERITAS Software произвежда софтуер VERITAS Volume Manager, предназначен да организира логически дискови томове от физически дискове и да осигурява резервиране на пътищата за достъп до диска, както и балансиране на натоварването между тях за повечето известни дискови масиви.

Използвани протоколи

SAN използват протоколи от ниско ниво:

  • Протокол за Fibre Channel (FCP), SCSI транспорт през Fibre Channel. Най-често се използва върху този моментпротокол . Предлага се в 1 Gbit/s, 2 Gbit/s, 4 Gbit/s, 8 Gbit/s и 10 Gbit/s.
  • iSCSI, SCSI транспорт през TCP/IP.
  • FCoE, FCP/SCSI транспорт през чист Ethernet.
  • FCIP и iFCP, FCP/SCSI капсулиране и предаване в IP пакети.
  • HyperSCSI, SCSI през Ethernet транспорт.
  • FICON транспорт през Fibre Channel (използван само от мейнфрейми).
  • ATA през Ethernet, ATA през Ethernet транспорт.
  • SCSI и/или TCP/IP транспорт чрез InfiniBand (IB).

Предимства

  • Висока надеждност на достъпа до данни, разположени на външни системи за съхранение. Независимост на SAN топологията от използваните системи за съхранение и сървъри.
  • Централизирано съхранение на данни (надеждност, сигурност).
  • Удобно централизирано управление на превключване и данни.
  • Прехвърляне на интензивен I / O трафик към отделна мрежа - разтоварване на LAN.
  • Висока производителност и ниска латентност.
  • Мащабируемост и гъвкавост на логическия дизайн на SAN
  • Географските размери на SAN, за разлика от класическата DAS, са практически неограничени.
  • Възможност за бързо разпределение на ресурсите между сървърите.
  • Възможността за изграждане на устойчиви на грешки клъстерни решения без допълнителни разходи въз основа на съществуващия SAN.
  • проста схема Резервно копие- всички данни са на едно място.
  • Наличност допълнителни функциии услуги (моментни снимки, отдалечена репликация).
  • SAN с висока степен на сигурност.

Споделянето на системи за съхранение обикновено опростява администрирането и добавя справедлива доза гъвкавост, тъй като кабелите и дисковите масиви не трябва да бъдат физически транспортирани и пренасочвани от един сървър към друг.

Друго предимство е възможността за зареждане на сървъри директно от мрежата за съхранение. С тази конфигурация можете бързо и лесно да замените повреден