Enhetligt datalagringssystem. Intels lagringssystem

Enhetligt datalagringssystem.  Intels lagringssystem
Enhetligt datalagringssystem. Intels lagringssystem

Med den dagliga ökningen av komplexiteten för nätverksanslutna datorsystem och globala företagslösningar, började världen efterfråga teknik som skulle sätta fart på renässansen företagssystem informationslagring (lagringssystem). Nu ger en enda teknologi aldrig tidigare skådad prestanda, enorm skalbarhet och exceptionella fördelar för total ägandekostnad till världens skattkammare av lagringsframsteg. Omständigheterna som uppstod med tillkomsten av FC-AL-standarden (Fibre Channel - Arbitrated Loop) och SAN (Storage Area Network), som utvecklas på grundval av detta, lovar en revolution inom dataorienterad datorteknik.

"Den mest betydande utvecklingen inom lagring vi har sett på 15 år"

Data Communications International, 21 mars 1998

Formell definition av SAN som tolkats av Storage Network Industry Association (SNIA):

”Ett nätverk vars huvuduppgift är att överföra data mellan datorsystem och datalagringsenheter, samt mellan själva lagringssystemen. Ett SAN består av en kommunikationsinfrastruktur som tillhandahåller fysisk anslutning, och ansvarar även för hanteringslagret, som kombinerar kommunikation, lagring och datorsystem, överföra data säkert och säkert."

SNIA Technical Dictionary, copyright Storage Network Industry Association, 2000

Alternativ för att organisera åtkomst till lagringssystem

Det finns tre huvudalternativ för att organisera åtkomst till lagringssystem:

  • SAS (Server Attached Storage), lagring ansluten till servern;
  • NAS (Network Attached Storage), lagring ansluten till nätverket;
  • SAN (Storage Area Network), datalagringsnätverk.

Låt oss överväga topologierna för motsvarande lagringssystem och deras funktioner.

SAS

Ett lagringssystem anslutet till servern. Ett välbekant, traditionellt sätt att ansluta ett lagringssystem till ett höghastighetsgränssnitt i en server, vanligtvis ett parallellt SCSI-gränssnitt.

Figur 1. Serveransluten lagring

Användningen av en separat kapsling för lagringssystemet inom SAS-topologin är inte obligatorisk.

Den största fördelen med lagring ansluten till servern jämfört med andra alternativ är lågt pris och hög prestanda baserat på en lagring för en server. Denna topologi är den mest optimala när man använder en enda server genom vilken åtkomst till datamatrisen är organiserad. Men det har fortfarande ett antal problem som fick designers att leta efter andra alternativ för att organisera åtkomst till datalagringssystem.

Funktioner hos SAS inkluderar:

  • Tillgång till data beror på operativsystemet och filsystemet (i allmänhet);
  • Komplexiteten i att organisera system med hög tillgänglighet;
  • Låg kostnad;
  • Hög prestanda inom en nod;
  • Minskad svarshastighet vid laddning av servern som betjänar lagringen.

NAS

Lagringssystem anslutet till nätverket. Det här alternativet för att organisera åtkomst dök upp relativt nyligen. Dess främsta fördel är att det är lätt att integrera ett extra lagringssystem i befintliga nätverk, men i sig medför det inga radikala förbättringar av lagringsarkitekturen. Faktum är att NAS är en ren filserver, och idag kan du hitta många nya NAS-implementationer av lagringstyp baserade på Thin Server-teknik.


Figur 2. Nätverksansluten lagring.

NAS-funktioner:

  • Dedikerad filserver;
  • Tillgång till data är oberoende av OS och plattform;
  • Enkel administration;
  • Maximal enkel installation;
  • Låg skalbarhet;
  • Konflikt med LAN/WAN-trafik.

Lagring byggd med NAS-teknik är ett idealiskt alternativ för billiga servrar med en minimal uppsättning funktioner.

SAN

Datalagringsnätverk började utvecklas intensivt och implementerades först 1999. Grunden för ett SAN är ett nätverk skilt från LAN/WAN, som tjänar till att organisera åtkomst till data från servrar och arbetsstationer som direkt bearbetar den. Ett sådant nätverk skapas utifrån Fibre Channel-standarden, vilket ger lagringssystem fördelarna med LAN/WAN-teknologier och möjligheten att organisera standardplattformar för system med hög tillgänglighet och hög efterfrågeintensitet. Nästan den enda nackdelen med SAN idag är det relativt höga priset på komponenter, men den totala ägandekostnaden för företagssystem byggda med lagringsnätverksteknik är ganska låg.


Figur 3. Storage Area Network.

De främsta fördelarna med SAN inkluderar nästan alla dess funktioner:

  • Oberoende av SAN-topologin från lagringssystem och servrar;
  • Bekväm centraliserad hantering;
  • Ingen konflikt med LAN/WAN-trafik;
  • Bekväm säkerhetskopiering av data utan att ladda det lokala nätverket och servrarna;
  • Hög prestanda;
  • Hög skalbarhet;
  • Hög flexibilitet;
  • Hög tillgänglighet och feltolerans.

Det bör också noteras att denna teknik fortfarande är ganska ung och inom en snar framtid bör den genomgå många förbättringar inom området standardisering av hantering och metoder för interaktion av SAN-undernät. Men man kan hoppas att detta bara hotar pionjärerna med ytterligare utsikter till mästerskap.

FC som grund för att bygga ett SAN

Precis som ett LAN kan ett SAN skapas med en mängd olika topologier och media. När man bygger ett SAN kan både ett parallellt SCSI-gränssnitt och Fibre Channel eller, säg, SCI (Scalable Coherent Interface) användas, men SAN har sin ökande popularitet att tacka Fibre Channel. Specialister med betydande erfarenhet av utveckling av både kanal och nätverksgränssnitt, och de lyckades kombinera alla viktiga positiva egenskaper hos båda teknologierna för att få något riktigt revolutionerande nytt. Vad exakt?

Grundläggande nyckelfunktioner kanal:

  • Låg latens
  • Höga hastigheter
  • Hög tillförlitlighet
  • Punkt-till-punkt topologi
  • Små avstånd mellan noder
  • Plattformsberoende
och nätverksgränssnitt:
  • Flerpunktstopologier
  • Stora avstånd
  • Hög skalbarhet
  • Låga hastigheter
  • Långa förseningar
slås samman till Fibre Channel:
  • Höga hastigheter
  • Protokolloberoende (nivåer 0-3)
  • Stora avstånd
  • Låg latens
  • Hög tillförlitlighet
  • Hög skalbarhet
  • Flerpunktstopologier

Traditionellt har lagringsgränssnitt (det vill säga det som finns mellan värden och lagringsenheterna) varit ett hinder för ökad prestanda och ökad kapacitet hos lagringssystem. Samtidigt kräver tillämpade uppgifter en betydande ökning av hårdvarukapaciteten, vilket i sin tur medför ett behov av att öka bandbredd gränssnitt för kommunikation med lagringssystem. Det är just problemen med att bygga flexibel höghastighetsdataåtkomst som Fibre Channel hjälper till att lösa.

Fibre Channel-standarden färdigställdes under de senaste åren (från 1997 till 1999), under vilken ett enormt arbete gjordes för att harmonisera samspelet mellan olika komponenttillverkare, och allt gjordes för att flytta Fibre Channel från en rent konceptuell teknik till real, som fick stöd i form av installationer i laboratorier och datacentraler. År 1997 designades de första kommersiella proverna av hörnstenskomponenter för att bygga FC-baserade SAN, såsom adaptrar, nav, switchar och broar. Sålunda har FC sedan 1998 använts för kommersiella ändamål inom affärs-, tillverknings- och storskaliga projekt för implementering av felkritiska system.

Fibre Channel är en öppen industristandard för höghastighets seriellt gränssnitt. Den ger anslutning till servrar och lagringssystem på ett avstånd av upp till 10 km (med standardutrustning) med en hastighet av 100 MB/s (exempel på produkter som använder ny standard Fibre Channel med hastigheter på 200 MB/s per ring och implementeringar av den nya standarden med hastigheter på 400 MB/s fungerar redan i laboratorieförhållanden, vilket är 800 MB/s när du använder en dubbelring). (Vid tidpunkten för publiceringen av denna artikel hade ett antal tillverkare redan börjat skicka nätverkskort och switchar med FC 200 MB/s.) Fibre Channel stöder samtidigt ett antal standardprotokoll (inklusive TCP/IP och SCSI-3) med ett enda fysiskt medium, vilket potentiellt förenklar uppbyggnaden av en nätverksinfrastruktur, dessutom ger detta möjligheter att minska kostnaderna för installation och underhåll. Att använda separata subnät för LAN/WAN och SAN har dock ett antal fördelar och rekommenderas som standard.

En av de viktigaste fördelarna med Fibre Channel, tillsammans med hastighetsparametrar (som för övrigt inte alltid är de viktigaste för SAN-användare och kan implementeras med andra teknologier), är förmågan att arbeta över långa avstånd och flexibiliteten av topologin, som kom till den nya standarden från nätverkstekniker. Sålunda bygger konceptet med att bygga en lagringsnätverkstopologi på samma principer som traditionella nätverk, vanligtvis baserade på hubbar och switchar, vilket hjälper till att förhindra hastighetssänkningar när antalet noder ökar och skapar möjligheten att enkelt organisera system utan en enda punkt av misslyckande.

För en bättre förståelse av fördelarna och funktionerna i detta gränssnitt presenterar vi jämförande egenskaper FC och Parallell SCSI i tabellform.

Tabell 1. Jämförelse av Fibre Channel- och Parallell SCSI-teknik

Fibre Channel-standarden förutsätter användningen av olika topologier, såsom punkt-till-punkt, ring- eller FC-AL-hub (loop eller Hub FC-AL), ryggradsomkopplare (Fabric/Switch).

Punkt-till-punkt-topologi används för att ansluta ett enda lagringssystem till en server.

Loop eller Hub FC-AL - för att ansluta flera lagringsenheter till flera värdar. Genom att organisera en dubbelring ökar systemets hastighet och feltolerans.

Switchar används för att ge maximal prestanda och feltolerans för komplexa, stora och omfattande system.

Tack vare nätverksflexibilitet har SAN en extremt viktig funktion - den bekväma möjligheten att bygga feltoleranta system.

Genom att erbjuda alternativa lösningar för lagringssystem och möjligheten att kombinera flera lagringssystem för hårdvararedundans, hjälper SAN till att skydda hård- och mjukvarusystem från hårdvarufel. För att demonstrera kommer vi att ge ett exempel på att skapa ett tvånodssystem utan felpunkter.


Figur 4. Ingen enda punkt av fel.

Konstruktionen av tre eller flera nodsystem utförs genom att helt enkelt lägga till ytterligare servrar till FC-nätverket och koppla dem till båda hubben/switcharna).

När du använder FC blir katastroftoleranta system transparenta. Nätverkskanaler för både lagring och lokala nätverk kan läggas på basis av optisk fiber (upp till 10 km eller mer med hjälp av signalförstärkare) som en fysisk bärare för FC, medan standardutrustning används, vilket gör det möjligt att avsevärt minska kostnaden av sådana system.

Genom att kunna komma åt alla SAN-komponenter var som helst har vi ett extremt flexibelt datanätverk som kan hanteras. Det bör noteras att SAN ger transparens (möjligheten att se) alla komponenter ner till diskarna i lagringssystem. Denna funktion har fått komponenttillverkare att använda sin betydande erfarenhet av att bygga styrsystem för LAN/WAN för att bygga rikliga möjligheter för övervakning och hantering av alla SAN-komponenter. Dessa funktioner inkluderar övervakning och hantering av enskilda noder, lagringskomponenter, höljen, nätverksenheter och nätverksunderstrukturer.

SAN-hanterings- och övervakningssystemet använder öppna standarder som:

  • SCSI-kommandouppsättning
  • SCSI Enclosure Services (SES)
  • SCSI Self Monitoring Analysis and Reporting Technology (S.M.A.R.T.)
  • SAF-TE (SCSI Accessed Fault-Tolerant Enclosures)
  • Simple Network Management Protocol (SNMP)
  • Webbaserad företagsledning (WBEM)

System byggda med hjälp av SAN-teknik ger inte bara administratören möjlighet att övervaka utvecklingen och statusen för lagringsresurser, utan öppnar också möjligheter för övervakning och kontroll av trafik. Tack vare dessa resurser implementerar SAN-hanteringsprogramvaran de mest effektiva planeringsscheman för lagringskapacitet och lastbalansering på systemkomponenter.

Lagringsnätverk är perfekt integrerade i befintlig informationsinfrastruktur. Deras implementering kräver inga ändringar av redan befintliga nätverk LAN och WAN, men utökar bara möjligheterna befintliga system, vilket befriar dem från uppgifter fokuserade på att överföra stora mängder data. Dessutom, när man integrerar och administrerar ett SAN, är det mycket viktigt att nyckelnätverkselement stöder ersättning och installation, med dynamiska konfigurationsmöjligheter. Så administratören kan lägga till den eller den komponenten eller ersätta den utan att stänga av systemet. Och hela den här integrationsprocessen kan visas visuellt i grafiksystem SAN-ledning.

Efter att ha övervägt ovanstående fördelar kan vi lyfta fram ett antal nyckelpunkter som direkt påverkar en av huvudfördelarna med Storage Area Network - den totala ägandekostnaden (Total Cost Ownership).

Otrolig skalbarhet gör att ett företag som använder ett SAN kan investera i servrar och lagring efter behov. Och även för att bevara dina investeringar i redan installerad utrustning när du byter tekniska generationer. Varje ny server kommer att ha höghastighetsåtkomst till lagring och varje ytterligare gigabyte lagring kommer att vara tillgänglig för alla servrar på undernätet på administratörens kommando.

Utmärkta möjligheter för att bygga feltoleranta system kan ge direkta kommersiella fördelar genom att minimera stilleståndstiden och rädda systemet i händelse av en naturkatastrof eller någon annan katastrof.

Kontrollerbarheten av komponenter och systemets transparens ger möjlighet att centralt administrera alla lagringsresurser, och detta minskar i sin tur avsevärt kostnaden för deras support, vars kostnad som regel är mer än 50% av kostnad för utrustning.

Inverkan av SAN på applikationer

För att våra läsare tydligare ska förstå hur praktiskt användbara de tekniker som diskuteras i den här artikeln är, kommer vi att ge flera exempel på tillämpade problem som utan användning av lagringsnätverk skulle lösas ineffektivt, skulle kräva enorma ekonomiska investeringar, eller skulle inte alls lösas med standardmetoder.

Säkerhetskopiering och återställning av data

Genom att använda ett traditionellt SCSI-gränssnitt, när man bygger databackup och återställningssystem, ställs användaren inför ett antal komplexa problem som mycket enkelt kan lösas med hjälp av SAN- och FC-tekniker.

Användningen av lagringsnätverk tar alltså lösningen av problemet med säkerhetskopiering och återställning till en ny nivå och ger möjlighet att utföra säkerhetskopieringar flera gånger snabbare än tidigare, utan att ladda det lokala nätverket och servrarna med säkerhetskopieringsarbete.

Serverkluster

En av de typiska uppgifterna för vilka ett SAN effektivt används är serverklustring. Eftersom en av nyckelpunkterna i att organisera höghastighetsklustersystem som arbetar med data är tillgång till lagring, med tillkomsten av SAN, kan konstruktionen av multi-nodkluster på hårdvarunivå lösas genom att helt enkelt lägga till en server ansluten till SAN (detta kan göras utan att ens stänga av systemet, eftersom FC-omkopplare stödjer hot-plugg). När man använder ett parallellt SCSI-gränssnitt, vars anslutning och skalbarhet är mycket sämre än FC, skulle det vara svårt att skapa databehandlingsorienterade kluster med fler än två noder. Parallella SCSI-switchar är mycket komplexa och dyra enheter, men för FC är detta en standardkomponent. För att skapa ett kluster som inte kommer att ha en enda felpunkt räcker det att integrera en speglad SAN (DUAL Path-teknik) i systemet.

Inom ramen för klustring verkar en av RAIS-teknikerna (Redundant Array of Inexpensive Servers) särskilt attraktiva för att bygga kraftfulla, skalbara internethandelssystem och andra typer av uppgifter med ökat effektbehov. Enligt Alistair A. Croll, medgrundare av Networkshop Inc, är det ganska effektivt att använda RAIS: "Till exempel, för $12 000-$15 000 kan du köpa ungefär sex billiga enkel- eller dubbelprocessor (Pentium III) Linux/Apache-servrar. Kraften, skalbarheten och feltoleransen för ett sådant system kommer att vara betydligt högre än till exempel en enskild fyraprocessorserver baserad på Xeon-processorer, och kostnaden blir densamma.”

Samtidig videoströmning, datadelning

Föreställ dig en uppgift där du behöver redigera video på flera (säg >5) stationer eller helt enkelt arbeta med enorma mängder data. Att överföra en 100 GB fil över ett lokalt nätverk tar dig några minuter, och Allmänt arbete kommer att vara mycket över honom utmanande uppgift. Med ett SAN får varje arbetsstation och server i nätverket åtkomst till filen med hastigheter som motsvarar en lokal höghastighetsdisk. Om du behöver en annan station/server för databehandling kan du lägga till den i SAN utan att stänga av nätverket, helt enkelt genom att ansluta stationen till SAN-switchen och ge den åtkomsträttigheter till lagringen. Om du inte längre är nöjd med prestandan för dataundersystemet kan du helt enkelt lägga till ytterligare en lagring och, med hjälp av datadistributionsteknik (till exempel RAID 0), få ​​dubbelt så hög prestanda.

Grundläggande SAN-komponenter

onsdag

Koppar och optiska kablar används för att ansluta komponenter inom Fibre Channel-standarden. Båda typerna av kablar kan användas samtidigt när man bygger ett SAN. Gränssnittskonvertering utförs med GBIC (Gigabit Interface Converter) och MIA (Media Interface Adapter). Båda kabeltyperna ger idag samma dataöverföringshastighet. Kopparkabel används för korta avstånd (upp till 30 meter), optisk kabel - både för korta och för avstånd upp till 10 km och mer. Multimode och single-mode optiska kablar används. Multimode-kabel används för korta avstånd (upp till 2 km). Den inre diametern på den optiska fibern i en multimodkabel är 62,5 eller 50 mikron. För att uppnå överföringshastigheter på 100 MB/s (200 MB/s full duplex) vid användning av multimodfiber bör kabellängden inte överstiga 200 meter. Single mode kabel används för långa avstånd. Längden på en sådan kabel begränsas av effekten hos lasern som används i signalsändaren. Den inre diametern på den optiska fibern i en enkelmodskabel är 7 eller 9 mikron, den tillåter passage av en enda stråle.

Kontakter, adaptrar

För att ansluta kopparkablar används kontakter av typen DB-9 eller HSSD. HSSD anses vara mer pålitligt, men DB-9 används lika ofta eftersom det är enklare och billigare. Standardkontakten (vanligast) för optiska kablar är SC-kontakten, den ger en tydlig anslutning av hög kvalitet. För vanliga anslutningar används multimode SC-kontakter och för fjärranslutningar används single-mode-kontakter. Multiportadaptrar använder mikrokontakter.

De vanligaste adaptrarna för FC för PCI 64-bitars bussen. Dessutom tillverkas många FC-adaptrar för S-BUS-bussen, för specialiserad användning adaptrar för MCA, EISA, GIO, HIO, PMC, Compact PCI tillverkas. De mest populära är kort med en port; På PCI-adaptrar, som regel använder de DB-9, HSSD, SC-kontakter. Ofta hittas också GBIC-baserade adaptrar, som kommer med eller utan GBIC-moduler. Fibre Channel-adaptrar skiljer sig åt i de klasser de stöder och de olika funktioner de erbjuder. För att förstå skillnaderna, här är en jämförelsetabell över adaptrar producerade av QLogic.

Fiber Channel Host Bus Adapter Familjediagram
SANblade64 bitarFCAL Publ. Pvt LoopFL hamnKlass 3F PortKlass 2Punkt till punktIP/SCSIFull DuplexFC TapePCI 1.0 Hot Plug SpecSolaris Dynamic ReconfigVIВ2 Gb
2100-serien33 & 66MHz PCIXXX
2200-serien33 & 66MHz PCIXXXXXXXXX
33MHz PCIXXXXXXXXXX
25 MHz SbusXXXXXXXXX X
2300-serien66MHZ PCI/133MHZ PCI-XXXXXXXXXX XX

Hubs

Fibre Channel HUB (hubs) används för att ansluta noder till en FC-ring (FC Loop) och har en struktur som liknar Token Ring-hubbar. Eftersom en bruten ring kan leda till att nätverksfunktionen upphör, använder moderna FC-hubbar ringbypass-portar (PBC-port bypass-krets), som tillåter automatisk öppning/stängning av ringen (ansluter/kopplar från system som är anslutna till hubben). Vanligtvis stöder FC HUB upp till 10 anslutningar och kan stapla upp till 127 portar per ring. Alla enheter som är anslutna till HUB får en gemensam bandbredd som de kan dela sinsemellan.

Växlar

Fiberkanalswitchar (switchar) har samma funktioner som LAN-switchar som är bekanta för läsaren. De ger fullhastighets, icke-blockerande anslutningar mellan noder. Alla noder som är anslutna till en FC-switch får full (med skalbar) bandbredd. När antalet portar på ett switchat nätverk ökar, ökar dess genomströmning. Switchar kan användas i samband med hubbar (som används för områden som inte kräver dedikerad bandbredd för varje nod) för att uppnå optimalt pris/prestanda-förhållande. Tack vare kaskadkoppling kan switchar potentiellt användas för att skapa FC-nätverk med 2 24 adresser (över 16 miljoner).

Broar

FC-bryggor (bryggor eller multiplexorer) används för att ansluta parallella SCSI-enheter till ett FC-baserat nätverk. De tillhandahåller översättning av SCSI-paket mellan Fibre Channel och Parallel SCSI-enheter, exempel på dessa är Solid State Disk (SSD) eller bandbibliotek. Det bör noteras att på senare tid produceras nästan alla enheter som kan användas inom ett SAN av tillverkare med ett inbyggt FC-gränssnitt för direkt anslutning till lagringsnätverk.

Servrar och lagring

Trots att servrar och lagring är långt ifrån de minst viktiga komponenterna i ett SAN, kommer vi inte att uppehålla oss vid deras beskrivning, eftersom vi är säkra på att alla våra läsare är väl bekanta med dem.

Till sist skulle jag vilja tillägga att den här artikeln bara är det första steget mot lagringsnätverk. För att helt förstå ämnet bör läsaren ägna mycket uppmärksamhet åt funktionerna i hur komponenter implementeras av SAN och programvara hantering, eftersom Storage Area Network utan dem bara är en uppsättning element för att byta lagringssystem som inte ger dig de fulla fördelarna med att implementera ett lagringsnätverk.

Slutsats

Idag är Storage Area Network en ganska ny teknik som snart kan bli utbredd bland företagskunder. I Europa och USA börjar företag som har en ganska stor flotta av installerade lagringssystem redan att byta till lagringsnätverk för att organisera lagring med den bästa totala ägandekostnaden.

Enligt analytikernas prognoser under 2005 ett betydande antal medium och högsta nivån kommer att levereras med ett förinstallerat Fibre Channel-gränssnitt (denna trend kan ses redan idag), och endast för intern anslutning av diskar i servrar kommer ett parallellt SCSI-gränssnitt att användas. Redan idag, när du bygger lagringssystem och köper mellan- och avancerade servrar, bör du vara uppmärksam på denna lovande teknik, särskilt eftersom den idag gör det möjligt att implementera ett antal uppgifter mycket billigare än att använda specialiserade lösningar. Dessutom, om du investerar i SAN-teknik idag, kommer du inte att förlora din investering i morgon eftersom Fibre Channels funktioner skapar stora möjligheter att dra nytta av din investering idag in i framtiden.

P.S.

Den tidigare versionen av artikeln skrevs i juni 2000, men på grund av bristen på massintresse för lagringsnätverksteknik sköts publiceringen till framtiden. Denna framtid har anlänt i dag, och jag hoppas att den här artikeln kommer att uppmuntra läsaren att inse behovet av att gå över till lagringsnätverksteknik som en avancerad teknik för att bygga lagringssystem och organisera dataåtkomst.

Om servrar är universella enheter, uppträdande i de flesta fall
- eller en applikationsserverfunktion (när servern körs specialprogram och intensiva beräkningar pågår),
- eller en filserverfunktion (dvs någon plats för centraliserad lagring av datafiler)

då är DSS (Data Storage Systems) enheter speciellt utformade för att utföra serverfunktioner såsom datalagring.

Behovet av att köpa lagringssystem
förekommer vanligtvis i ganska mogna företag, d.v.s. de som undrar hur
- lagra och hantera information, företagets mest värdefulla tillgång
- säkerställa kontinuitet och skydd mot dataförlust
- öka IT-infrastrukturens anpassningsförmåga

Lagring och virtualisering
Konkurrens tvingar små och medelstora företag att arbeta mer effektivt, utan stillestånd och med hög effektivitet. Byte av produktionsmodeller, tariffplaner, typer av tjänster förekommer allt oftare. Hela verksamheten i moderna företag är "bunden" till informationsteknologi. Affärsbehov förändras snabbt och påverkar IT omedelbart – kraven på IT-infrastrukturens tillförlitlighet och anpassningsförmåga växer. Virtualisering ger dessa möjligheter, men det kräver lagringssystem som är billiga och lätta att underhålla.

Klassificering av lagringssystem efter anslutningstyp

DAS. De första diskarrayerna var anslutna till servrar via SCSI-gränssnitt. I det här fallet kan en server fungera med endast en diskarray. Detta är en direkt lagringsanslutning (DAS - Direct Attached Storage).

NAS. För mer flexibel strukturorganisation datorcenter- så att varje användare kan använda vilket lagringssystem som helst - är det nödvändigt att ansluta lagringssystemet till lokalt nätverk. Detta är NAS - Network Attached Storage). Men utbytet av data mellan servern och lagringssystemet är många gånger mer intensivt än mellan klienten och servern, så i denna version fanns det objektiva svårigheter förknippade med Ethernet-nätverkets bandbredd. Och ur säkerhetssynpunkt är det inte helt korrekt att exponera lagringssystem för det publika nätet.

SAN. Men du kan skapa ditt eget, separata, höghastighetsnätverk mellan servrarna och lagringssystemen. Detta nätverk kallades SAN (Storage Area Network). Hastigheten säkerställs av att det fysiska överföringsmediet där är optik. Specialadaptrar (HBA) och optiska FC-switchar ger dataöverföring med hastigheter på 4 och 8 Gbit/s. Tillförlitligheten hos ett sådant nätverk ökades av redundans (duplicering) av kanaler (adaptrar, switchar). Den största nackdelen är det höga priset.

iSCSI. Med tillkomsten av billiga 1Gbit/s och 10Gbit/s Ethernet-tekniker ser 4Gbit/s optik inte längre så attraktiv ut, särskilt med tanke på priset. Därför används iSCSI-protokollet (Internet Small Computer System Interface) alltmer som en SAN-miljö. Ett iSCSI SAN kan byggas på vilken tillräckligt snabb fysisk bas som helst som stöder IP-protokollet.

Klassificering av datalagringssystem efter användningsområde:

Klass beskrivning
personlig

Oftast är de vanliga 3,5" eller 2,5" eller 1,8" HDD, placerad i ett specialfodral och utrustad USB-gränssnitt och/eller FireWire 1394 och/eller Ethernet och/eller eSATA.
Därmed har vi en bärbar enhet som kan ansluta till en dator/server och utföra funktioner extern lagring. Ibland, för enkelhets skull, läggs funktioner till enheten trådlös åtkomst, skrivare och USB-portar.

liten arbetsgrupp

Vanligtvis är detta en stationär eller bärbar enhet i vilken flera (oftast från 2 till 5) kan installeras. hårddiskar SATA, hot-swappable eller icke-hot-swappable, med Ethernet-gränssnitt. Diskar kan organiseras i arrayer - RAID på olika nivåer för att uppnå hög lagringssäkerhet och åtkomsthastighet. Lagringssystemet har ett specialiserat operativsystem, vanligtvis baserat på Linux, och låter dig skilja åtkomstnivån efter användarnamn och lösenord, organisera diskutrymmeskvoter, etc.
Sådana lagringssystem är lämpliga för små arbetsgrupper, som en ersättning för filservrar.

arbetsgrupp

En enhet som vanligtvis är monterad i ett 19" rack (rackmonterat) i vilket du kan installera 12-24 SATA- eller SAS-hårddiskar med hot-swapbar HotSwap. Den har ett externt Ethernet- och/eller iSCSI-gränssnitt. Enheterna är organiserade i arrayer - RAID för att uppnå hög lagringssäkerhet och åtkomsthastighet Lagringssystemet levereras med specialiserad programvara som låter dig differentiera åtkomstnivåer, organisera diskutrymmeskvoter, organisera BackUp (informationssäkerhetskopiering) etc.
Sådana lagringssystem är lämpliga för medelstora och stora företag och används tillsammans med en eller flera servrar.
företag
En stationär eller 19" rackmonterad enhet som kan rymma upp till hundratals hårddiskar.
Utöver den tidigare klassen kan lagringssystem ha möjlighet att utöka, uppgradera och ersätta komponenter utan att stoppa systemet och övervakningssystemet. Programvaran kan stödja ögonblicksbilder och andra avancerade funktioner.
Sådana lagringssystem är lämpliga för stora företag och ger ökad tillförlitlighet, hastighet och skydd av kritisk data.

high-end företag

Utöver den tidigare klassen kan lagringssystemet stödja tusentals hårddiskar.
Sådana lagringssystem upptar flera 19" skåp, den totala vikten når flera ton.
Lagringssystem är designade för non-stop drift med högsta grad av tillförlitlighet, och lagrar strategiskt viktig data på statlig/företagsnivå.

Frågans historia.

De första servrarna kombinerade i ett fall alla funktioner (som datorer) - både datoranvändning (applikationsserver) och datalagring (filserver). Men eftersom applikationsbehovet för datorkraft växte å ena sidan, och i takt med att mängden bearbetad data växte å andra sidan, blev det helt enkelt obekvämt att placera allt i ett och samma fall. Det visade sig vara mer effektivt att flytta diskarrayerna till separata höljen. Men då uppstod frågan om att ansluta diskarrayen till servern. De första diskarrayerna var anslutna till servrar via ett SCSI-gränssnitt. Men i det här fallet kunde en server bara fungera med en diskarray. Folk ville ha en mer flexibel organisation av datacenterstrukturen - så att vilken server som helst kunde använda vilket lagringssystem som helst. Att ansluta alla enheter direkt till ett lokalt nätverk och organisera datautbyte via Ethernet är naturligtvis en enkel och universell lösning. Men datautbytet mellan servrar och lagringssystem är många gånger mer intensivt än mellan klienter och servrar, så i den här versionen (NAS - se nedan) dök objektiva svårigheter upp relaterade till Ethernet-nätverkets bandbredd. Idén uppstod att skapa ett eget separat höghastighetsnätverk mellan servrarna och lagringssystemen. Detta nätverk kallades ett SAN (se nedan). Det liknar Ethernet, men det fysiska överföringsmediet är optik. Det finns även adaptrar (HBA) som är installerade i servrar och switchar (optiska). Standarder för optisk dataöverföringshastighet är 4Gbit/s. Med advent Ethernet-teknik 1Gbit/s och 10Gbit/s, såväl som iSCSI-protokollet, används Ethernet alltmer som ett SAN-medium.

Företagens affärsprocessers beroende av IT-sektorn växer ständigt. Idag uppmärksammas frågan om kontinuitet i IT-tjänster inte bara av stora företag utan också av representanter för medelstora och ofta små företag.

En av de centrala delarna för att säkerställa feltolerans är ett datalagringssystem (DSS) - en enhet på vilken all information lagras centralt. Lagringssystemet kännetecknas av hög skalbarhet, feltolerans och förmågan att utföra alla serviceoperationer utan att stoppa enheten (inklusive att byta ut komponenter). Men kostnaden för även en grundmodell mäts i tiotusentals dollar. Till exempel, Fujitsu ETERNUS DX100 med 12 skivor Nearline SAS 1Tb SFF (RAID10 6TB) kostar ca 21 000 USD, vilket är mycket dyrt för ett litet företag.

I vår artikel föreslår vi att överväga alternativ för att organisera budgetlagring, som inte är sämre i prestanda och tillförlitlighet jämfört med klassiska system. För att implementera det föreslår vi att du använder CEPH.

Vad är CEPH och hur fungerar det?

CEPH– lagring baserad på fri programvara, är en kombination av diskutrymmen på flera servrar (antal servrar i praktiken mäts i tiotals och hundratals). CEPH låter dig skapa lätt skalbar lagring med hög prestanda och resursredundans. CEPH kan användas både som objektlagring (för att lagra filer) och som en blockenhet (för att betjäna virtuella hårddiskar).

Feltolerans för lagringen säkerställs genom replikering av varje datablock till flera servrar. Antalet samtidigt lagrade kopior av varje block kallas replikeringsfaktorn som standard, dess värde är 2. Lagringsdiagrammet visas i figur 1, som du kan se är informationen uppdelad i block som vart och ett är fördelat över; två olika noder.

Figur 1 - Fördelning av datablock


Om servrarna inte använder feltoleranta diskarrayer, rekommenderas det att använda en högre replikeringsfaktor för tillförlitlig datalagring. Om en av servrarna misslyckas, registrerar CEPH otillgängligheten av datablock (Figur 2) som finns på den, väntar på en viss tid (parametern är konfigurerbar, som standard 300 sekunder), varefter den börjar återskapa de saknade blocken information på en annan plats (Figur 3).

Figur 2 - Fel på en nod


Figur 3 - Återställ redundans


På liknande sätt, om en ny server läggs till i klustret, balanseras lagringen om för att jämnt fylla diskarna på alla noder. Mekanismen som styr processerna för att distribuera informationsblock i CEPH-klustret kallas CRUSH.

För att erhålla hög prestanda för diskutrymme i CEPH-kluster, rekommenderas att använda cachenivåfunktionen (flernivåcachelagring). Dess innebörd är att skapa en separat högpresterande pool och använda den för cachelagring, medan huvudinformationen kommer att placeras på billigare diskar (Figur 4).

Figur 4 - Logisk vy av diskpooler


Caching i flera nivåer kommer att fungera enligt följande: klientskrivförfrågningar skrivs till den snabbaste poolen och flyttas sedan till lagringsnivån. På samma sätt för läsbegäranden - information när den nås kommer att stiga till cachningsnivån och bearbetas. Datan fortsätter att ligga kvar på cachenivån tills den blir inaktiv eller inte längre relevant (Figur 5). Det är värt att notera att cachning kan konfigureras för att vara skrivskyddad, i vilket fall skrivförfrågningar kommer att skrivas direkt till lagringspoolen.

Figur 5 - Verksamhetsprincipen för cash-tearing


Låt oss titta på verkliga scenarier för att använda CEPH i en organisation för att skapa ett datalager. Små och medelstora företag, där denna teknik kommer att vara mest efterfrågad, betraktas som potentiella kunder. Vi beräknade tre scenarier för att använda den beskrivna lösningen:

  1. Ett tillverknings- eller handelsföretag med krav på tillgång till ett internt affärssystem och fillagring på 99,98 % per år, 24/7.
  2. En organisation som behöver distribuera ett lokalt privat moln för sina affärsbehov.
  3. En mycket låg kostnadslösning för att organisera feltolerant blockdatalagring, helt oberoende av hårdvara med 99,98 % årlig tillgänglighet och lågkostnadsskalning.

Användningsfall 1: CEPH-baserat datalager

Låt oss titta på ett verkligt exempel på att använda CEPH i en organisation. Vi behöver till exempel feltolerant högpresterande lagring med en kapacitet på 6 TB, men kostnaderna för även en grundläggande lagringssystemmodell med diskar är ca. $21 000 .

Vi monterar en lageranläggning baserad på CEPH. Vi föreslår att du använder lösningen som servrar Supermicro Twin(Figur 6). Produkten består av 4 serverplattformar i ett enda fodral med en höjd på 2 enheter dupliceras, vilket säkerställer dess kontinuerliga drift. För att genomföra vår uppgift kommer det att räcka med att använda 3 noder, den fjärde kommer att vara i reserv för framtiden.




Figur 6 - Supermicro Twin


Vi konfigurerar varje nod enligt följande: 32 GB RAM, 4 kärnkraftsprocessor 2,5 GHz, 4 SATA-enhet 2 TB vardera för en lagringspool kombineras till 2 RAID1, 2 arrayer SSD-enhet för cachingpoolen kombinerar vi den också till RAID1. Kostnaden för hela projektet visas i tabell 1.

Tabell 1. Komponenter för CEPH-baserad lagring

Tillbehör Pris, USD Antal Kostnad, USD
4 999,28 1 4 999,28
139,28 6 835,68
Processor Ivy Bridge-EP 4-kärnig 2,5 GHz (LGA2011, 10MB, 80W, 22nm) fack 366,00 3 1 098,00
416,00 12 4 992,00
641,00 6 3 846,00
TOTAL 15 770,96

Slutsats: Som ett resultat av att bygga lagringen kommer vi att få en 6Tb diskuppsättning med kostnader i storleksordningen $16 000 , Vad 25 % mindreän att köpa ett minsta lagringssystem, medan du med nuvarande kapacitet kan köra virtuella maskiner som arbetar med lagring och därigenom spara på inköp av ytterligare servrar. I huvudsak är detta en komplett lösning.

Servrarna som lagringen är uppbyggd av kan användas inte bara som lagring för hårddiskar, utan också som lagringsmedia virtuella maskiner eller applikationsservrar.

Användningsfall 2: Bygga ett privat moln

Utmaningen är att distribuera infrastrukturen för att bygga ett privat moln till minimal kostnad.

Bygger även ett litet moln bestående av till exempel 3 bärare på ungefär $36 000 : 21 000 USD – kostnad för lagring + 5 000 USD för varje server med 50 % kapacitet.

Genom att använda CEPH som lagring kan du kombinera dator- och diskresurser på en hårdvara. Det vill säga, det finns inget behov av att köpa lagringssystem separat - diskar installerade direkt på servrarna kommer att användas för att vara värd för virtuella maskiner.

Kort information:
Den klassiska molnstrukturen är ett kluster av virtuella maskiner, vars funktion tillhandahålls av två huvudhårdvarukomponenter:

  1. Datordel (beräkning) - servrar fyllda med RAM och processorer, vars resurser används virtuella maskiner för beräkningar
  2. Datalagringssystem (lagring) – en enhet fylld med hårddiskar, där all data lagras.

Vi använder samma Supermicro-servrar som utrustning, men installerar fler kraftfulla processorer8-kärnig med en frekvens på 2,6 GHz, samt 96 GB RAM per nod, eftersom systemet kommer att användas inte bara för att lagra information, utan också för att köra virtuella maskiner. Vi tar en uppsättning diskar som liknar det första scenariot.

Tabell 2. CEPH-baserade privata molnkomponenter

Tillbehör Pris, USD Antal Kostnad, USD
Supermicro Twin 2027PR-HTR: 4 hot-pluggable system (noder) i en 2U formfaktor. Dual socket R (LGA 2011), upp till 512 GB ECC RDIMM, integrerad IPMI 2.0 med KVM och dedikerat LAN. 6x 2,5" Hot-swap SATA HDD-fack. 2000W redundanta nätaggregat 4 999,28 1 4 999,28
Modul Samsung minne DDR3 16GB Registrerad ECC 1866Mhz 1,5V, Dual rank 139,28 18 2 507,04
Processor Intel Xeon E5-2650V2 Ivy Bridge-EP 8-kärnig 2.6GHz (LGA2011, 20MB, 95W, 32nm) fack 1 416,18 3 4 248,54
Hårddisk SATA 2TB 2,5" Enterprise Kapacitet SATA 6Gb/s 7200rpm 128Mb 512E 416 12 4 992,00
Fast tillstånd SSD-enhet 2,5"" 400GB DC S3710-serien. 641 6 3 846,00
TOTAL 20 592,86

Det sammansatta molnet kommer att ha följande resurser, med hänsyn till att upprätthålla stabilitet om den första noden misslyckas:

  • Bagge: 120 GB
  • Diskutrymme 6000 GB
  • Fysiska processorkärnor: 16 st.

Det sammansatta klustret kommer att kunna stödja cirka 10 medelstora virtuella maskiner med följande egenskaper: 12 GB RAM / 4 processorkärnor / 400 GB diskutrymme.

Det är också värt att tänka på att alla 3 servrarna bara är 50% fulla och, om nödvändigt, kan de kompletteras, vilket ökar mängden resurser för molnet med 2 gånger.

Slutsats: Som du kan se har vi fått både ett fullfjädrat feltolerant kluster av virtuella maskiner och redundant datalagring - felet på någon av servrarna är inte kritiskt - systemet kommer att fortsätta att fungera utan att stanna, samtidigt som kostnaden för lösningen är cirka 1,5 gånger lägreän att köpa lagringssystem och enskilda servrar.

Användningsfall 3: Bygga ett ultralågkostnadsdatalager

Om budgeten är helt begränsad och det inte finns några pengar för att köpa utrustningen som beskrivs ovan, kan du köpa begagnade servrar, men du bör inte spara på diskar - det rekommenderas starkt att köpa nya.

Vi föreslår att du överväger följande struktur: köpt 4 servernoder, varje server har 1 SSD-enhet för cachning och 3 SATA-enheter. Supermicro-servrar med 48 GB RAM och processorer i 5600-serien kan nu köpas för ca. $800 .

Diskarna kommer inte att sättas ihop till feltoleranta arrayer på varje server, utan kommer att presenteras som en separat enhet. I detta avseende, för att öka lagringens tillförlitlighet, kommer vi att använda en replikeringsfaktor på 3. Det vill säga att varje block kommer att ha 3 kopior. Med denna speglande arkitektur SSD-enheter ingen cache krävs, eftersom information automatiskt dupliceras till andra noder.

Tabell 3. Förvaringskomponenter

Slutsats: Vid behov kan denna lösning använda större diskar, eller ersätta dem med SAS om du behöver få maximal prestanda för DBMS. I i detta exempel Resultatet är 8 TB lagring med mycket låg kostnad och mycket hög feltolerans. Priset på en terabyte visade sig vara 3,8 gånger billigareän att använda industriell lagring för $21 000.

Sluttabell, slutsatser

Konfiguration Lagringssystem Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) Lagringssystem Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) + Supermicro Twin Vårt scenario 1: CEPH-baserad lagring Vårt scenario 2: bygga ett privat moln Vårt scenario 3: bygga ultralågkostnadslagring
Användbar volym, GB 6 000 6 000 6 000 6000 8 000
Pris, USD 21000 36000 15 770 20 592 7 324
Kostnad 1 GB, USD 3,5 6 2,63 3,43 0,92
Antal IOP* (70 % läs/30 % skriv, 4K-blockstorlek) 760 760 700 700 675
Syfte Lagring Lagring + Beräkna Lagring + Beräkna Lagring + Beräkna Lagring + Beräkna

*Beräkningen av antalet IOPs utfördes för skapade arrayer av NL SAS-diskar på lagringssystem och SATA-diskar på CEPH-lagring inaktiverades för att säkerställa renheten hos de erhållna värdena. När du använder caching kommer IOP:erna att vara betydligt högre tills cachen är full.

Som ett resultat kan vi säga att tillförlitliga och billiga datalager kan byggas på basis av CEPH-klustret. Som beräkningar har visat är det inte särskilt effektivt att endast använda klusternoder för lagring - lösningen är billigare än att köpa lagringssystem, men inte mycket - i vårt exempel var kostnaden för lagring på CEPH cirka 25 % mindre än Fujitsu DX100. De verkliga besparingarna känns som ett resultat av att kombinera datordelen och lagringen på en utrustning - i det här fallet blir kostnaden för lösningen 1,8 gånger mindre än när man bygger en klassisk struktur med dedikerad lagring och separata värdmaskiner.

EFSOL implementerar denna lösning enligt individuella krav. Vi kan använda din befintliga utrustning, vilket ytterligare kommer att minska kapitalkostnaderna för att implementera systemet. Kontakta oss så undersöker vi din utrustning för dess användning för att skapa lagringssystem.

Direct-attached storage (DAS) system implementerar den mest välkända typen av sammankoppling. Vid användning av DAS har servern en personlig koppling till lagringssystemet och är nästan alltid den enda användaren av enheten. I det här fallet får servern blockåtkomst till datalagringssystemet, det vill säga den får direkt åtkomst till datablock.

Datalagringssystem av denna typ är ganska enkla och vanligtvis billiga. Nackdel direkt metod anslutning är kort avstånd mellan servern och lagringsenheten. Ett typiskt DAS-gränssnitt är SAS.

Network Attached Storage (NAS)

Nätverksanslutna lagringssystem (NAS), även kända som filservrar, tillhandahåller sina nätverksresurser till klienter över nätverket i form av delade filer eller katalogmonteringspunkter. Klienter använder nätverksfilåtkomstprotokoll som SMB (tidigare känt som CIFS) eller NFS. Filservern använder i sin tur blockåtkomstprotokoll på sin interna lagring för att behandla filförfrågningar från klienter. Eftersom NAS fungerar över ett nätverk kan lagringen vara väldigt långt från klienter. Många nätverksanslutna lagringssystem tillhandahåller ytterligare funktioner, som att ta lagringsbilder, deduplicering eller datakomprimering och annat.

Storage Area Network (SAN)

Ett lagringsnätverk (SAN) ger klienter blockerad åtkomst till data över ett nätverk (som Fibre Channel eller Ethernet). Enheter i ett SAN tillhör inte en server utan kan användas av alla klienter i lagringsnätverket. Det är möjligt att dela upp diskutrymme i logiska volymer som allokeras till individuella värdservrar. Dessa volymer är oberoende av SAN-komponenter och deras placering. Klienter får åtkomst till lagringen med en blockåtkomsttyp, precis som en DAS-anslutning, men eftersom ett SAN använder ett nätverk kan lagringsenheterna vara placerade långt borta från klienterna.

För närvarande använder SAN-arkitekturer SCSI-protokollet (Small Computer System Interface) för att överföra och ta emot data. Fibre Channel (FC) SAN:er kapslar in SCSI-protokollet inom Fibre Channel-ramar. Lagringsnätverk som använder iSCSI (Internet SCSI) använder SCSI TCP/IP-paket som transport. Fibre Channel over Ethernet (FCoE) kapslar in Fibre Channel-protokollet i Ethernet-paket med relativt sett ny teknologi DCB (Data Center Bridging), som ger en uppsättning förbättringar av traditionellt Ethernet och kan för närvarande distribueras på 10GbE-infrastruktur. Eftersom var och en av dessa teknologier tillåter applikationer att få tillgång till datalagring med samma SCSI-protokoll, blir det möjligt att använda dem alla i ett företag eller migrera från en teknik till en annan. Applikationer som körs på servern kan inte skilja mellan FC, FCoE, iSCSI eller ens skilja mellan DAS och SAN.

Det är mycket diskussion om valet av FC eller iSCSI för att bygga ett lagringsnätverk. Vissa företag fokuserar på den låga kostnaden för initial iSCSI SAN-distribution, medan andra väljer den höga tillförlitligheten och tillgängligheten av Fibre Channel SAN. Även om low-end iSCSI-lösningar är billigare än Fibre Channel, eftersom iSCSI SAN-prestanda och tillförlitlighet ökar, försvinner kostnadsfördelen. Som sagt, det finns några FC-implementationer som är enklare att använda än de flesta iSCSI-lösningar. Därför beror valet av en viss teknik på affärskrav, befintlig infrastruktur, expertis och budget.

De flesta stora organisationer som använder lagringsnätverk väljer Fibre Channel. Dessa företag kräver vanligtvis beprövad teknik, har höga genomströmningskrav och har budgeten för att köpa den mest pålitliga och produktiva utrustningen. De har också personal för att hantera SAN. Vissa av dessa företag planerar att fortsätta investera i Fibre Channel-infrastruktur, medan andra investerar i iSCSI-lösningar, särskilt 10GbE, för sina virtualiserade servrar.

Mindre företag är mer benägna att välja iSCSI på grund av lågkostnadsbarriären för inträde, samtidigt som de ger dem möjlighet att skala ut sitt SAN ytterligare. Lågkostnadslösningar använder vanligtvis 1GbE-teknik; 10GbE-lösningar är betydligt dyrare och betraktas som regel inte som ett SAN på ingångsnivå.

Unified Storage

Universella lagringssystem (Unified Storage) kombinerar NAS- och SAN-tekniker i en enda integrerad lösning. Dessa universella lagringsenheter tillåter både block- och filåtkomst till delade resurser, och de är också lättare att hantera med centraliserad programvara.

I det enklaste fallet består ett SAN av lagringssystem, switchar och servrar sammankopplade med optiska kommunikationskanaler. Förutom direktdisklagringssystem kan du ansluta diskbibliotek, bandbibliotek (streamers), enheter för att lagra data på optiska diskar (CD/DVD och andra) etc. till SAN.

Ett exempel på en mycket tillförlitlig infrastruktur där servrar är anslutna samtidigt till ett lokalt nätverk (vänster) och ett lagringsnätverk (höger). Detta schema ger tillgång till data som finns på lagringssystemet i händelse av fel på någon processormodul, switch eller åtkomstväg.

Genom att använda SAN kan du tillhandahålla:

  • centraliserad resurshantering av servrar och datalagringssystem;
  • ansluta nya diskarrayer och servrar utan att stoppa hela lagringssystemet;
  • använda tidigare köpt utrustning i samband med nya datalagringsenheter;
  • snabb och tillförlitlig åtkomst till datalagringsenheter på stora avstånd från servrar, *utan betydande prestandaförluster;
  • påskynda processen för säkerhetskopiering och återställning av data - BURA.

Berättelse

Utvecklingen av nätverksteknologier har lett till uppkomsten av två nätverkslösningar för lagringssystem – Storage Area Network (SAN) för datautbyte på blocknivå som stöds av klientfilsystem, och servrar för lagring av data på filnivån Network Attached Storage (NAS). För att skilja traditionella lagringssystem från nätverk, föreslogs en annan retronym - Direct Attached Storage (DAS).

De successiva DAS, SAN och NAS som har dykt upp på marknaden återspeglar den föränderliga kommunikationskedjan mellan applikationerna som använder data och byten på media som innehåller dessa data. En gång i tiden läste och skrev applikationsprogram själva block, då dök drivrutiner upp som en del av operativ system. I moderna DAS, SAN och NAS består kedjan av tre länkar: den första länken är skapandet av RAID-arrayer, den andra är bearbetningen av metadata som gör att binära data kan tolkas i form av filer och poster, och den tredje är tjänster för att tillhandahålla data till applikationen. De skiljer sig åt i var och hur dessa länkar implementeras. I fallet med DAS är lagringssystemet "bart" det ger bara möjlighet att lagra och komma åt data, och allt annat görs på serversidan, med början i gränssnitt och drivrutiner. Med tillkomsten av SAN överförs RAID-tillhandahållandet till lagringssystemsidan allt annat förblir detsamma som i fallet med DAS. Men NAS skiljer sig genom att metadata också överförs till lagringssystemet för att säkerställa filåtkomst här kan klienten bara stödja datatjänster.

Framväxten av SAN blev möjlig efter att Fibre Channel (FC)-protokollet utvecklades 1988 och godkändes av ANSI som standard 1994. Termen Storage Area Network går tillbaka till 1999. Med tiden gav FC plats för Ethernet, och IP-SAN-nätverk med iSCSI-anslutningar blev utbredda.

Idén med en nätverksansluten lagringsserver (NAS) tillhör Brian Randall från Newcastle University och implementerades i maskiner som körde en UNIX-server 1983. Den här idén var så framgångsrik att den togs upp av många företag, inklusive Novell, IBM och Sun, men ersatte till slut ledarna av NetApp och EMC.

1995 utvecklade Garth Gibson principerna för NAS och skapade objektlagringssystem (OBS). Han började med att dela upp alla diskoperationer i två grupper, en som inkluderade de som utfördes oftare, såsom läsning och skrivning, och den andra som utfördes mer sällan, som operationer med namn. Han föreslog sedan en annan behållare utöver block och filer, som han kallade ett objekt.

OBS har en ny typ av gränssnitt, det kallas objektbaserat. Klientdatatjänster interagerar med metadata med hjälp av Object API. OBS lagrar inte bara data, utan stöder också RAID, lagrar metadata relaterat till objekt och stöder objektgränssnittet. DAS och SAN och NAS och OBS samexisterar över tid, men varje åtkomsttyp är mer lämpad för en specifik typ av data och applikation.

SAN arkitektur

Nätverks topologi

SAN är ett höghastighetsdatanätverk designat för att ansluta servrar till lagringsenheter. En mängd olika SAN-topologier (punkt-till-punkt, Arbitrated Loop och switching) ersätter traditionella server-till-lagring-bussanslutningar och ger större flexibilitet, prestanda och tillförlitlighet över dem. SAN-konceptet är baserat på möjligheten att ansluta vilken som helst av servrarna till valfri datalagringsenhet som körs med Fibre Channel-protokollet. Principen för interaktion mellan noder i ett SAN med punkt-till-punkt-topologier eller omkoppling visas i figurerna. I ett Arbitrated Loop SAN sker dataöverföring sekventiellt från nod till nod. För att påbörja dataöverföringen initierar den sändande enheten medling för rätten att använda dataöverföringsmediet (därav namnet på topologin - Arbitrated Loop).

Transportbasen för SAN är Fibre Channel-protokollet, som använder både koppar- och fiberoptiska enhetsanslutningar.

SAN komponenter

SAN-komponenter klassificeras enligt följande:

  • Datalagringsresurser;
  • Enheter som implementerar SAN-infrastruktur;

Värdbussadaptrar

Lagringsresurser

Lagringsresurser inkluderar diskarrayer, bandenheter och Fibre Channel-bibliotek. Lagringsresurser realiserar många av sina möjligheter endast när de ingår i SAN. Diskarrayer alltså överklass kan replikera data mellan matriser över Fibre Channel-nätverk, och bandbibliotek kan överföra data till band direkt från diskarrayer med ett Fibre Channel-gränssnitt, förbi nätverket och servrarna (Serverlös säkerhetskopiering). De mest populära på marknaden är diskarrayer från EMC, Hitachi, IBM, Compaq (Storage Works-familjen, som Compaq ärvde från Digital), och bland bandbibliotekstillverkare bör StorageTek, Quantum/ATL och IBM nämnas.

Enheter som implementerar SAN-infrastruktur

Enheter som implementerar SAN-infrastrukturen är Fibre Channel-switchar (FC-switchar), hubbar (Fibre Channel Hub) och routrar (Fibre Channel-SCSI-routrar används för att kombinera enheter som arbetar i Fibre Channel Arbitrated Loop (FC_AL)-läge). Användningen av hubbar gör att du kan ansluta och koppla bort enheter i en slinga utan att stoppa systemet, eftersom hubben automatiskt stänger slingan om en enhet kopplas bort och automatiskt öppnar slingan om en ny enhet ansluts till den. Varje loopändring åtföljs av en komplex process för dess initialisering. Initieringsprocessen är flerstegs, och tills den är klar är datautbyte i slingan omöjligt.

Alla moderna SAN är byggda på switchar, vilket möjliggör en fullfjädrad nätverksanslutning. Switchar kan inte bara ansluta Fibre Channel-enheter, utan också begränsa åtkomsten mellan enheter, för vilka så kallade zoner skapas på switchar. Enheter placerade i olika zoner kan inte kommunicera med varandra. Antalet portar i ett SAN kan ökas genom att koppla switchar till varandra. En grupp sammankopplade växlar kallas fiberkanaltyg eller helt enkelt tyg. Kopplingarna mellan switcharna kallas Interswitch Links, eller förkortat ISL.

programvara

Programvaran låter dig implementera redundans av serveråtkomstvägar till diskarrayer och dynamisk belastningsfördelning mellan sökvägar. För de flesta diskarrayer finns det ett enkelt sätt att fastställa att portar som är tillgängliga via olika kontroller tillhör samma disk. Specialiserad programvara upprätthåller en tabell över åtkomstvägar till enheter och säkerställer att vägar kopplas bort i händelse av ett fel, ansluter dynamiskt nya vägar och fördelar belastningen mellan dem. Som regel erbjuder diskarraytillverkare specialiserad programvara av denna typ för sina matriser. VERITAS Software producerar VERITAS Volume Manager-mjukvara, designad för att organisera logiska diskvolymer från fysiska diskar och tillhandahålla redundans för diskåtkomstvägar, samt lastfördelning mellan dem för de flesta kända diskarrayer.

Protokoll som används

Lågnivåprotokoll används i lagringsnätverk:

  • Fibre Channel Protocol (FCP), SCSI-transport över Fibre Channel. Används oftast på det här ögonblicket protokoll Finns i alternativen 1 Gbit/s, 2 Gbit/s, 4 Gbit/s, 8 Gbit/s och 10 Gbit/s.
  • iSCSI, SCSI-transport över TCP/IP.
  • FCoE, FCP/SCSI transport över rent Ethernet.
  • FCIP och iFCP, inkapsling och överföring av FCP/SCSI i IP-paket.
  • HyperSCSI, SCSI-transport över Ethernet.
  • FICON transport över Fibre Channel (används endast av stordatorer).
  • ATA över Ethernet, ATA-transport över Ethernet.
  • SCSI- och/eller TCP/IP-transport över InfiniBand (IB).

Fördelar

  • Hög tillförlitlighet för åtkomst till data som finns på externa lagringssystem. Oberoende av SAN-topologin från de lagringssystem och servrar som används.
  • Centraliserad datalagring (tillförlitlighet, säkerhet).
  • Bekväm centraliserad växling och datahantering.
  • Flytta tung I/O-trafik till ett separat nätverk – avlastning av LAN.
  • Hög prestanda och låg latens.
  • Skalbarhet och flexibilitet hos det logiska SAN-tyget
  • Den geografiska storleken på ett SAN, till skillnad från klassisk DAS, är praktiskt taget obegränsad.
  • Möjligheten att snabbt distribuera resurser mellan servrar.
  • Möjligheten att bygga feltoleranta klusterlösningar utan extra kostnader baserat på ett befintligt SAN.
  • Enkelt schema Reserv exemplar– all data finns på ett ställe.
  • Tillgänglighet ytterligare egenskaper och tjänster (ögonblicksbilder, fjärrreplikering).
  • Hög grad av SAN-säkerhet.

Att dela lagringssystem förenklar vanligtvis administrationen och ger en hel del flexibilitet, eftersom kablar och diskarrayer inte behöver fysiskt transporteras och återanslutas från en server till en annan.

En annan fördel är möjligheten att starta upp servrar direkt från lagringsnätverket. Med denna konfiguration kan du snabbt och enkelt byta ut en felaktig