Hur effektivt administrerar vi vår datalagring?
Hur kan man mäta hur effektiv man är på att administrera sin lagring?
Förr i tiden (så långt tillbaka som 8-10 år :)) så fans det ett mätvärde som oftast användes, och detta var antal TB per administratör. Det var ett enkelt mätvärde eftersom diskarna var små och det krävdes några lagringsenheter för att komma upp i volym. Dessutom så var inte datalagringen så konsoliderad som den är idag. Den mesta lagringen var ”inlåst” i direktanslutna diskar (DAS) som ständigt behövde migreras från en server till en annan för att lagringen tog slut och en ny server med fler diskplatser skulle ta vid. Detta medförde att det gick att göra en schablonvolym per lagringsadministratör.
Under åren som gått så har denna siffra ökat, ständigt, från under 1TB till många hundratals TB per lagringsadministratör. Nu är den siffran så löjligt hög att den inte längre är intressant eller relevant. Och är volymen en bra mätpunkt överhuvudtaget?
Om vi tittar på hur diskstorlekarna har ökat de senaste åren och jämför med hur prestandan ökat
Ser vi att det inte är mycket som hänt med prestandan, det är bara att volymen blivit större. Den minsta förbättringstakten på prestandan har varit de senaste åren, en 500GB SATA 7.2krpm kommer ju ha exakt lika många IOPS som en 2TB SATA 7.2krpm.
Jag är medveten om att sequential read/write kommer ha en positiv effekt av 2TB disken i denna jämförelse , underförutsättning att diskarna har lika många plattor. Men idag så är det oftast random access som räknas, även om applikationen gör sekventiella IO så har vi oftast ett virtualiserat datalager, eller konsoliderade lagringssystem som medför att den fysiska disken lik förbannat får random IO.
Är prestanda ett bra mätvärde då?
Eftersom prestandan har varit mer eller mindre densamma de senaste åren så kanske det kan vara ett bra mätvärde. Ponera att en SAS/FC disk på 15Krpm klara 200 IOPS (I/O per second), och våran miljö har ett behov av 20 000 IOPS, det skulle innebära att vi behöver 100 diskar för att tillhandahålla den prestandan. Och 100 diskar medför x antal service timmar och vård. Men det går ju inte heller, eftersom volymen också spelar in…. Om vi inte behöver volymen av 100 diskar så klarar vi ju oss på 4-5 SSD diskar för att hantera denna prestanda… och det krävs ju inte många personer för att hantera detta?
Tillgänglighet då? Det måste ju vara ett bra mätvärde?
Nej, att vilja ha 100% tillgänglighet på data beror både på volym och prestanda. Det krävs färre administratörer för att hålla 100% tillgänglighet på 1TB än vad det kommer att behövas till 100% tillgänglighet på 4PB.
Sen har vi detta med prestanda igen, vad betyder tillgänglighet på data? Att vår disk/LUN går att nå är en självklar mätpunkt på tillgänglighet, men den måste också vara läs & skrivbar med en tillräcklig prestanda. Om vår applikation förväntar sig ett svar från disken på 7ms men disken svarar på 250ms så kommer applikationen att dö! Är vår data verkligen tillgänglig då? Nej!
Så mer prestanda kräver fler diskar, större volym kräver inte alltid fler diskar, men oftast. Det kommer att kräva fler administratörer ju mer det växer, oavsett vilket mål vi sätter på tillgängligheten, så inte heller detta är ett bra mätvärde.
Hur?
Flexibilitet skulle vara idealet (enligt mig). Förmågan att ge verksamheten den lagringsvolymen som den efterfrågar till en tillräckligt bra prestanda vid varje givet ögonblick till det lägsta priset möjligt. Men hur tusan mäter man det?
Kanske vi får nöja oss med att använda antalet fysiska diskar som ett mätvärde? X antal diskar bör kunna administreras och hanteras på Y antal administratörer. Det är inte ett sexigt mätvärde, inte heller ett bra. Men det går att mäta.
Läs även andra bloggares åsikter om Datalagring, storage
Relaterade inlägg:
