Opslag van data: Duurzaam, Duurzamer, Duurzaamst

Onlangs hadden NCDD Deelnemers Laila Fettah, Ronald Meijer en Jan Schravesande van IBM een boeiend gesprek over duurzaamheid met een storage productmanager. Dit resulteerde in een paar interessante observaties die kunnen helpen om het storage landschap verder te verduurzamen. Deze inspiratie delen we graag met het netwerk van de NCDD. 

Als het gaat om duurzame opslag zijn er twee mogelijkheden: Solid state disks (SSDs) of tape. Spinning disks zijn goedkoop maar niet duurzaam. Ook al laat je je disk met een lagere snelheid draaien, het blijft zowel qua energieverbruik als circulariteit de minste van de drie opslagmogelijkheden. SSDs zijn prijzig, bevatten veel schaarse materialen, maar zijn wel razendsnel. Tapes zijn goedkoop, voor 99% recyclebaar plastic, gaan lang mee, maar zijn niet heel snel. Maar wat is niet snel?  

Duurzaam: Solid State Disks 

Over de solid state disk (SSD), ook wel flash storage genoemd want er komt geen disk aan te pas, had de productmanager interessante informatie. De “disks” zijn energiezuinig omdat de spanning verlaagd wordt in rust. Maar tot onze grote verbazing heeft dat een geweldig bijeffect, nl. dat de “disks” 2x zo lang meegaan! Twee keer! Dus geen 4 maar 8 jaar! Dat is financieel ook heel interessant en met de wetenschap dat in technische apparaten zo’n 80% van de CO2 uitstoot zit in de productie en het transport dan is dat in dit geval 40%. Nou dat scheelt geweldig. Verder wist zij te vermelden dat de compressie en encryptie op het storage devices zelf plaatsvinden en niet in de controller, dat ontlast de controller en in de flash storage is dat veel efficiënter waardoor encryptie en compressie sneller is en minder energie verbruikt. We vonden het briljant, je moet er maar opkomen! 

Duurzamer: Tape als active archive 

Vervolgens kijken we naar de tape library, in de wandelgangen noemen we dat de tape robot, maar een library klinkt een stuk intelligenter. Officieel is de library het gedeelte waar de tapes zijn opgeslagen en de robot is de arm die de tapes ophaalt en weer terugzet. Wist je dat het laden van een tape, maar ongeveer 10 seconden in beslag neemt! We noemen dit de robotic mount time. Dan moet de tape nog naar de juiste plaats spoelen, de drive load time, dat duurt ongeveer 8 seconden. Het lezen van de data gaat vervolgens razendsnel (400MB/s) dus met een goede 20 seconden heb je dat bestand terug of die film. 400 MB/s haalt jouw harde schijf overigens niet. Ik wou dat ik zo snel de juiste informatie in mijn papieren archief terug kon vinden! Tape is een ideaal opslag middel voor e-mails, documenten, images en video’s, in de praktijk worden die weinig tot niet gebruikt. Dat is zo’n 80-90% van al je data. Dus alle documenten op je harde schijf die langer dan 1 maand niet geraadpleegd zijn kunnen met gemak op tape. En uiteraard maak je je back-up op tape, hoe vaak heb jij ooit een back-up teruggezet? En toch, air-gaped tape heeft menig bedrijf gered bijvoorbeeld na een randsomeware aanval. Daarnaast is tape ook goedkoop en zeer duurzaam. Een tape drive gaat 2x zo lang mee als een harde schijf! Het instaleren van een tape robot is heel simpel. Je hebt ze al in een rack formaat en je koppelt ze aan je virtuele storage en storage tiering software regelt automatisch de opslag! 

Hoeveel CO2 uitstoot bespaar je nu? 

Storage devices zijn niet de grootse energieverbruikers in je datacenter, maar ook niet verwaarloosbaar. Opvallend is dat de hoeveelheid storage enorm groeit, maar het energieverbruik gelijk blijft. Is dat eindig? Waarschijnlijk kunnen we nog wel even vooruit omdat de dichtheid van technologie nog wel wat vooruit kan, maar net als bij CPU’s gaan we binnen een paar jaar tegen grenzen aanlopen.   

Het vergelijken van verschillende storage type en CO2 uitstoot is complex. Je moet rekening moet houden met de performance (IOPs) en workload (veel of weinig schrijfactiviteit, gebruik over 24 uur, type schijven die je gebruikt, etc.) Mocht jij concrete informatie hebben, dan houden we ons aanbevolen! Iets voor de volgende nieuwsbrief? 

Duurzaamst 

Ook werd er gesproken over manieren om de data die je hebt op een duurzame manier op te slaan. Wat natuurlijk het duurzaamst is, is om de data die je moet opslaan te beperken tot datgene wat je werkelijk gebruikt of dat van waarde is voor je bedrijf. Een hele goede informatie huishouding helpt hierbij! 

Zeker als je je realiseert dat:  

  • 65% van de opgeslagen data niet meer wordt gebruikt 
  • 70% van de data haar waarde is verloren na één uur. 

Dus wat wel relevant is, is beperkt.  

Bewaak de levenscyclus van je data goed. Als het niet meer relevant is of niet meer van waarde ……vernietigen! Dat klinkt natuurlijk heel eng maar het is absoluut noodzakelijk om de databerg te beperken. We hebben nu eenmaal een niet te stillen honger ontwikkelt voor data en met AI is deze honger alleen maar groter geworden. 

Wil je het dan toch langer bewaren voor de ‘zekerheid’? Sla het dan op tape op!