Tape is nog lang niet dood

No comments »
AUTHOR:
CTO Dell EMC Nederland

In april dit jaar publiceerde Samuel Greengard een interessant artikel over de toekomst van data storage. Het aardige is dat in dat artikel tape in alle vergelijkingen steeds een belangrijke rol speelt en een interessante lange termijn opslagmethode blijft. Tape innoveert nog elk jaar en in 2017 werd 1 miljard Petabyte TLO gebaseerde tape-capaciteit verkocht; vijfmaal zoveel als in 2007. Het zijn vooral technische en praktische redenen dat tape vooralsnog niet in de geschiedenis is verdwenen. Het medium is relatief goedkoop en een tape robot kan een ongelimiteerd aantal tapes of cartridges lezen. Vandaag de dag kan een moderne tape robot bibliotheek 278 petabytes data bevatten. Dezelfde data opgeslagen op CD’s zou een bibliotheek van 400 miljoen disks vragen.

Net zoals het lang geroepen ‘het mainframe is dood’ en later ‘de pc is dood’, blijkt dat oude techniek nog steeds een serieuze plek inneemt in het informatielandschap. Voor tape geldt hetzelfde, het zal de komende decennia een serieuze vorm van data-opslag blijven. Onze wereld van IT blijkt vaak bij de komst van nieuwe mogelijkheden vaak een én-énin plaats van een óf-ófwereld te zijn. We krijgen er een nieuwe mogelijkheid bij, maar die zal de andere mogelijkheden mogelijk wel (deels) verdringen maar niet overbodig maken. De keuze van de beste en meest effectieve techniek komt uiteindelijk voort uit de typische behoeften voor een bepaald proces of toepassing.

Nieuwe jasjes
Heel veel oude methoden komen soms decennia later terug in een nieuw jasje. De enkele cloud was de ultieme oplossing: het mainframe van het internet. Totdat er meer en specifiekere clouds kwamen, toen was dat centrale voordeel opeens minder groot en data-technisch zelfs complexer. De edge ontwikkelt zich momenteel als de client-server van het internet. Lokale kleine datacenters omringd door lokale cliënts. Dat kunnen zowel clusters van dingen als mensen zijn die aan de randen van de infrastructuur in een client-server configuratie ontstaan.

Maar één ding is zeker, de hoeveelheid data die we genereren en willen opslaan zal voorlopig blijven groeien. Ongeveer 90% van alle opgeslagen data wordt nooit meer geraadpleegd. Maar beslissen het dan maar níet op te slaan, níet te archiveren of écht weg te gooien, doen we ook niet. Dus ‘voor het geval dat’blijft de behoefte aan mega-opslag van data groeien. Dan is en blijft tape nog steeds een prima keuze. De uitdaging voor elke lange termijn opslag is het reduceren van fout codes. Hoe groter de niet-herstelbare bit error rate, hoe groter de kans op het verlies van data. En tape heeft in LTO 7/8 een bit error ratevan 1:1018 dat een fout oplevert voor elke 1,25 Exabyte. Voor disks ligt dat een stuk lager op 125 Terabyte. Dus tape is op lange termijn 10 keer accurater dan de beste harddrive en 100 keer beter dan de laatste SSD’s.

Lange termijn opslag
Tenslotte is er nog een belangrijke overweging. Tape is opgeslagen zonder enige verbinding met een netwerk. Een tape moet fysiek benaderd en gelezen worden en als de fysieke opslag robuust genoeg is, is een cyberaanval op een tape bibliotheek bijna onmogelijk. Daarnaast kan moderne tape onder goede omstandigheden 30 tot 50 jaar in goede staat blijven. Voor papier is dat veel langer, daar geldt een minimale bewaartermijn van 500 jaar. Momenteel wordt veel onderzoek gedaan naar DNA-opslag. Dat is beslist geen snelle manier om data op te slaan, maar de informatie opgeslagen in DNA kan duizenden zo niet miljoenen jaren blijven bestaan.

Een andere ontwikkeling is de opslag door met ultrasnelle laserpulsen data te etsen op silicium oppervlakken. Dit geeft naast een enorme data-dichtheid van 360 Terabytes per disk ook een hele lange levensduur. Men heeft berekend dat deze vorm van laser gepulst etsen zelfs een levensduur van miljarden jaren heeft. Het project Silica van Microsoft is gericht op het verder ontwikkelen van deze nieuwe techniek. Hiermee zou het extreem lang opslaan van digitale data werkelijk opgelost worden.

Innovatie
In het IEEE Spectrum ‘Drowning in Data’ van 2018, schreef Mark Lantz, manager Advanced Tape Technologies bij IBM dat de dichtheid van tape-opslag elk jaar groeit. En daar lijkt voorlopig geen einde aan te komen. Het is verrassend dat de capaciteitsgroei elk jaar nog 33% per jaar bedraagt waardoor elke twee tot drie jaar verdubbeling in capaciteit mogelijk blijft. Hij stelde zelfs dat tape wellicht een van de laatste informatietechnieken is die de Wet van Moor blijft volgen. Het is al goedkoop en wordt ook nog steeds goedkoper.  Dat betekent dat ondanks de voortgaande explosie van data, de kosten van tape-opslag gelijk kunnen blijven.

Ooit was innovatie gericht op tape, maar de harddisk nam die positie eind vorige eeuw over. Dit betekende dat door grote R&D-inspanningen de dichtheid van harde schijven enorm toenam. In sommige gevallen meer dan het honderdvoudige van de toenmalige tapes. Maar nu door de komst van SSD’s harddisk research is verminderd, groeit de dichtheid van harde schijven slechts 10 tot 15%. Tape kan met zijn 35% groei dus een grote inhaalslag maken. In laboratoria zijn op nieuwe flexibele dragers opslag-dichtheden aangetoond die tot 20 maal groter zijn.

Toekomst
In 2025 verwacht men een dichtheid van 91 Gb per square inch (data per square inch is de standaard in de tape-wereld) en onderzoekers verwachten dat in 2028 wellicht 200Gb per square inch kan worden bereikt. Dat zijn geen overdreven getallen; experimenten tonen aan dat deze dichtheden goed haalbaar zijn. Als we over toekomstige dataopslag spreken, zal tape-opslag nog decennialang een serieuze opslagtechniek zijn en blijven. En waard om in te blijven investeren.

Niets is belangrijker dan stabiele technische ontwikkelingen te herkennen en te onderkennen. Dat geeft beleidsmakers de kans om op lange termijn te plannen en diepte investeringen te doen in die informatieplatformen. Net zoals de uitkomst van het cloud model zich begint te stabiliseren, zie mijn vorige blog ‘Alle clouds lijken op elkaar’, dient ook een stabilisatie van de data-opslagtechniek zich aan. In een artikel van Searchstorage over de trends van 2019 laat zien dat flash arrays met NVMe fabric capaciteit snel worden geadopteerd in de markt en rond 30% van de storage omzet zal worden en mogelijk blijven.

Ook de ontwikkeling van harddisks staat niet stil. Luchtdichte met helium gevulde harddisks staan dunnere media en lichtere mechanieken toe, die zowel capaciteit als levensduur positief beïnvloeden. Ontwikkeling van micro-actuatoren met nauwkeurigheden onder de micron maakt het mogelijk schrijf/leeskop nauwkeuriger te positioneren. Dit leidt zelfs tot Shingled Magnetic Recording, net als dakpannen liggen de sporen niet meer apart, maar licht over elkaar. Tenslotte ontstaan nieuwe veiligheidstechnieken rond de disk. ‘Instant Secure Erase’, het in milliseconden ontoegankelijk maken van een harddisk. Of ‘Encrypted Signed Firmware’ waardoor alleen door leverancier geleverde code kan draaien op de schijf. Kortom: de storage wereld blijft nog lange tijd een intelligentecombinatie van flash én disk én tape. En juist die noodzakelijke ‘intelligentie’blijft nog lange tijd gedegen storage-vakmanschap vragen.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.