Data Computing is de toekomst

No comments »
AUTHOR:
CTO Dell EMC Nederland
CATEGORIES:

Per jaar zien we een constante groei van ongeveer 60%, ook de recessie heeft dit groeicijfer niet veranderd. De hoeveelheid data die we in 2020 creëren zal een factor 44 groter zijn dan vandaag. Stond in het verleden nog relatief veel van deze data ‘netjes’ in databases gerangschikt, tegenwoordig met de groei van clouds staat deze data bijna overal ter wereld, verspreid over vele providers, netwerken en datacenters. Dit betekent dat het verzamelen en analyseren van grote datasets meer moeite kost; eerst moet deze data in de verspreide cloud worden gevonden en binnengehaald. Data mining en het daarna ‘warehousen’ van die data in logische  structuren wordt een steeds complexere, en meer tijdrovende bezigheid.

Reden waarom EMC aan zijn portfolio van oplossingen voor data-opslag, van high end via midrange toepassingen tot wereldwijde cloud opslag, nu een nieuw element heeft toegevoegd: een appliance voor data warehousing en business analtics. Met de acquisitie van Greenplum enkele maanden geleden, is nu een architectuur mogelijk waarbij via immense parallel processen grote hoeveelheden data kunnen worden verzameld en in een warehouse kunnen worden geladen. Greenplum heeft als eerste in de wereld technieken ontwikkeld om op extreem snelle, maar ook grootschalige wijze deze data te laden.

Het laden van het warehouse is geen eenmalige bezigheid. De data groeit en wijzig permanent, dit betekent dat het laden en actueel houden van datawarehouses een dynamische activiteit is die continue doorgaat. En er is vanuit de Business Intelligence wereld een steeds grotere behoefte aan het gestructureerd voor handen hebben van velerlei soorten data. Of dat voor self-service gebruik is, voor specifiek onderzoek of voor de dagelijkse business, duidelijk is dat de wereld niet meer zonder deze data kan leven. EMC gelooft dat data de ‘killer-app’ is voor zowel enterprise computing als (private) cloud computing en dat Data Computing – een verzamelwoord voor data-mining, data-warehousing en data-analysis – onontbeerlijk is om welke organsiatie dan ook goed te laten functioneren.

Met de komst van de cloud komt ook de uitdaging van ‘big data’ problemen. Onze klanten worden geconfronteerd met een tsunami van data die over hen heenkomt. Aan data zelf heb je niet zo veel, het voegt weinig waarde toe. Data moet worden omgezet in informatie wil het werkelijk toegevoegde waarde hebben voor de gebruiker of het proces. Greenplum’s technology is geoptimaliseerd om de data uit gevirtualiseerde private clouds dusdanig te presenteren, dat de individuele gebruiker of de Business Information applicaties deze infomatie direct kunnen gebruiken. Daarom is de ontwikkeling van datawarehouse oplossingen een onlosmakelijk onderdeel van de ‘journey to the cloud’.

Net zoals het een logische stap was om in het VCE (VMware, Cisco, EMC) initiatief bouwblokken te maken waar servers, netwerken, storage en virtualisatie geintegreerd worden geleverd – de vBlocks –  is dit ook voor  Data Warehousing hetgeval. De Greenplum Data Computing Appliance is een bouwblok voor supersnel parallelle data warehousing, met geintegreerde database, servers, storage, netwerken en aansturing die een schaalbaarheid heeft van Terabytes tot Petabytes.  Door nieuwe technieken te gebruiken, zoals large batch en continue real-time loading strategieën, kan deze appliance tot 10 Terabyte per uur data verzamelen, een factor 2 tot 5 hoger dan welke andere data-mining oplossing momenteel in de markt.  Daarnaast heeft deze – specifiek voor virtualisatie en cloud ontwikkelde database – een factor 10 tot 100 hogere performance dan in de markt aanwezige producten. Een sine qua non als men werkelijk ‘big data’  problemen te lijf wil gaan.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.