Data gravity: wat betekent dit voor uw datacenterkeuzes?

Nu datasets groeien en data steeds vaker real-time worden verwerkt, komen bedrijven voor nieuwe uitdagingen te staan. Hoe combineer je data die nu nog in verschillende clouds staan? Welke data verwerk je real-time en houd je dicht bij de locatie waar je de data verzamelt en gebruikt?

Nu datasets snel groeien en data steeds vaker in real-time worden verwerkt, komen bedrijven voor nieuwe uitdagingen te staan. Hoe combineer je data die nu nog in verschillende clouds staan? Welke data verwerk je real-time en houd je daarom dicht bij de locatie waar je de data verzamelt en gebruikt? En welke data kunnen het beste centraal worden opgeslagen? Dit zijn allemaal zaken die meespelen bij de beslissing hoe je IT-strategie en daaruit volgend het datacenterlandschap voor een organisatie er uit moeten zien. 

 

Analyses vinden plaats op locatie waar data wordt verwerkt 

NorthC COO Jarno Bloem merkt dat steeds meer bedrijven advies vragen op dit gebied. “Om goed te begrijpen hoe je IT-strategie eruit moet zien, moet je eerst weten welke impact ‘data gravity’ heeft op het type data dat je organisatie verwerkt.” Data gravity is het groeiend vermogen van data om applicaties en diensten naar zich toe te trekken. Dit heeft alles te maken met de massa van data versus die van applicaties of diensten: vaak zijn de datasets veel groter van omvang dan de applicaties of diensten die deze data verwerken, dus het is efficiënter om die applicaties en diensten te verplaatsen naar de data, in plaats van andersom. 

Bloem: “De hoeveelheid data neemt de komende jaren alleen maar toe. Tegelijkertijd willen bedrijven steeds meer waarde halen uit die data. Daardoor wint data gravity sterk aan betekenis. De locatie waar je data wilt bewerken, bepaalt op welke plaats je rekenkracht en analytische tools nodig hebt. Real-time data wil je vanwege de latency ‘at the edge’ verwerken, andere data verwerk je misschien liever centraal, bijvoorbeeld data in een data lake.”

 

Latency, netwerkkosten en wet- en regelgeving zijn bepalend

De keuze welke data je waar opslaat en verwerkt hangt van meerdere factoren af. De eerste is latency. “Neem bijvoorbeeld diagnostische beelden van een ziekenhuis, zoals MRI-scans en digitale pathologiebeelden. Als een oncoloog bij het stellen van een diagnose een AI-algoritme gebruikt dat de beelden van zijn patiënt vergelijkt met beelden van duizenden soortgelijke patiënten, dan speelt latency geen rol. Het is een ander verhaal met real-time toepassingen. Denk bijvoorbeeld aan een camera bij de overgang van een lopende band naar een machine. De camera controleert of de producten netjes de machine in gaan. Valt er een product om, dan moet de lopende band direct gestopt worden. Er is geen tijd om de beelden van de camera eerst naar een datacenter honderden kilometers verderop te sturen, daar de data te interpreteren en die interpretatie terug te communiceren aan de fabriek voor verdere actie. De latency die dat met zich meebrengt heeft dan allang de nodige chaos veroorzaakt”, zegt Bloem. 

Daarnaast spelen ook netwerkkosten een rol bij de keuze van een datacenterlocatie. Als je alle data voortdurend over grote afstanden gaat versturen, kunnen de netwerkkosten snel oplopen. Zeker nu er steeds meer data-intensieve IoT-apparaten worden gebruikt, zoals bijvoorbeeld camera’s die productieprocessen monitoren. Daarom kiezen veel organisaties voor een regionaal colocatiedatacenter.

Als dan de verwerking van data plaatsvindt in een public cloud, heb je ook nog te maken met wet- en regelgeving. Het is namelijk niet altijd wenselijk of soms zelfs niet toegestaan om data in een public cloud op te slaan, als onduidelijk is in welk fysiek datacenter die data dan staan. In veel gevallen eist de wet dat de data in Nederland of ten minste binnen de EU blijven.

 

Datacenterlandschap met vier typen datacenters

Dit alles maakt dat infrastructuurspecialisten veel beter zullen moeten nadenken over hun datacenterstrategie: op welke fysieke locaties heb ik datacentercapaciteit nodig? De tijd dat één datacenter met een uitwijkdatacenter als back-up voldoende waren, ligt echt achter ons. Bedrijven zullen per toepassing moeten bekijken welke data ze waar willen opslaan en verwerken, afhankelijk van latency, netwerkkosten en wet- en regelgeving. In de praktijk zal er in veel gevallen een landschap ontstaan dat bestaat uit vier typen datacenters:

  • onsiteeen server in een fabriek, op een olieveld, op een boerderij of in een autonoom rijdende auto; 
  • microdatacenters: er zullen in de komende jaren netwerken van microdatacenters ontstaan met een onderlinge afstand van maximaal tien kilometer. Deze vervullen een ultralokale colocatierol; 
  • regionale datacenters: deze bevinden zich op een maximale afstand van 50 kilometer van de locatie waar de data nodig zijn. Deze datacenters bieden een grotere schaalbaarheid en onderscheiden zich door de beveiliging en hoge beschikbaarheid; 
  • metrodatacenters: dit zijn datacenters die een heel grote regio bedienen, bijvoorbeeld heel Nederland of een grootstedelijk gebied in de VS of China. Hier huizen vaak de lokale hubs van grote cloud en content providers. In Nederland is er weinig onderscheid tussen regionale datacenters en metrodatacenters, omdat Nederland qua omvang vergelijkbaar is met een grootstedelijk gebied. 

 

Spilfunctie voor het regionale datacenter

Voor regionale datacenters geldt dat er steeds meer van ze wordt verwacht. Ze fungeren niet meer alleen als nabijgelegen alternatief voor een on-premises datacenter. Ze worden ook een knooppunt tussen verschillende datacenterlocaties. Want enerzijds hebben bedrijven behoefte aan ultralokale opslag en verwerking van data at the edge in een on-site datacenter of microdatacenter. Anderzijds hebben ze data staan in metrodatacenters, denk bijvoorbeeld aan data in een public cloud. Het regionale datacenter kan deze twee omgevingen met elkaar verbinden. Hiermee breidt het regionale datacenter zijn bestaande rol van nabijgelegen alternatief voor een eigen datacenter uit met die van knooppunt tussen verschillende datalocaties. Een cloud- en connectiviteitshub dus.

Organisaties die een landelijke dekking hebben met edge toepassingen, zullen kiezen voor een betrouwbaar netwerk van regionale datacenters. Dit geldt bijvoorbeeld voor bedrijven met meerdere fabrieken op verschillende locaties in ons land of voor dienstverleners die IoT-diensten bieden aan organisaties in heel Nederland. Bijvoorbeeld beveiligingsbedrijven die de bewakingscamera’s van meerdere klanten monitoren.

Meer weten over de impact van data gravity op uw organisatie? Download hier het rapport ‘De impact van data gravity op IT’.  

 

Wilt u meer tips, nieuws en kennisupdates van ons ontvangen?

Aanmelden kennisupdates