Wat is een Data Fabric?
Een nieuw architectuur begrip binnen de wereld van data management en data analytics is een Data Fabric. Het concept is bekend geworden door de opkomst van de cloud en de mogelijkheden die deze biedt voor (big) data toepassingen. Een Data Fabric is niet één specifieke tool. Het is eerder een technisch concept, wat als marketing term gebruikt wordt. Omdat verschillende tool leveranciers hun eigen invulling geven aan dit concept, is het lastig om eenduidig te beschrijven wat een Data Fabric concreet is. Daarom volgt hier een samenvatting van kenmerken die voorkomen in diverse marketing uitingen.
Een Data Fabric is een centrale geïntegreerde laag die toegang biedt tot de data van een bedrijf. De Data Fabric richt zich hierbij niet op één aspect hiervan, maar op de end-to-end flow van bronsysteem tot de toepassing voor een bepaald doel. De Data Fabric omgeving vormt als het ware een uniforme technische laaag die toegang biedt tot de onderliggende services. De services hebben betrekking op het verplaatsen, opslaan, analyseren, rapporteren en managen van de data. De Data Fabric is typisch business unit, land en netwerk (cloud of intern) overschrijdend. Schaalbaarheid is een belangrijke factor hierbij. Een data fabric bevindt zich meestal in de cloud, omdat de meeste cloud platforms allerlei schaalbare oplossingen bieden voor data data storage, data replicatie en data virualisatie over landen en werelddelen heen. Een geïntegreerde security laag is ook iets wat vaak in cloud platforms aanwezig is. Geïntegreerde security is een belangrijk onderdeel van een Data Fabric.
Vervangt een Data Fabric het Data Warehouse / Data Lake?
Bij nieuwe technologische architectuur concepten rijst altijd de vraag: vervangt deze technologie alle voorgaande technologieen? Met andere woorden: Is het Data Warehouse nu ouderwets en overbodig? Of kan het Data Lake, wat het Data Warehouse verving, nu ook alweer naar het grof vuil? Het antwoord was altijd en is nu nog steeds: nee! Een Data Warehouse is nog steeds relevant en het zelfde geldt voor het Data Lake. Data Warehouse en Data Lake zullen eerder onderdeel worden van een Data Fabric omgeving. De Data Bronnen, ETL Processen (data verplaatsing) en Data Marts (opslag) zijn typisch zaken die onderdeel vormen van een Data Fabric omgeving. De toegevoegde waarden die een Data Fabric laag kan brengen zijn o.a.:
- Uniforme toegang tot Data Bronnen, Data Transport, Data Opslag en Data Consumptie toepassingen
- Geïntegreerde security laag
- Geïntegreerde Data Lineage
- Ondersteuning voor ongestructureerde data
- Data Discovery functionaliteit
- Data Catalogs
- Data Virtualisatie
- Integratie met Artificial Intelligence en Machine Learning oplossingen