Jämför byggandet av ett modernt data estate med att bygga ett hus. Om ni saknar fast grund, eller om ni kommit så lång som till andra våningen innan ni upptäcker att ni glömt installera stammarna, ja då får ni problem. I den här artikeln ger vi dig grunderna till hur man bygger ett långsiktigt och modernt data estate vilket kan bidra till att ökad tillväxt i er organisation.
Från data warehouse (datalager) till data estate
De flesta företag har idag redan investerat i någon form av datamiljö. Vanligtvis handlar det om traditionella datalager (data warehouse). Ett datalager är ett centralt förvar av integrerad data från olika datakällor som används för att rapportera och analysera data. Traditionella datalager har dock vissa funktionella begränsningar.
Traditionella datalager har vissa funktionella begränsningar
Det flesta datalager uppdateras i slutet av dagen i ett och samma jobb, istället för som transaktionella datajobb i realtid. Arbete i en strukturerad datamiljö måste också hållas inom ett ramverk av de skapade strukturerna: statiska datamängder med begränsad möjlighet till mer detaljerade vyer.
Det blir därför allt vanligare med organisationer som utforskar möjligheterna med ett mer modernt data estate.
“Ett data estate är helt enkelt en infrastruktur för att hjälpa företag att systematiskt hantera all sina företagsdata. Ett data estate kan utvecklas lokalt, i molnet eller som en kombination av båda (hybrid). Härifrån kan organisationer lagra, hantera och utnyttja sina analysdata, affärsapplikationer, social data, kundrelationssystem, funktionell affärs- och avdelningsdata, sakernas internet (IoT) etc.” skriver Forbes i artikeln ‘ Why The Modern-Day Corporation Should Consider A Data Estate’.
Ladda även ner e-boken: Checklista för att bygga ett modernt data estate
Har ni ett traditionellt datalager och undrar hur ni på ett strategiskt sätt kan expandera dess funktionalitet samt uppgradera prestanda?
Här går vi igenom de åtta strategiska stegen som hjälper till att förstå vad som krävs för att bygga ett modernt data estate.
- Definiera mål i termer av data- och analysmognad
Hur mogen är er organisation inom området datakonsumtion? Vad vill ni uppnå med ert data estate i termer av analytiska färdigheter?
I detta steg frågar ni er vad som idag fungerar i eran befintliga miljö och vad som inte fungerar. Ni beskriver vad det finns för flaskhalsar, smärtpunkter eller andra problem inom organisationen. Efter detta steg ska ni ha klart för er vad ni vill åstadkomma, vilka smärtpunkter som finns samt identifierat var den lågt hängande frukten finns.
- Definiera verksamhetens behov för såväl idag som för morgondagen
Detta steg handlar inte om IT. Istället bör fokus ligga helt och hållet på verksamhetsbehov. I transformeringen av ett datalager (data warehouse) till ett modernt data estate är det största misstaget man kan göra att försöka replikera den existerande miljön.
Ni måste ställa de rätta frågorna till samtliga intressenter, från sälj till marknad och HR till verksamhet.
- Vad vill ni mäta?
- Vart är vår verksamhet på väg?
- Vilka trender ser vi?
- Hur kommer en digital transformering påverka insikter från data?
Efter kartläggning av organisationens olika verksamhetsområden kan det vara fördelaktigt för att skapa en prioriteringsordning och på så sätt kunna börja lite smått.
- Beskriv kärnverksamheten och data processer
Ni har nu definierat era mål i termer av data- och analytisk mognad och prioriterat företagets behov. Nu är det dags att identifiera de tillgängliga datakällorna – och vilken data som initialt ska få en plats i det nya datamiljön till följd av prioritetsordningen från steg två.
I detta steg handlar det både om verksamhetsprocesser och dataprocesser eftersom de båda är sammanvävda. Ni tittar på en viss datapunkt, exempelvis kunddata, och definierar därefter relationsdatamodellerna.
På ett liknande sätt hanteras andra datapunkter som transaktioner, produkter etc.
- Hur ska dataåtkomst se ut och vem ska ha tillgång till data?
I detta steg beskriver ni er säkerhetsstrategi samt de verktyg som ska användas för analys, rapportering samt datavisualisering.
Några frågor att överväga är:
- Hur ska ni ansluta till datakällorna?
- Vilka anslutningar (connectors) behövs?
- Hur ofta kan data läsas ut?
- Vilken sorts data behöver ni?
- Vilken metadata finns tillgänglig?
- Hur ofta uppdateras data och hur ofta finns data tillgängligt?
Tänk på de “datakonsumenter” ni vill ha och hur ni vill hjälpa dem. Ni vill erbjuda self-service BI för olika typer av användare, från power users till data scientists, data miners AI- och ML-algoritmer till verksamhetsanvändare som arbetar ad-hoc med data och skapar nya rapporter och tillfälliga användare som väntar på rutinrapporter och uppdateringar.
I detta steg definierar ni även roller och grupper så att ni kan identifiera användare och åtkomsträttigheter medan ni bygger ert data estate. Detta säkerställer att enbart autentiserade användare kommer åt data, tabeller eller kolumner de är auktoriserade att se.
- Definiera er arkitektur
Data behöver extraheras, processas och raffineras för att vara användbar. Precis som att olja kan raffineras till olika typer av bränsle kan data framställas för olika typer av användning när det kommer till analys och artificiell intelligens.
I detta steg beskriver ni hur er organisation väljer att förbereda data för dessa olika användningsområden, från rapportering till analys och AI (artificiell intelligens). De flesta data estate delas in i tre distinkta lager: data lake, datalager (data warehouse) och data marts.
The slutgiltiga resultatet är en integrerad arkitektur som minskar kostnader signifikant, accelererar time-to-value och stöttar era databehov.
Data Lake
Detta lager är vanligtvis avsett för data scientists vilka ofta behöver tillgång till rådata för användning i maskininlärningsmodeller. Detta lager möjliggör snabb utläsning av rådata från alla datakällor och till Azure Data eller en SQL-databas.
Datalager (Data warehouse)
Rådata är ofta inte det bästa alternativet för affärsanvändare som exempelvis businessanalytiker. Dessa användare behöver data som har tvättats, berikats och rationaliserats – i ett modernt datalager. I en dataarkitektur med lager skulle ett datalager hämta data direkt från miljöns data lake men samtidigt placera data i en SQL-baserad databas med semi-strukturerad data som transformerats till en strukturerad dataform för analys.
Data Marts
Data marts stöder allmänna användare genom att leverera relevanta datamängder från datalagret, möjliggör self-service över multipla analysverktyg för bransch- och funktionsspecifika visualiseringar, så att verksamheter kan utforska data säkert och effektivt.
- Moln, On-prem eller hybrid
Som redan nämnts är en fast grund nödvändig för ett fungerande data estate. Ni vill inte att den nya miljön ska sluta som lutande tornet i Pisa, som blivit en kostsam affär att upprätthålla. Tänk därför över för- och nackdelar med moln, On-prem och hybrid.
Det finns fantastiska molnlösningar på marknaden idag – som Microsoft – men molnlösningar bör inte vara ett självändamål. Målet måste först specificeras.
- Val av utvecklingspartner
I detta steg väljer ni ert utvecklingspartner. Vilken mjukvara ska ni använda för ert data estate? Vem ska bygga ert data estate? Och vem ska sköta underhållet?
Datahantering och automatiseringsmjukvara
Ni bör välja rätt mjukvareplattform för dagens såväl som morgondagens behov. Ni vill se till så att ert data estate byggs samman med en integrerad datahanteringsplattform som är fullkomligt oberoende av utvecklare, datakällor, dataplattformar (SQL Server, Azure SQL, Data Lake, Synapse), fornt-end-verktyg (Power BI, Qlik) och distributionsmodell (On-prem, moln, hybrid).
Ni bör kunna påskynda utveckling med automatiserad kodgenerering, vilket frigör utvecklare som då kan fokusera på datakvalitet och affärsutveckling och begränsa mängden högkvalificerade resurser som krävs genom att använda ett och samma verktyg för att bygga data lake, datalager och data marts.
Sist, men inte minst, ni bör försäkra er om att ert data estate är “framtidssäkrat” vilket innebär full skalbarhet och kompatibelt med framtida uppdateringar utan krav på ombyggnad.
Distribution- och underhållspartner
Kommer ni att distribuera och underhålla ert data estate själva? Kommer ni överväga en distributionspartner men sedan sköta underhållet själva?
Oavsett vad ni väljer, överväg en partner med erfarenhet och som ni kan lita på, eftersom de kommer att vara ansvariga för utvecklingen av er viktigaste tillgång: data.
- Tänk stort, börja smått och agera agilt
Har ni följt alla sju steg? Då är det också troligt att ert data estate kommer att hjälpa er till att driva innovation och att ni kommer kunna distribuera en skalbar, ”framtidsäkrad” datamiljö. Nyckeln till framgång är att starta smått. Stegvis kommer ni sedan att kunna hjälpa er organisation till att slutligen bli datadriven.
Vill du veta hur vi kan hjälpa er organisation att bygga ett modernt Data estate?