Big data representerar en revolution inom kultur, beslutsprocesser och strategi – inte bara teknik.
Även om många pratar om “big data”, betyder big data datauppsättningar som är så stora och komplexa att de är svåra att hantera med konventionella verktyg.
Gartners definition
Beroende på vem du frågar får du olika definitioner av vad big data är. Det enklaste är att förhålla sig till Gartners definition med 3 V:
- Stor volym (Volume)
- Stor variation av information (Variation)
- Snabbt förändrande (Velocity)
Baserat på den definitionen är alltså big data stora och varierande mängder data som ständigt förändras.
Vill du lära dig mer om Big Data?
Ladda ner vår e-book “En introduktion till Big Data”.
Vanlig data vs big data
Skillnaden mellan ”vanlig data” och ”big data” beror i praktiken på organisation och person. För små företag kan till med några få gigabyte data vara “big”, medan Facebook eller Google pratar om petabyte och miljarder rader med data när de refererar till “big data”.
Förutom storlek kan data också bestå av två huvudkategorier:
- Strukturerad
- Ostrukturerad
Medan strukturerad data är det man vanligtvis hittar organiserat på ett fördefinierat sätt i en databas, är ostrukturerad data ”allt möjligt” som till exempel bilder, ljudfiler, filmer, e-post, dokument, kalkylark och annan data som inte är organiserad.
Många menar att andelen ostrukturerad data är cirka 70-90% av all data. Data-mining, textanalys, taggning och annan användning av metadata är exempel på hur man strukturerar ostrukturerad data.
Dagens BI-lösningar kräver i hög grad strukturerad data; big data är ofta ostrukturerad och kommer att kräva andra lösningar för att kunna konverteras till värdefull information. Medan BI-lösningar tenderar att erbjuda beskrivande statistik, erbjuder big data explorativ och kausal statistik.
Stora möjligheter
Det är emellertid inte datamängden eller typen av data som är big datas stora värde, utan snarare möjligheterna att aggregera och bearbeta enorma datamängder. Detta beror på möjligheterna som uppkopplade system i kombination med ständigt ökande processorkraft ger.
Med big data kan mängden data vara nästan obegränsad, så om du letar efter nålen kanske du vill göra höstacken lite mindre – dvs. begränsa dig själv. Oavsett omfattning och typ handlar big data om att fånga, bearbeta, lagra, söka, dela, överföra, analysera och presentera (populärt kallat ”visualisera”) information. För att lyckas med detta måste man bland annat göra utvärderingar med hänsyn till den underliggande tekniken, kompetensen och de resurser som finns tillgängliga, och inte minst vilken typ av insikt du vill ha.
Vill du veta mer om Big data?