Hva er Big Data? Her får du en 5-punkts definisjon

Hva er Big Data? Ifølge Gartner, kjennetegnes det av tre V-er. Orange Business har lagt til to nye V-er og definerer begrepet med fem punkter.

For å kunne definere hvor Big Data starter, og på hvilket tidspunkt målrettet bruk av data blir et Big Data-prosjekt, må det tas en nærmere kikk på detaljene og de sentrale egenskapene til fenomenet. Definisjonen baseres vanligvis på 3-V-modellen fra Gartners analytikere, og selv om denne modellen både er viktig og riktig, er det nå på tide å tilføye ytterligere to sentrale V-faktorer.

Definisjonen av Big Data – tre grunnleggende V-er:

Volum definerer eksempelvis den enorme mengden data som selskaper produserer hver dag. Genereringen av data er så stor og kompleks at den ikke lenger kan lagres eller analyseres ved hjelp av konvensjonelle databehandlingsmetoder.

Variasjon refererer til mangfoldet av datatyper og datakilder. 80 prosent av all data i verden er i dag ustrukturert og viser ved første øyekast ingen sammenhenger. Takket være algoritmer kan data sorteres på en strukturert måte og analyseres for sammenhenger. Data omfatter ikke alltid kun konvensjonelle datasett, men også bilder, videoer og taleopptak.

Velocity – hastighet refererer til hurtigheten som data genereres, analyseres og reprosesseres. I dag er dette vanligvis mulig innen en brøkdel av et sekund, også kjent som sanntid.

Definisjonen av Big Data – to essensielle tilleggs-V-er:

Validitet er en garanti for datakvaliteten, eller alternativt dataens ekthet og troverdighet. Big Data involverer å jobbe med alle grader av kvalitet ettersom volumfaktoren vanligvis resulterer i mangel på kvalitet.

Verdi (suksess) angir merverdi for selskaper. Mange bedrifter har nylig etablert sine egne dataplattformer, fylt dem med data og investert mye penger i infrastruktur. Nå er det et spørsmål om å skape verdi av disse investeringene.

Som skrevet i en tidligere bloggartikkel, er det ikke så lett å definere Big Data ettersom begrepet angår såpass mange aspekter og disipliner. For mange er bedriftenes suksess (Verdi) det viktigste, og da må det skapes ny informasjon som er tilgjengelig for mange brukere veldig raskt (Velocity), og det må brukes store mengder data (Volum) fra svært ulike kilder (Variasjon) og av forskjellig kvalitet (Validitet), slik at det er mulig å ta viktige beslutninger raskt for å oppnå eller opprettholde konkurransefortrinn.

I boken «Big Data – Using smart Big Data analytics and metrics to make better decisions and improve performance» skriver Bernard Marr at fenomenet ville vært verdiløst hvis det i siste instans ikke skaper en fordel. Vi kunne ikke ha vært mer enige.