Hvordan fungerer det?
Avansert dataanalyse er som sagt ingen programvare, men en prosess som består av flere trinn:
Det første trinnet er å bestemme datakravene, eller hvordan dataene skal grupperes. Data kan for eksempel skilles ut etter alder, inntekt eller kjønn. Dataverdiene kan være kvantitative eller kvalitative.
Det andre trinnet er å samle dataene. Disse dataene vil være bransjeavhengige og kan komme fra en rekke kilder som for eksempel IoT-enheter, klikk eller kjøp på nettet, tall fra fysiske butikker, maskiner, databaser eller manuelle registreringer.
Tredje trinn handler om at når dataene er samlet, må de organiseres. Til dette brukes programvare som kan håndtere statiske data, som for eksempel Excel eller mer avanserte former for programvare. Deretter handler det om å rydde opp. Dataene vaskes og kontrolleres for å unngå duplikater, feil eller ufullstendig informasjon.
Fjerde trinn er gjennomføringen av selve analysene, som kan skje nå som alt det andre er gjort. Analyseprosessene kan gjøres manuelt, men i dag er det mye som er automatisert. Når det gjøres manuelt, er det gjerne en data scientist, eller analytiker, som er ansvarlig.