Blog

Wat doet een data analist? En welke rol heeft een data analist binnen een organisatie?

Wat doet een data analist precies en welke werkzaamheden voeren ze uit? Je leest het in deze blog
Geschreven door
op
August 2, 2021

Data is kennis en kennis is macht

Bedrijven en organisaties hechten steeds meer waarde aan data. Vrijwel ieder bedrijf dat er toe doet in de 21e eeuw neemt data serieus. Het maakt hiervoor niet uit in welke industrie het bedrijf zich bevindt of welke producten of services het bedrijf aanbiedt. Door data te verzamelen ben je in staat om vrijwel ieder aspect van het bedrijf te verbeteren. Als een bedrijf of organisatie niet investeert in data is de kans groot dat ze achter zullen lopen op de concurrenten die wel data verzamelen. 

Je kent het gezegde vast wel: ‘kennis is macht’. Hier zit een kern van waarheid in. Denk maar eens aan een paar van de machtigste bedrijven of organisaties zoals Google, Facebook, Amazon of de overheid. Al deze bedrijven en organisaties beschikken over zoveel macht vanwege hun kennis. Hoe ze aan deze kennis komen? Dat komt ze natuurlijk niet zomaar aanvliegen. Ze beschikken over zoveel kennis doordat ze héél veel data verzamelen en het vervolgens in hun voordeel gebruiken.Data is voor bedrijven als Facebook en Google miljarden waard. Zo verdienen bijvoorbeeld Facebook en Google geld met persoonlijke data doordat ze bedrijven gericht laten adverteren op basis van deze gegevens.
Binnen de overheid wordt data niet alleen gebruikt cyberdreigingen te analyseren, maar bijvoorbeeld ook om de waterstand te monitoren en daardoor te weten wanneer dijken versterkt moeten worden. 

Data analisten zorgen ervoor dat bedrijven toegang krijgen tot de data die ze zo belangrijk vinden. Dit is dan ook de reden dat er op het moment zoveel bedrijven op zoek zijn naar data analisten.

Wat doet een data analist?

Data analisten houden zich op dagelijkse basis bezig met data. Iedere dag zijn ze in de weer met verschillende fasen uit de data analyse, waar ze data (gegevens) verwerken en omzetten in bruikbare informatie. Het analyseren van data is niet het enige waar data analisten zich mee bezig houden. Dit is slechts één onderdeel uit de gehele data analyse. De data analyse omvat namelijk het gehele proces waarbij inzichten uit gegevens worden gehaald om betere zakelijke beslissingen te kunnen nemen. 

Het proces van de data analyse bestaat doorgaans uit de volgende zes iteratieve fasen: 

  • Bepalen van het doel waarvoor je data wilt verzamelen
  • Verzamelen van data
  • Opschonen van data
  • Analyseren van data
  • Interpreteren van de resultaten van de analyse
  • Presenteren van de bevindingen

Welke taken en verantwoordelijkheden heeft een data analist?

Zoals je hebt kunnen lezen houden data analisten zich bezig met de verschillende iteratieve fasen van de data analyse. We gaan je nu vertellen waar iedere fase voor staat en welke werkzaamheden daarbij horen.

Het stellen van de juiste vraag en het bepalen van de doelstellingen

Elke data analyse wordt uitgevoerd met een bepaald doel voor ogen. Als eerste stap wordt er nagedacht over wat je wilt bereiken. Vervolgens wordt er in kaart gebracht wat ervoor gedaan moet worden en tot slot wordt er bepaald welke data ervoor nodig is. 

Als de inspanning niet bijdraagt aan het behalen van de doelstellingen die het bedrijf voor ogen heeft, dan heeft de gehele data analyse weinig zin. Vraag jezelf dus altijd voordat je begint met het verzamelen van data het volgende af: wat zijn de motieven om het onderzoek te starten en wat wil de organisatie ermee bereiken op zowel de lange als korte termijn?

Verzamelen van de benodigde data

Als het doel is bepaald kunnen er gegevens worden verzameld. Zonder goede data kun je immers geen analyses maken. Daarom zal je als data analist een data infrastructuur op moeten zetten.

De gegevens die je verzamelt kunnen in verschillende vormen voorkomen en uit meerdere bronnen komen. Denk bij de verschillende vormen niet alleen aan cijfers en teksten maar ook bijvoorbeeld aan foto’s, video’s en audiofragmenten. Ook de bronnen waar de data vandaan komt kunnen heel uiteenlopend zijn. Denk bijvoorbeeld aan fysiologische metingen, advies panels, eye tracking, onderzoek of verkoopcijfers. 

Stel je voor dat je alle beschikbare gegevens handmatig moet verzamelen, dat is natuurlijk niet te doen. Daarom is het essentieel dat je als data analist bepaalde routines van de dataverzameling kan automatiseren. Dit maakt de dataverzameling misschien wel tot een van de meest technische werkzaamheden van de data analist.

Routinematige taken zijn goed te automatiseren met een programmeertaal. Een van de populairste talen binnen het vakgebied is Python. Neem bijvoorbeeld web scraping. Dit is een van de belangrijkste skills van data analisten. Het is een techniek waarmee geautomatiseerd relevante data van externe websites kan worden gehaald. Het is een onmisbare skill omdat data analisten zo sneller, efficiënter en minder foutgevoelig kunnen werken. 

Een andere onmisbare skill die los staat van het automatiseren maar daarmee niet minder belangrijk is voor de dataverzameling, is het beheersen van de programmeertaal Structured Query Language (SQL). Deze taal wordt gebruikt om data op te kunnen halen uit databases.

Opschonen van data

Als alle ruwe data door de data analist verzameld is, is hij of zij nog lang niet klaar om de gegevens te analyseren. Eerst zal er een hoop moeten worden opgeschoond. Gegevens zijn namelijk nooit direct geschikt om geanalyseerd te worden. Er is vrijwel altijd sprake van incorrecte of ontbrekende data. Denk bijvoorbeeld aan gegevens die dubbel zijn ingevoerd. 

Het opschonen van data is een erg belangrijke stap die vaak tot wel de helft van de tijd van data analisten in beslag kan nemen. Een data analyse op basis van incorrecte data is meer dan waardeloos. Hoe verder je bent in het proces van de analyse, des te lastiger het wordt om de fouten te herstellen. Daarnaast kan het leiden tot het nemen van verkeerde beslissingen en fouten in de procesuitvoering. En dit is natuurlijk met alle gevolgen van dien. 

Als data analist streef je altijd naar de meest optimale data kwaliteit. Hiervoor houd je rekening met het volgende:

  • Zijn de gegevens actueel?
  • Zijn de gegevens volledig?
  • Zijn de gegevens accuraat?
  • Zijn de gegevens begrijpelijk?
  • Zijn de gegevens uniek?
  • Zijn de gegevens consistent?
Een data analist zorgt voor schone data
 

“more data beats clever algorithms but better data beats more data”- Peter Norvig

Data analyse

Zodra je de juiste gegevens hebt gevonden om het vraagstuk op te lossen en de data helemaal schoon is, kan de data analist beginnen met het analyseren van de gegevens. In deze fase voert de data analist verschillende analyses uit van een bepaald type. 

Er bestaan 6 soorten type data analyses

  • beschrijvende data-analyse;
  • verkennende data-analyse;
  • inferentiële data-analyse;
  • voorspellende data-analyse;
  • causale data-analyse;
  • mechanistische data-analyse.

De data analist maakt gebruik van tools zoals bijvoorbeeld Python, Tableau, Google Sheets en Excel om deze analyses uit te voeren.

Wil je graag meer te weten komen over de verschillende type data analyses? Download dan deze whitepaper. Hier vertellen we je uitvoerig wat de verschillen tussen deze analyses zijn. 

Interpreteren van de resultaten

Nadat de data analist de gegevens geanalyseerd heeft zal hij of zij de resultaten interpreteren. Als je jouw analyse gaat interpreteren, houd dan in gedachte dat je niet altijd je hypothese kan bekrachtigen.

Als de data analist gegevens interpreteert stelt hij/zij zichzelf altijd de volgende belangrijke vragen:

  • Geeft de data antwoord op de onderzoeksvraag? En hoe?
  • Helpen de gegevens je met de verdediging tegen eventuele bezwaren? En hoe?
  • Zijn er beperkingen in de conclusies en/of zijn er invalshoeken die je niet hebt overwogen?

Als de interpretatie van de gegevens onder al deze vragen en overwegingen stand houdt, ben je hoogstwaarschijnlijk tot een goede conclusie gekomen. Het kunnen trekken van de juiste conclusies na al het harde werk zal een euforisch gevoel creëren. Vrijwel iedere data analist herkent dit gevoel.

Presenteren van de data

Het presenteren van de data is de laatste stap van de data analyse. Het analyseren van de data is geen doel an sich maar een middel. De data analist doet altijd zijn uiterste best om mooie visualisaties te maken zodat hij of zij de uitkomsten van het onderzoek zo goed mogelijk kan overbrengen aan alle stakeholders. Want als de stakeholders ook maar iets niet begrijpen, zullen ze niet overtuigd zijn om iets te doen met de uitkomsten van het onderzoek. En dit zou natuurlijk erg zonde zijn van alle tijd die erin is gestoken.

De meeste data analisten maken gebruik van programma's in Python als: Matplotlib en Sea Born om krachtige visualisaties te maken. Met deze datavisualisatie programma’s zie je gemakkelijk trends en patronen en maak je de mooiste visualisaties.

Meer Blogs

Cookie Preferences
close

We may use and track cookies, local storage, your IP address and similar technologies to improve the user experience of this site and to understand how it is used. Read more in our privacy policy.