Data Science. Twee woorden, veel inhoud.
Zoals je hebt kunnen lezen in het eerste deel van dit Data Science blog zijn er een veelvoud aan definities te vinden. Data Science is de zoektocht en de kwantitatieve analyse van alle gestructureerde- en ongestructureerde data die beschikbaar is, om zo begrip te ontwikkelen, kennis te extraheren en actionable results te kunnen formuleren.
Misschien wel een van de populairste onderwerpen van de afgelopen tien jaar. Waarom lijkt iedereen zo geobsedeerd door data, BIG data, small data, analytics? Gaat ons leven echt leunen op data, of is het “gewoon de mode” van dit decennium en verdwijnt het na de hype (nog iets gehoord van Pokemon go, de laatste tijd?).
In tegendeel, als je het mij vraagt. Ik denk dat data en analytics zich gaan wortelen in onze levens. Steeds meer wordt connected, elk bedrijf heeft het verlangen om een data gedreven organsiatie te zijn, waar gebruik wordt gemaakt van data om beslissingen te optimaliseren. Data scientists hebben meer en meer werk te doen om nieuwe algoritmes te ontwikkelen aan de hand van machine learning, om zo het ultieme doel – het matchen van vraag en aanbod – te bereiken en de markt efficiënt te veroveren.
Ik ga het niet hebben over de vereisten of de skills die nodig zijn om een BI analyst of een Data scientist te worden. Maar ondanks het respect dat het fenomeen afdwingt, kan data en analytics lastig te begrijpen en uit te leggen zijn. Met als resultaat dat analytische kwaliteiten niet effectief benut worden en beslissers terugvallen op intuïtie of ervaring… Wat heel erg belangrijk is, is dat je als data scientist in staat bent om je bevindingen op een duidelijke en heldere wijze begrijpelijk te maken voor je publiek.
Want zelfs al ben je de beste analist die er bestaat, als je niet in staat bent uit te leggen wat je hebt gevonden kan de kern van het verhaal achter de data alsnog verloren gaan. Een manier vinden om jouw inzichten uit te leggen aan de rest van de wereld is cruciaal. Dit betekent dat je in staat moet zijn om het verhaal te vertellen dat achter de data, de nummers en de formules, schuilt.
Ik heb de analyse op m’n dataset voltooid, nu moet ik mijn bevindingen presenteren. Wat is het doel van mijn analyse eigenlijk en aan wie ga ik het presenteren?
Dit zijn belangrijke vragen. Ik moet weten wie mijn publiek is voordat ik kan beginnen met het maken van een presentatie. De meest geraffineerde story-tellers begrijpen wat het belang is van het kennen van je publiek. Het maakt echt het verschil als je in staat bent om je verhaal aan te passen aan de behoeftes van je publiek. Bijvoorbeeld: wanneer je je analyse presenteert aan een executive zijn waarschijnlijk de statistieken belangrijk voor de discussie. Maar een Business Intelligence manager vindt het waarschijnlijk even belangrijk om te weten wat de gebruikte methodes en technieken zijn.
Okee, je kent dus inmiddels je publiek. De volgende stap is dat je een manier vindt waarop je je resultaten op een aantrekkelijke wijze kan presenteren. Je moet op zoek gaan naar een manier om je bevindingen uit te leggen en jouw inzichten te geven.
Om dat te doen moet je de business begrijpen en de business-behoeftes combineren met je data-inzichten. Dat is ook waarom het erg belangrijk is dat data scientists schouder aan schouder werken met business analisten. Je kent de data, maar je moet ook begrijpen wat de relatie is van alle variabelen. Dan ben je in een positie om je bevindingen te presenteren en jouw oplossingen aan te dragen. Onderschat dit onderdeel van data science niet, soms is het lastiger om “het verhaal” te creëren dan het grasduinen in de cijfers.
Ik heb ooit eens een analyse moeten doen op een dataset; een lange lijst van auto’s met bijbehorende motor karakteristieken. Ik keek naar de data en het leek alsof ik iets las in een taal die mijn hersenen niet konden bevatten. Ik begreep het simpelweg niet. Dus moest ik op zoek naar antwoorden. Schakelen met mensen die de business-kant van de data begrijpen, die in staat zijn verschillende velden van mijn dataset uit te leggen. Na een verhelderende meeting met de business was ik in staat om mijn analyse te doen en mijn bevindingen te presenteren op een manier waarop zij er wat aan hadden.
Het is geen geheim dat de beste data scientists diegenen zijn die in staat zijn om een verhaal te vertellen aan de hand van de data. Goede verhalen presenteren ideeën op een wijze waarop je publiek het begrijpt.
Emma Coats, een voormalig Story Artist van Pixar, heeft ooit eens gezegd: “Come up with your ending before you figure out your middle. Seriously. Endings are hard, get yours working up front.”
Dit betekent dat je een plan moet hebben voordat je het gaat uitvoeren. Ga voor jezelf na waar je analyse gaat belanden. Dan heb je zowel het begin als het eind van je verhaal. De “ruggengraat” staat en die verrijk je met je analyse. Wat volgt is een mooi, begrijpelijk verhaal.
Samenvattend; natuurlijk is de kwaliteit van je data en je analyse van belang (een onderwerp waar ik in mijn volgende blog bij stil zal staan), maar de communicatie tussen jou (de data scientist) en degene die jouw analyse gaat gebruiken is evengoed van belang voor succes. Daar komt natuurlijk bij: de manier waarop je je verhaal presenteert aan je publiek!
Ik ben benieuwd naar hoe jij dit ziet. Wat vind je belangrijker: de analyse of de manier waarop je het presenteert? Of nog beter; welke van die twee heeft het meeste invloed op de beslisser die tegen over je zit? Denk er eens over na, en schrijf een reactie met je bevindingen.