Big data, het nieuwe goud

“Dit jaar bestaat het data analyseteam van De Verkeersonderneming 5 jaar. Inmiddels heeft het team een aantal successen behaald en veel geleerd. Aan de hand van de metafoor ‘Gouddelven’ worden de vier stappen in Big Data toegelicht en delen we de belangrijkste ervaringen.

Stap 1: Toegang krijgen tot goede goudmijnen 
Toegang krijgen tot databronnen is een proces op zich. Privacy, commerciële belangen, technische beperkingen en/of andere belangen maken het soms lastig. Het maken van goede afspraken  is daarbij essentieel. Niet alle data hoeft real-time en open beschikbaar te zijn. Ook besloten en historische data is waardevol voor innovaties van verkeersmanagement en mobiliteitsoplossingen.

De kwaliteit van data is bepalend voor wat je er mee kunt doen. Een open deur natuurlijk, maar te vaak wordt nog in te algemene termen over data gesproken. FCD is bijvoorbeeld ‘hot’. Het maakt echter wel uit of je van iedere seconde data hebt of iedere minuut. Vooraf is vaak moeilijk in te schatten wat de werkelijke kwaliteit van data is en daarmee ook hoeveel tijd en andere middelen je wilt investeren in het binnenhalen van een dataset.

Lessons learned
* Het toenemend aantal data ’goudmijnen‘ maakt slim kiezen belangrijk.

* Onderschat niet de tijd en moeite die het verkrijgen van datasets kan kosten.

* Ga in gesprek met een partij die misschien wel data beschikbaar heeft. Vaak zijn ze zeer bereid mee te denken.

Stap 2: Ontginnen van goudmijnen 
Echt grote datasets krijg je niet klein met Excel. Ook de snelste laptop voldoet niet meer, nog los van het feit dat je die laptop met mogelijk besloten data niet kwijt wilt raken. Hadoop, Python, R, en rekenclusters zijn kreten die passen bij het analyseren van grote datasets. Vaak zijn dat omgevingen en systemen die nog niet eerder werden gebruikt in een organisatie.

Het ordenen, verrijken, integreren, analyseren en visualiseren van data kan op vele manieren. Onze focus ligt met name op het inzichtelijk maken van de huidige situaties: waar zit de kiem van de file: op welk stuk weg, welke rijstrook en op welk tijdstip? Hoeveel mensen rijden dagelijks op plaats x? Wat is de verhouding busjes/vrachtwagens/personenauto’s op het moment dat de file ontstaat? Zijn er dagen zonder file en wat maakt die dagen dan anders dan de reguliere filedagen?

Lessons learned
* Breng data scientists van verschillende organisatieonderdelen samen zodat kennis en ervaring snel gedeeld wordt.

* Soms levert alleen al het ordenen van data onverwachte inzichten op.

* Laat data scientists zoveel mogelijk werken in de omgeving van degenen die de analyses in het dagelijkse werk kunnen gebruiken.

data

Stap 3: Het goud op waarde schatten
Dan komen er uitkomsten uit de analyse die je niet verwacht. Ook de inhoudelijk deskundigen zijn verbaasd. Kloppen de analyses wel? Een interpretatieslag is nodig. Soms is de echte wereld anders dan altijd werd gedacht. Zo dachten wij dat door de Maastunnel net als over de Rotterdamse ruit slechts 30% incidenteel verkeer reed (dat maar één keer of minder in een week gezien werd). Dat bleek maar liefst 60%.

Het blijft nodig om kritisch te kijken naar het ‘goud’ dat je in handen hebt. Niets is zo frustrerend als waardevolle inzichten rond te sturen die waardeloos blijken te zijn.

Lessons learned
* Organiseer reflectie op de analyseresultaten. Zo voorkom je dat je verkeerde conclusies trekt

* Durf (na een dubbelcheck) wel te twijfelen aan het beeld dat je altijd hebt gehad. (De wereld is tóch niet plat).

Stap 4: Het goud te gelden maken
Misschien nog wel het lastigste deel van data: hoe maak je er iets moois mee? Dat vraagt om met een andere bril naar bestaande knelpunten te kijken en tot nieuwe oplossingen te komen. Dat vraagt tijd en toewijding. Zeker wanneer processen gekoppeld zijn aan bestaande systemen, procedures en gewoontes.

Lessons learned
* Betrek de mensen uit het veld er zo vroeg mogelijk bij. Het liefst al bij het stellen van de analysevragen.

* Realiseer je dat je soms nog een uitdaging vindt in het overtuigen van anderen van de uitkomsten van data-analyse.

Ik ben enorm trots op mijn team en de behaalde resultaten. Wil je meer weten? Stuur me gerust een mail. Want: samen staan we sterker en kunnen we meer.

Gerard Eijkelenboom
Programmamanager De Verkeersonderneming
Gerard.Eijkelenboom@verkeersonderneming.nl