Aan de slag met ‘big data’ op de eerste datathon van KU Leuven

DOOR JAN DE SPIEGELEER. Een datathon is een competitie waar deelnemers in teamverband een voor hen onbekende dataset voorgeschoteld krijgen, en daar zoveel mogelijk waardevolle informatie uit moeten halen. Meer dan honderd creatieve studenten gingen deze uitdaging aan en wat blijkt: Big data is big fun!

Geschreven door Jan De Spiegeleer. Jan is gastdocent Wiskunde en organiseerde de datathon samen met An Carbonez van LStat en andere collega’s van het Big Data Platform.
jan-de-spiegeleer

Jan De Spiegeleer

Hackathons winnen snel aan populariteit in de bedrijfswereld en aan universiteiten. De datathon die KU Leuven op 24 februari 2018 organiseerde, past binnen dat concept. Een datathon is een competitie waar deelnemers in teamverband een voor hen onbekende dataset voorgeschoteld krijgen. De bedoeling is om zoveel mogelijk waardevolle informatie uit de massa aan ongestructureerde gegevens te halen. Eén voor één komen de teams dan aan de beurt om hun bevindingen in een korte presentatie, een zogenaamde pitch, aan de jury voor te stellen.

Big Data

Data zijn vandaag alomtegenwoordig, en ze hebben een enorme impact, ook op het onderzoek in diverse disciplines. Niet alleen wetenschappers en ingenieurs, ook onderzoekers in biomedische en in humane wetenschappen krijgen te maken met datasets waaruit ze interessante informatie kunnen halen, als ze maar de juiste vragen stellen en de juiste analysemethoden hanteren. Dat is precies wat de deelnemers aan de datathon moesten doen.

De opdracht

Het vroor de hele dag en er stond een strakke ijzige wind. Maar toch trotseerden meer dan honderd creatieve studenten, uit verschillende faculteiten, deze Siberische toestand. Als opwarmertje kregen ze een lekker ontbijt en werden ze enthousiast onthaald door leden van het Big Data Platform van de KU Leuven. Na het openingswoord door Prof. Molenberghs trokken de 23 teams zich terug in hun lokaal. Laptops werden opengeklapt en mouwen opgerold, de Arenberg Campus bruiste van enthousiasme! ‘s Middags kon er energie worden bijgetankt en daarvoor konden we rekenen op Alma.

P1070248

Elk team kreeg tot 15u de tijd om de data te analyseren en een presentatie voor te bereiden. Bij de keuze van een naam voor hun team, toonden de studenten al hoe divers en creatief ze waren. Sommigen houden van kort en krachtig, zoals team “X”. Anderen verkiezen ronkend en barok, zoals het team “Vorsprung durch hyperparameter optimization”.

De data

Elk team kon werken op één van de twee beschikbaar gestelde datasets. Er was een uitgebreide economische dataset met gegevens van meer dan drieduizend bedrijven. Hier lag het doel min of meer voor de hand: het modelleren van de kans op een eventueel bankroet. Ongeveer de helft van de teams kozen voor deze dataset.

De andere teams opteerden voor de sportcase. Zij kregen uitgebreide registratiegegevens (hartslag, kadans, snelheid, gps-coördinaten…) van wielrenners tijdens een wedstrijd en een trainingsrit. Heel toepasselijk want op diezelfde dag ging het wielerseizoen van start met de Omloop Het Nieuwsblad. Terwijl de wielrenners zich in de vrieskou sleurden op de muur van Geraardsbergen, zwoegden onze teams aan het oppoetsen en visualiseren van de data en het testen van wiskundige modellen.

Eén team ontwikkelde een app waarmee je het parcours van de wedstrijd, de Sluitingsprijs Putte Kapellen, kunt afleggen in het gezelschap van de renners – als je ze kunt bijhouden ten minste. Een ander team maakte dan weer een prachtige visuele weergave van een fietstraining in Griekenland van een wielerploeg. Informatie met alle hellingen en hoe snel elke renner die nam werd netjes in kaart gebracht.

IMG_0128

Pitch Battles

Er stonden interessante en waardevolle prijzen in het uitstalraam. Elk winnend team kan deze zomer drie weken met de trein door Europa trekken. De prijzen werden aangeboden door enkele bedrijfspartners die dit KU Leuven event ondersteunden. Maar onze partners boden meer dan enkel financiële steun. Ze stuurden ook enkele van hun data scientists naar Heverlee om onze teams met veel goede raad bij te staan.

De teams lieten de juryleden versteld staan van hun coole apps, hun straffe visualisatie, hun zotte creatieve ideeën en verrassende presentaties. Het ging allemaal bijzonder snel want elke pitch mocht niet langer dan 5 minuten duren, telkens gevolgd door een kort vragensalvo van de juryleden.

Deelnemen is belangrijker dan winnen

In totaal gingen 5 teams met hun prijs naar huis. Er was een prijs voor het beste PhD team en het beste Master team. Het meest creatieve team en het team met de beste visualisatie kunnen ook hun rugzakken klaarleggen voor de komende zomer. Tot slot trok het team met de beste pitch eveneens huiswaarts met deze prijs en een gepaste oorkonde.

IMG_0162

Na een dag tussen grafieken en dataminingmodellen was het tijd voor een welverdiende receptie. Het enthousiasme was nog niet op, er werd druk nagekaart en overlegd, en afspraken gemaakt: “volgend jaar doen we weer mee!”

IMG_0189

Ben je er volgende keer graag bij? Geef het ons door via e-mail en je krijgt een seintje als de volgende editie van start gaat.


Reageer

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s