CRM_250pxWat alle educatieve uitgevers het liefst zouden willen weten van hun concurrent, ligt feitelijk voor het oprapen. Een korte analyse geeft het volgende beeld:

Uit een beknopte analyse van GEADATA is gebleken dat het mogelijk is om door data mining en het combineren van open data bestanden met online data en data van de uitgever zelf, te achterhalen welke leer- en lesmiddelen, van welke educatieve uitgever, op welke onderwijsinstellingen worden gebruikt, in welke leerjaren en in welke aantallen deze worden verkocht. Ook is er relatief eenvoudig een overzicht te creëren van de productprijzen die daarbij worden gehanteerd.

Wat nog niet onderzocht is – maar wel bijzonder relevant – is het aantal jaren dat een methode wordt gebruikt op een onderwijsinstelling. Immers zegt dat direct wat over het vervangingsmoment en het moment waarop de school start met de selectie  van leer- en lesmaterialen. Inzicht hierin maakt het leven van sales een stuk makkelijker. Tweede belangrijke vraag die er ligt is; wie is de beslisser in dit traject?

Om bovenstaand inzicht te creëren, is er een nadere analyse nodig en moeten er wat handmatige acties worden uitgevoerd om de datasets compleet te krijgen. Nog onderzocht moet worden of achterhaald kan worden hoe lang een leer- of lesmiddel wordt ingezet door een onderwijsinstelling en wie beslist over het al dan niet vervangen. De verwachting is dat ook dit inzicht door data mining verworven kan worden.

Wat hebben we tijdens onze korte analyse dan verzameld? Alle data was vrij verkrijgbaar of door ‘scrapping’ van websites te verwerven.

  • overzicht van alle scholen en hun leerlingaantallen per opleiding, per leerjaar
  • soorten scholen, aantallen docenten, man/vrouw verhouding, groei/krimpschool
  • url lijst van alle scholen/onderwijsinstellingen en boven-schoolse besturen (t.b.v. ‘scrapping’)
  • een aanzet tot een boekenlijst per instelling, opleiding en leerjaar (moet nog gecompleteerd worden)
  • alle prijsinformatie van alle leer- en lesmiddelen per uitgever, methode en leerjaar
  • een overzicht waar welke data te halen is voor het completeren van de benodigde datasets
  • een overzicht van bronbestanden voor het verwerven van boekenlijsten

Wat ontbreekt er dan nog?

  • de boekenlijsten van de schoolboekenleveranciers (deze lijst blijkt sowieso incompleet maar kan deels een bijdrage leveren aan het completeren van de dataset)
  • de boekenlijsten van tweedehandsboeken leveranciers (deze lijst lijkt wel compleet en bestaat uit 3383 items)
  • een overzicht van de vervangingsjaren en het aantal jaren dat een methode op een onderwijsinstelling wordt gebruikt.
  • een overzicht van de beslissers voor de selectie en aanschaf van een leer- of lesmethode
  • check op de compleetheid van de verzamelde datasets

Wanneer de exacte scope en opdracht van deze data analyse nader is gespecificeerd met de opdrachtgever, is het geschat nog een aantal dagen werk om de gewenste datasets compleet te krijgen en nog enkele dagen werk om de conclusies en uitkomsten helder neer te zetten. Vervolgens kan sales er direct mee aan  de gang.

Bovenstaande korte beschrijving is een weergave van een korte sprint zoals wij vaker doen bij GEADATA. Een concrete behoefte uit de markt is daarbij altijd ons uitgangspunt. Eerst eens een snelle actie uitvoeren om te beoordelen wat de toegevoegde waarde van een dergelijke data analyse is.

Geïnteresseerde educatieve uitgevers kunnen contact opnemen om bovenstaande case eens door te spreken en samen te beoordelen of het op maat completeren van deze data analyse interessant voor ze is.