In de BI-wereld kom je nogal wat jargon en buzzwords tegen. Artificial Intelligence, Machine Learning, noem maar op. Wat is nu precies wat? In dit blog leg ik het verschil uit tussen Predictive Analytics en Forecasting.

Predictive Analytics

Predictive Analytics is eigenlijk het containerbegrip: er wordt geprobeerd een bepaalde uitkomst te voorspellen. Dit wordt gedaan door een ‘model’ te creëren aan de hand van bestaande data. Dit model kan dan meteen een voorspelling doen (zonder verdere input), of aan de hand van nieuwe, ongeziene data. Denk aan het voorspellen van verkoopcijfers voor het volgende kwartaal, de waarde van een huis, fraudedetectie en spamfilters. Predictive Analytics kun je doen met geavanceerde statistische methodes zoals verschillende soorten classificatie, regressie en clustering, maar ook door het inzetten van machine learning technieken zoals random forests, deep learning en state vector machines.

Forecasting

Forecasting is een onderdeel van Predictive Analytics. Het verschilt in die zin van andere predictive analytics methodes, dat hier altijd de factor tijd bij betrokken is. Er wordt hier ook geen nieuwe, ongeziene data gebruikt, maar in de tijd vooruit voorspelt. Data uit het verleden en het heden (time series data) wordt gebruikt om een voorspelling te doen over een situatie in de directe toekomst, met een bepaalde zekerheidsmarge.

Hieronder volgen twee voorbeelden om het verschil duidelijk te maken.

Voorbeeld 1: huizenprijs voorspellen

Als je een voorspelling wilt doen over de prijs van een bepaald huis, kun je bijvoorbeeld kijken naar een dataset met daarin prijzen en relevante eigenschappen van andere bestaande huizen. Deze relevante eigenschappen (de zgn. ‘voorspellende variabelen’) zijn bijvoorbeeld leeftijd, woonoppervlak, aantal kamers, etc. Op basis daarvan creëer je een model. Bij dat model voer je vervolgens de eigenschappen in van het huis waarvan je de prijs wilt voorspellen – dit is voor het model nieuwe, ongezien data. Het model doet dan een voorspelling (bijvoorbeeld op basis van regressie) over de prijs van het betreffende huis.

Voorbeeld 2: weer voorspellen

Als je een voorspelling wilt doen over het weer, dan kun je bijvoorbeeld kijken naar historische weerdata. Vervolgens doe je aan de hand van trendanalyse een voorspelling. Als je het weer over 5 minuten wilt weten, weegt de meest recente weerdata in dit geval het zwaarst (als het nu regent, is het redelijk waarschijnlijk dat het over 5 minuten nog steeds regent). Wil je verder vooruit voorspellen (één of meerdere dagen), dan kijk je ook vaak verder terug in je historische weerdata en weeg je deze data ook op een andere manier. Over het algemeen geldt: hoe verder vooruit de voorspelling, hoe onzekerder deze wordt.

Wat is nu wat?

Het eerste voorbeeld is een algemener voorbeeld van Predictive Analytics. De factor tijd is hier niet bij betrokken. Het zou in principe op verschillende manieren aangepakt kunnen worden. Het tweede voorbeeld is duidelijk een geval van Forecasting: we willen aan de hand van historische data een trend doortrekken naar een voorspelling voor de nabije toekomst.

Predictive Analytics in Alteryx

Wil je Predictive Analytics doen in Alteryx, dan kun je kiezen uit tools in verschillende categorieën. Voor voorspellingen waarbij de dimensie tijd niet of nauwelijks van toepassing is, gebruik je tools uit de ‘Predictive’ of ‘Predictive Grouping’ categorie. Wil je juist aan de hand van historische data en trendanalyse een voorspelling doen (Forecasting), kijk dan naar de tools uit de ‘Time Series’ categorie.

De Time Series tools in Alteryx

Hieronder zie je in afbeeldingen een voorbeeld hoe je het forecasten van verkoopcijfers aanpakt (klik op de afbeeldingen voor een uitvergroting):

Koffiedik kijken: SuperStore een week vooruit…

Conclusie

Ik hoop dat je nu wat meer duidelijkheid hebt over het verschil tussen Predictive Analytics en Forecasting. Samenvattend: Predictive Analytics gaat over uitkomsten voor nieuwe gevallen voorspellen met variabelen in bestaande data. Forecasting is een tak binnen deze discipline die zich bezighoudt met trendanalyse op historische (time series) data.


Wil je meer weten over Tableau of Alteryx? Wil je het maximale uit deze tools halen? Neem deel aan onze workshops en trainingen of huur onze consultants in!