Informatiestromen samenvoegen is een dagelijkse klus voor mensen die al langer met data werken, hoe krijgt u dat voor elkaar zonder extra software? In Tableau Desktop is het mogelijk om een Join te maken of met het Relationship model te werken, maar een blend en scaffold met Tableau Desktop werkt misschien beter. In de praktijk heb ik gemerkt dat het ingewikkeld wordt als u geen rechten op een bron heeft en toch data wilt koppelen. Lokaal kan dan een scaffold gemaakt worden en vervolgens kan het workbook dan gepubliceerd worden.
Maar hoe gaat de scaffold dan? Allereerst een voorbeeld met een bron.
Twee bronnen , wat overlap, maar geen Join….
Stel u heeft een bedrijf dat meubels maakt en die verkoopt in drie winkels in Gelderland. Er is software met boekhouddata en leveringsformulieren, de tabel met leveringen heeft ‘Verkoopdocumentnr.’ als key en ziet er zo uit:
Daarnaast is er een programma waarin klachten en schades bijgehouden worden, deze software houdt ook alles bij, maar daar wordt alles bijgehouden aan de hand van het berichtnummer. Voor het gemak zijn de klachten/vragen teruggebracht drie categorieën.
Nu wil een gebruiker weten welke klachten er per winkel het meeste voorkomen en wat dat zegt over de verkoopcijfers. Koppelingen op product zijn niet mogelijk, want die informatie wordt niet bijgehouden in de klantcontact-software. Omgekeerd kan de boekhoudsoftware niet gekoppeld worden aan de klacht. Daarnaast houdt de afdeling klantcontact bij wanneer een bericht is aangemaakt, welke handelingen er verricht worden en wanneer het afgesloten wordt. Stel verder dat de databronnen zo groot of rommelig zijn dat ze niet met een join of relationship te verbinden zijn. Een blend is dan de oplossing als er geen ETL (Extract, Transform, Load) – programma aanwezig is.
Problemen met de blend
Bij een blend moet er gekozen worden voor een primaire en secundaire bron, daarnaast moeten er velden/kolommen zijn waarop gekoppeld kan worden.
NB weet u niet wat een Blend is, klik dan hier voor een uitleg
Verkoopdata primair
Een reguliere blend zorgt voor de nodige problemen. Onder de motorkap ziet de blend er zo uit:
Wat zien we hierboven? Links in de hoofdtabel met de kolommen ‘Verkoopdocument’ tot ‘Prijs’, rechts de secundaire of volgtabel met de kolommen ‘Berichtnummer’ tot ‘Winkel’. De blend vindt plaats op de datum (13-08-2021), maar er is voor die dag geen bericht binnengekomen voor Nijmegen of
In Tableau toont dit het volgende:
Bij een blend waarbij de velden ‘Datum’ en ‘Winkel’ de koppeling vormen ziet het er dan zo uit:
Als één van de twee koppelingen weggehaald wordt komen er meer cijfers in beeld, maar die kloppen dan niet. Met andere woorden, de secundaire bron wordt niet meegeteld omdat zij niet exact overeenkomt.
Klantdata primair
Soms is het de truc om de bronnen om te draaien zodat de bron met de meeste informatie primair wordt. Een voorbeeld is een een bron waarin de waarde op het laagste aggregatie-niveau in alle regels voorkomt. Wat gebeurt er als we dat met dit voorbeeld doen, eerst de matrix:
Hierboven worden nu de klantgegevens allemaal meegenomen, maar valt informatie over Zutphen buiten de boot. Hoe ziet dat er in Tableau uit?
Als er nu een blend gemaakt wordt met de bovenstaande informatie als primaire bron ziet het er zo uit:
De verkoopcijfers van Zutphen op 17 augustus zijn weg gevallen. Nu is dat op het aggregatie-niveau van datum op ‘dag’ wel te overkomen, maar stel dat hier honderduizenden regels waren en er tientallen regels verdwenen. De cijfers op hogere niveaus (week, maand of kwartaal) zouden helemaal scheef lopen. Verkopen en klantcontact-aantallen zouden niet meer kloppen. Wat nu? Toch maar meer software kopen, complexe tussentabellen maken met SQL of iets anders?
Oplossing : een blend en scaffold met Tableau Desktop
Voor de uitwerking van het maken van een blend en scaffold met Tableau Desktop zal even doorgeklikt moeten worden via deze link.