Met Alteryx is het mogelijk om snel grote hoeveelheden data te verwerken. Echter wanneer je workflow groter en ingewikkelder wordt, dan kan het zijn dat het verwerken steeds langzamer gaat. Veel gebruikers laten hun workflow draaien na elke aanpassing, hierdoor is het belangrijk dat de workflow zo snel mogelijk draait. Er zijn verschillende tools die veel invloed hebben op de snelheid van je workflow. De tips in deze blog gaan je helpen met het optimaliseren van een workflow in Alteryx.
1. Kijk goed naar welke tools je gebruikt
Om een workflow te optimaliseren is het belangrijk dat je alleen gebruikt wat je nodig hebt. Dat klinkt misschien logisch, maar in de praktijk kan je al snel het proces vertragen zonder dat je dit doorhebt. Veel gebruikers hebben tools in de workflow die ze niet meer nodig hebben, of gebruiken tools die veel invloed hebben op de verwerkingssnelheid omdat ze alle data lezen.
Er zijn een aantal tools die alle data lezen van een dataset, hierdoor vertragen ze de verwerkingssnelheid aanzienlijk. Het is natuurlijk niet altijd mogelijk, maar indien dit kan, dan is het beter om deze tools te verwijderen. Soms is het mogelijk om de tool te vervangen met een andere tool. De volgende tools zijn zwaar voor een workflow:
- Spatial tools
- Join tools
- Sort tool
- Unique tool
In deze blog heb ik beschreven hoe je kan achterhalen welke individuele tools in je workflow veel invloed hebben op de verwerkingssnelheid.
2. Verwijder kolommen die je niet gebruikt
Als je een workflow wilt optimaliseren, dan is het verstandig om zo vroeg mogelijk in een flow data te verwijderen die je niet gaat gebruiken. Er zijn verschillende tools die kolommen kunnen verwijderen, maar een goede keuze is vaak de Select Tool, hiermee kan je namelijk al aan het begin van de workflow de kolommen verwijderen.
3. Gebruik een sample van de data
Het is vaak niet nodig om de hele dataset te gebruiken tijdens het testen en bouwen van je workflow. Door slechts een deel van de data te gebruiken kan je de verwerkingssnelheid aanzienlijk versnellen. Met de Sample Tool kan je zelf een gedeelte van de dataset selecteren, bijvoorbeeld de eerste 100 rijen. Dit is natuurlijk geen willekeurige set, maar voor het testen van een flow maakt dat niet altijd uit.
Als je een willekeurige set wilt, dan kan je het beste de Create Samples Tool gebruiken. Je kan met deze tool een percentage van de data kiezen die je wilt gebruiken, deze set is wel willekeurig. Of je nu de Sample Tool, of de Create Samples Tool gebruikt, vergeet niet de tool te verwijderen voordat je flow af is.
4. Selecteer het juiste type data
Een Auto Field tool kan zeer handig zijn om het meest efficiënte datatype te selecteren. Een aanpassing van een paar bytes kan soms klein lijken, maar kan veel invloed hebben op een grote dataset. De tool kiest voor alle geselecteerde kolommen het type en het kleinste formaat.
Het is verstandig om de veranderingen te controleren, want het kan zijn dat de tool de verkeerde aanpassingen maakt. De aanpassingen kan je bekijken door de Auto Field Tool te selecteren en op de Metadata knop te drukken in de Results Window.
Conclusie
Deze informatie over de invloed van tools op het optimaliseren van een workflow hebben mij veel geholpen om mijn workflows sneller te bouwen. Het hangt natuurlijk altijd af van de data en de bouw van de flow welke tips je kan gebruiken, maar één aanpassing kan al veel invloed hebben.
Wil je nog meer leren over Alteryx, Tableau of The Information Lab, check dan ons blog.
Heb je meer hulp of uitleg nodig? Aarzel dan niet om contact met ons op te nemen voor onze workshops en trainingen of huur een consultant in.