Advanced Data Science met Python

Binnenkort verschijnen nieuwe startdata & prijzen

Advanced Data Science met Python

Wil je meer leren over data science, maar weet je niet waar je moet beginnen? Ontdek de toepasbaarheid van data science in verschillende vakgebieden en leer hoe data science je kan helpen datagedreven beslissingen te nemen.

Binnenkort verschijnen nieuwe startdata & prijzen

Over deze opleiding

De cursus leert je toepassingen als klantenclustering, een aanbevelingssysteem en aankoopgedrag te analyseren. En zelfs te voorspellen welke doelgroep een product koopt.
Met behulp van Jupyter Notebook leer je passende algoritmes toe te passen op data. Je ontdekt welke bedrijfsproblemen worden opgelost met welk algoritme en hoe de resultaten en inzichten uit data te visualiseren en uit te leggen. 

Voor wie

De opleiding is geschikt voor iedereen die affiniteit heeft met data en graag een probleem oplost door toepassing van een data science-algoritme. De opleiding leert je hoe elke stap van een probleem met data science kan worden opgelost.
De analyses worden in Jupyter Notebook gedaan voor de leesbaarheid en de herbruikbaarheid.

Programma

Sessie 1: Introductie tot data science

3u
Introductie tot data science. De cursist leert 2 grote groepen van artificiële intelligentie: unsupervised en supervised learning. Er wordt een inleiding gegeven tot de meest belangrijke technieken zoals regressieanalyse, k-means clustering, decision trees, logistic regression.

Sessie 2: Pandas & Numpy

3u
Pandas & Numpy introduceren de cursist in de basis van de Python programmeeromgeving, inclusief fundamentele Python programmeertechnieken zoals lambdas, het lezen en manipuleren van .csv bestanden, en de Numpy bibliotheek. Deze sessie introduceert datamanipulatie en opschoningstechnieken met behulp van de populaire Python Pandas data science library en introduceert de abstractie van de Series en DataFrame als de centrale datastructuren voor data-analyse, samen met tutorials over hoe functies zoals groupby, merge en draaitabellen effectief te gebruiken. Tegen het einde van deze sessie zullen de cursisten in staat zijn om gegevens in tabelvorm te nemen, op te schonen, te manipuleren en elementaire statistische analyses uit te voeren.

Sessie 3: Matplotlib & Seaborn

3u
Matplotlib & Seaborn
In deze sessie wordt er dieper in gegaan op Exploratieve Data Analyse - EDA wordt door data scientists gebruikt om datasets te analyseren en te verkennen en de belangrijkste kenmerken ervan samen te vatten. Meestal gebeurt dit met behulp van datavisualisatiemethoden.
EDA maakt het voor data scientists gemakkelijker om patronen te ontdekken, anomalieën op te sporen, een hypothese te testen of aannames te controleren. EDA wordt vooral gebruikt om de variabelen van de dataset en hun relaties beter te begrijpen. EDA kan ook helpen bepalen of de statistische technieken die men overweegt, geschikt zijn voor gegevensanalyse.

Sessie 4: Scikitlearn

3u
Scikitlearn
Lineaire regressie is een van de meest voorkomende en populaire algoritmen in Machine Learning. Meestal is dit zelfs het eerste algoritme dat je tegenkomt bij het leren van Machine Learning. Lineaire regressie is, zoals de naam al aangeeft, een model dat uitgaat van een lineair verband tussen de onafhankelijke variabele (x) en de afhankelijke of doelvariabele (y).
Lineaire regressie wordt gebruikt bij het schatten van huisprijzen. In deze bouwen we een model voor schattingen.

Sessie 5: Market Basket Analysis

3u
Market Basket Analysis
Market Basket Analysis is een techniek die door handelaren wordt gebruikt om verbanden tussen artikelen te ontdekken. Er wordt gezocht naar combinaties van artikelen die in transacties vaak samen voorkomen, wat informatie oplevert om het aankoopgedrag te begrijpen. Het resultaat van dit type techniek is, eenvoudig gezegd, een reeks regels die kunnen worden opgevat als "als dit, dan dat". Dit laat je als onderneming toe een beter marketingbeleid te voeren.

Sessie 6: Recommendation systems

3u
Recommendation systems
Deze sessie is een praktische inleiding tot de belangrijkste recommendation systems technieken. Het doel van een recommendation systems is gebruikers relevante items aan te bevelen, op basis van hun voorkeur. Voorkeur en relevantie zijn subjectief, en worden in het algemeen afgeleid uit items die gebruikers eerder hebben geconsumeerd.

Sessie 7: Clustering

3u
Clustering
K-Means clustering is het populairste algoritme voor machinaal unsupervised learning. K-Means clustering wordt gebruikt om groepen binnen een dataset te vinden en daaruit conclusies te trekken. In deze sessie wordt K-Means clustering geïmplementeerd om intrinsieke groepen binnen de dataset te vinden die hetzelfde gedrag vertonen. 
Dezelfde techniek passen we in deze sessie toe op de vastgoedmarkt. Zo kan je kleinere samenhangende market ontdekken.

Sessie 8: Customer Propensity Modelling & Churn

3u
Customer Propensity Modelling & Churn
Propensity modelling is een benadering voor het bouwen van predicitive analytics om het gedrag van een doelgroep te voorspellen door hun gedragingen uit het verleden te analyseren. Met andere woorden, propensity-modellen helpen de waarschijnlijkheid te bepalen dat iemand een specifieke actie uitvoert. Deze acties kunnen variëren van het accepteren van een gepersonaliseerde aanbieding of het doen van een aankoop tot het aanmelden voor een nieuwsbrief of churning.
De cursisten leren een logistische regressie en een confusion matrix bouwen om het model te beoordelen.

Trainers en docenten

Onze trainers en docenten zijn echte experten uit het werkveld. Zij staan klaar om ondernemende studenten, professionals en bedrijven te inspireren en verder te helpen. Met een sterk netwerk aan freelance trainers en docenten haalt PXL-NeXT de beste expertise in huis!

Lees meer
Trainers

kmo-portefeuille

Thema: Digitalisering - Software

De kmo-portefeuille is een subsidie van de Vlaamse Overheid waardoor je tot 30% van je inschrijvingsgeld kan recupereren. Lees hier hoe de KMO-portefeuille in zijn werk gaat. 

Netto verschuldigd bedrag voor:

* middelgrote ondernemingen

** kleine ondernemingen

Praktische info:

De analyses worden in Jupyter Notebook gedaan voor de leesbaarheid en hergebruikbaarheid.
BYOD (Bring Your Own Device): om aan deze opleiding te kunnen deelnemen, breng je je eigen laptop mee. 

Lesdata: 4 lesdagen telkens van 9 uur tot 16.30 uur

Locatie: PXL-NeXT - Campus Corda (Gebouw 1, 1ste verdieping)

Koffie, thee, water en lunch worden voorzien

Contact:
Wim Guldentops
business developer IT
g| +32 (0) 476 57 04 92       
e| wim.guldentops@pxl-next.be

Ik wil meer weten

Vond je geen antwoord op je vraag? Stel ze hier aan onze medewerkers.