Kategorie: Analiza danych, statystyka, data science, AI, R
Szkolenie przeznaczone jest dla osób, które chcą poznać podstawowe techniki data mining lub odświeżyć bądź uzupełnić swoją wiedzę na ich temat. Ideą szkolenia jest dokonanie przeglądu najpopularniejszych metod data mining, wskazanie obszarów ich stosowania oraz zapoznanie uczestników z implementacjami tychże metod w R. Po ukończeniu szkolenia, uczestnik będzie potrafił dobrać odpowiednią metodę do problemu, przed którym staje, wykonać obliczenia w R oraz zinterpretować ich wyniki. Omówione podczas szkolenia techniki są elementami składowymi bardziej złożonych algorytmów analizy danych. Uczestnik szkolenia nabędzie więc wiedzę i umiejętności niezbędne do dalszego zgłębiania tajników analizy danych i konstruowania własnych rozwiązań analitycznych.
Program szkolenia kładzie dużo większy nacisk na praktyczne stosowania omawianych technik niż na stojącą za nimi teorię. Teoretyczne aspekty analizy danych są uczestnikom sygnalizowane, tak by byli oni świadomi nie tylko zalet, ale też i wad stosowanych przez siebie metod.
Gros szkolenia stanowią warsztaty praktyczne, podczas których wykorzystywany jest język R. Podstawowa jego znajomość jest więc bardzo przydatnym atutem. Nie jest jednak obowiązkowa. Wszystkie wykorzystywane podczas szkolenia pakiety (czyli rozszerzenia) R są „samowystarczalne” – nie wymagają żadnej znajomości poleceń spoza omawianego podczas szkolenia obszaru.
Czas trwania
3 dni
Program
- Metody redukcji wymiaru
- analiza składowych głównych (PCA, principal component analysis),
- analiza czynnikowa (EFA, exploratory factor analysis),
- skalowanie wielowymiarowe (MDS, multidimensional scaling).
- Analiza skupień (grupowanie, klastrowanie)
- metoda K-średnich (K-means clustering),
- grupowanie wokół centroidów (PAM, partitioning around medoids),
- klastrowanie hierarchiczne (hierarchical clustering).
- Analiza dyskryminacyjna (klasyfikacja)
- metoda K-najbliższych sąsiadów (KNN, K-nearest neighbours),
- liniowa analiza dyskryminacyjna (LDA, linear discriminant analysis),
- kwadratowa analiza dyskryminacyjna (QDA, quadratric discriminant analysis).
- Metoda wektorów nośnych (SVM, support vector machines)
- Drzewa klasyfikacyjne i regresyjne
- drzewa klasyfikacyjne (classification trees),
- drzewa regresyjne (regression trees),
- las losowy (random forest).
- Metody weryfikacja jakości algorytmów i doboru wartości parametrów
- sprawdzian krzyżowy (cross-validation),
- bootrstrap.
- “Meta-techniki”
- metody “zespołowe” (ensemble learning),
- agregacja bootstrapowa (bootstrap aggregating, bagging),
- wzmacnianie (boosting),
- algorytm XGBoost.
Training also available in English.
Przeznaczenie i wymagania
Brak szczegółowych wymagań wobec uczestników szkolenia.
Certyfikaty
Uczestnicy szkolenia otrzymują imienne certyfikaty sygnowane przez ALX.