- Wprowadzenie do R i RStudio
- R jako język programowania i RStudio jako wygodny interfejs użytkownika
- Typy danych w R: skalar, wektor, macierz, ramka danych, factor, lista
- R jako kalkulator: operatory arytmetyczne, porównawcze i logiczne, rodzaje poleceń: wyrażenia vs przypisania
- Przetwarzanie danych: wybór elementów wektora/macierzy na podstawie indeksów, tworzenie nowych kolumn w ramce danych, wybór wierszy z ramki danych na podstawie warunków
- Podstawowa analiza danych numerycznych (obliczanie średniej, sumy, itp.) i tekstowych (tabela częstości)
- Statystyka opisowa
- Rodzaje danych statystycznych: ilościowe vs jakościowe
- Obliczanie i interpretacja statystyk opisowych dotyczących wartości przeciętnej, zróżnicowania oraz kształtu rozkładu zmiennej ilościowej
- Nieparametryczne miary rozkładu: dominanta/moda, mediana, kwartyle, decyle, kwantyle
- Podsumowanie rozkładu zmiennej jakościowej – tabele częstości
- Wnioskowanie statystyczne
- Popularne rozkłady prawdopodobieństwa, m.in. jednostajny, normalny, t-Studenta, Chi-kwadrat, F-Snedecora
- Generowanie liczb (pseudo)losowych, określanie ziarna generatora
- Estymacja punktowa vs. estymacja przedziałowa: przedział ufności, poziom istotności, wartość p
- Testowanie hipotez dotyczących średniej i wariancji w jednej próbie
- Testowanie hipotez dotyczących porównania średniej i wariancji w dwóch próbach zależnych i dwóch próbach niezależnych
- Analiza korelacji liniowej Pearsona i Spearmana dla zmiennych ilościowych
- Analiza zależności dla zmiennych jakościowych (test chi-kwadrat)
- Testowanie hipotez dotyczących średniej i wariancji w więcej niż dwóch próbach niezależnych (jednoczynnikowa ANOVA), testy porównań wielokrotnych
- Testy nieparametryczne do porównywania rozkładów: test Wilcoxona-Manna-Whitney’a, test Kruskala-Wallisa
- Analiza regresji liniowej w R
- Założenia modelu regresji liniowej, interpretacja wyników regresji (parametry, dopasowanie, istotność zmiennych i modelu)
- Jakościowe zmienne objaśniające w modelu
- Wykrywanie obserwacji nietypowych
- Metody doboru zmiennych
- Diagnostyka modelu, testowanie spełnienia założeń: testowanie normalności reszt, testowanie homoskedastyczności, testowanie braku autokorelacji
- Postępowanie w przypadku niespełnienia założeń
- Regresja logistyczna
- Prognozowanie na podstawie stworzonego modelu, sprawdzanie jakości prognozy, podział na próbę uczącą i testową
- Wizualizacja danych z wykorzystaniem pakietu ggplot2
- Przegląd typów wykresów
- Dodawanie i dostosowywanie elementów wykresu
- Wizualizacja danych w grupach i podgrupach
- Tworzenie wykresów z wykorzystaniem kreatora (pakiet esquisse)
- Wykresy interaktywne (pakiet ggplotly)
- Przykładowe pakiety wspomagające tworzenie wykresów
- Zestawianie kilku wykresów w jednym oknie graficznym
- Eksport wykresów do różnych formatów plików
- Zarządzanie danymi w R
- Sortowanie i filtrowanie baz danych wg. wybranych kryteriów – pakiet dplyr
- Praca ze zmiennymi tekstowymi – pakiety stringr i glue
- Rekodowanie zmiennych jakościowych (np. łączenie kilku poziomów w jeden) – pakiet forcats
- Zamiana zmiennej ilościowej na jakościową (podział na przedziały) – cut()
- Praca z danymi w formacie daty – pakiet lubridate
- Łącznie kilku baz danych według pola z „kluczem” – funkcje *_join()
- Podstawy programowania w R
- Struktury danych w R – praca z ramkami danych (data frames) oraz z listami – operator $, funkcja class()
- „Potoki” poleceń – operator >
- Tworzenie własnych funkcji
- Pętle i przetwarzanie warunkowe – for(), if … else, ifelse()
- Korzystanie z wartości domyślnych dla argumentów funkcji
- Jednoczesne przekazywanie wielu argumentów do funkcji już istniejących – mechanizm „…”
- Automatyzacja powtarzalnych obliczeń – pakiet purrr
- Podstawowa obsługa błędów – funkcje stop() i tryCatch(); possibly()
- Debugging – lokalizowanie błędów w kodzie i poszukiwanie ich przyczyn
- Praca z plikami zewnętrznymi
- Import/eksport danych do/z R z/do innych formatów (np. pliki tekstowe, csv, Excel, SPSS)- pakiety foreign i readxl
- Współpraca R z pakietem MS Office
- Tworzenie raportów z analiz w R w postaci dokumentów MS Word – pakiet officer
- Stosowanie własnych szablonów raportów w MS Word
- Zarządzanie zawartością plików Excela z poziomu R – pakiet openxlsx
- Wykorzystanie wcześniejszych elementów szkolenia do utworzenia rozbudowanego raportu z wykonanych analiz
- Gdzie szukać pomocy
- Korzystanie z plików pomocy
- Strony WWW autorów pakietów
Kurs Analiza danych w RK-ANALIZA-R
Obecnie brak terminów otwartych. Dostępne na zamówienie dla grup.
Warszawa
-
02.04 - dzienny (dwa bloki 3-dniowe, średnio co 2 tyg.)
Zdalnie
-
02.04 - dzienny (dwa bloki 3-dniowe, średnio co 2 tyg.)
Tryb zdalny: online na żywo z trenerem i grupą (→ więcej o kursach zdalnych). Można: zrezygnować do 15 dni przed startem; w każdej chwili przejść na tryb zdalny; w razie potrzeby skorzystać z nagrań. Kursy dostępne również na zamówienie, w terminie i lokalizacji do uzgodnienia, dla grup od 6 osób.
Cena kursu: 3590 PLN
lub 718 PLN miesięcznie (5 rat)
first minute (30+ dni do startu) - 3%
dostęp do nagrań w razie potrzeby
dla chętnych bezpłatnie warsztaty HR
praktyczne ćwiczenia i miniprojekty
poczęstunek w cenie
stanowisko komputerowe w cenie
Logo