Kurs Analiza danych w RK-ANALIZA-R

  • Język R
  • RStudio
  • ReporteRs
  • XLConnect
  • BERT
  • RExcel

Obecnie brak terminów otwartych. Dostępne na zamówienie dla grup.

Warszawa
  • 02.04 - dzienny (dwa bloki 3-dniowe, średnio co 2 tyg.)
Zdalnie
  • 02.04 - dzienny (dwa bloki 3-dniowe, średnio co 2 tyg.)

Tryb zdalny: online na żywo z trenerem i grupą (→ więcej o kursach zdalnych). Można: zrezygnować do 15 dni przed startem; w każdej chwili przejść na tryb zdalny; w razie potrzeby skorzystać z nagrań. Kursy dostępne również na zamówienie, w terminie i lokalizacji do uzgodnienia, dla grup od 6 osób.

4,6/5 (54)
Stars
dla firm - netto
dla osób prywatnych - brutto (pokrywamy VAT)
dla podmiotów publicznych - zwolnione z VAT

Cena kursu: 3590 PLN

lub 718 PLN miesięcznie (5 rat)


percent icon first minute (30+ dni do startu) - 3%

percent icon dostęp do nagrań w razie potrzeby

shake hand icon dla chętnych bezpłatnie warsztaty HR

percent icon praktyczne ćwiczenia i miniprojekty

coffee cup icon poczęstunek w cenie

desktop icon stanowisko komputerowe w cenie

  1. Wprowadzenie do R i RStudio
    • R jako język programowania i RStudio jako wygodny interfejs użytkownika
    • Typy danych w R: skalar, wektor, macierz, ramka danych, factor, lista
    • R jako kalkulator: operatory arytmetyczne, porównawcze i logiczne, rodzaje poleceń: wyrażenia vs przypisania
    • Przetwarzanie danych: wybór elementów wektora/macierzy na podstawie indeksów, tworzenie nowych kolumn w ramce danych, wybór wierszy z ramki danych na podstawie warunków
    • Podstawowa analiza danych numerycznych (obliczanie średniej, sumy, itp.) i tekstowych (tabela częstości)
  2. Statystyka opisowa
    • Rodzaje danych statystycznych: ilościowe vs jakościowe
    • Obliczanie i interpretacja statystyk opisowych dotyczących wartości przeciętnej, zróżnicowania oraz kształtu rozkładu zmiennej ilościowej
    • Nieparametryczne miary rozkładu: dominanta/moda, mediana, kwartyle, decyle, kwantyle
    • Podsumowanie rozkładu zmiennej jakościowej – tabele częstości
  3. Wnioskowanie statystyczne
    • Popularne rozkłady prawdopodobieństwa, m.in. jednostajny, normalny, t-Studenta, Chi-kwadrat, F-Snedecora
    • Generowanie liczb (pseudo)losowych, określanie ziarna generatora
    • Estymacja punktowa vs. estymacja przedziałowa: przedział ufności, poziom istotności, wartość p
    • Testowanie hipotez dotyczących średniej i wariancji w jednej próbie
    • Testowanie hipotez dotyczących porównania średniej i wariancji w dwóch próbach zależnych i dwóch próbach niezależnych
    • Analiza korelacji liniowej Pearsona i Spearmana dla zmiennych ilościowych
    • Analiza zależności dla zmiennych jakościowych (test chi-kwadrat)
    • Testowanie hipotez dotyczących średniej i wariancji w więcej niż dwóch próbach niezależnych (jednoczynnikowa ANOVA), testy porównań wielokrotnych
    • Testy nieparametryczne do porównywania rozkładów: test Wilcoxona-Manna-Whitney’a, test Kruskala-Wallisa
  4. Analiza regresji liniowej w R
    • Założenia modelu regresji liniowej, interpretacja wyników regresji (parametry, dopasowanie, istotność zmiennych i modelu)
    • Jakościowe zmienne objaśniające w modelu
    • Wykrywanie obserwacji nietypowych
    • Metody doboru zmiennych
    • Diagnostyka modelu, testowanie spełnienia założeń: testowanie normalności reszt, testowanie homoskedastyczności, testowanie braku autokorelacji
    • Postępowanie w przypadku niespełnienia założeń
    • Regresja logistyczna
    • Prognozowanie na podstawie stworzonego modelu, sprawdzanie jakości prognozy, podział na próbę uczącą i testową
  5. Wizualizacja danych z wykorzystaniem pakietu ggplot2
    • Przegląd typów wykresów
    • Dodawanie i dostosowywanie elementów wykresu
    • Wizualizacja danych w grupach i podgrupach
    • Tworzenie wykresów z wykorzystaniem kreatora (pakiet esquisse)
    • Wykresy interaktywne (pakiet ggplotly)
    • Przykładowe pakiety wspomagające tworzenie wykresów
    • Zestawianie kilku wykresów w jednym oknie graficznym
    • Eksport wykresów do różnych formatów plików
  6. Zarządzanie danymi w R
    • Sortowanie i filtrowanie baz danych wg. wybranych kryteriów – pakiet dplyr
    • Praca ze zmiennymi tekstowymi – pakiety stringr i glue
    • Rekodowanie zmiennych jakościowych (np. łączenie kilku poziomów w jeden) – pakiet forcats
    • Zamiana zmiennej ilościowej na jakościową (podział na przedziały) – cut()
    • Praca z danymi w formacie daty – pakiet lubridate
    • Łącznie kilku baz danych według pola z „kluczem” – funkcje *_join()
  7. Podstawy programowania w R
    • Struktury danych w R – praca z ramkami danych (data frames) oraz z listami – operator $, funkcja class()
    • „Potoki” poleceń – operator >
    • Tworzenie własnych funkcji
    • Pętle i przetwarzanie warunkowe – for(), if … else, ifelse()
    • Korzystanie z wartości domyślnych dla argumentów funkcji
    • Jednoczesne przekazywanie wielu argumentów do funkcji już istniejących – mechanizm „…”
    • Automatyzacja powtarzalnych obliczeń – pakiet purrr
    • Podstawowa obsługa błędów – funkcje stop() i tryCatch(); possibly()
    • Debugging – lokalizowanie błędów w kodzie i poszukiwanie ich przyczyn
    • Praca z plikami zewnętrznymi
    • Import/eksport danych do/z R z/do innych formatów (np. pliki tekstowe, csv, Excel, SPSS)- pakiety foreign i readxl
  8. Współpraca R z pakietem MS Office
    • Tworzenie raportów z analiz w R w postaci dokumentów MS Word – pakiet officer
    • Stosowanie własnych szablonów raportów w MS Word
    • Zarządzanie zawartością plików Excela z poziomu R – pakiet openxlsx
    • Wykorzystanie wcześniejszych elementów szkolenia do utworzenia rozbudowanego raportu z wykonanych analiz
  9. Gdzie szukać pomocy
    • Korzystanie z plików pomocy
    • Strony WWW autorów pakietów