Szkolenie: Podstawy analizy danych w RR-INTRO

Dostępne na zamówienie dla grup.

Warszawa
  • 02.04 - dzienny (zajęcia w dni powszednie)
Zdalnie
  • 02.04 - dzienny (zajęcia w dni powszednie)
Żaden termin nie pasuje? Zaproponuj własny termin szkolenia

Tryb zdalny: online na żywo z trenerem i grupą. Zobacz więcej o kursach zdalnych i zakł. "Terminy".
Można: zrezygnować do 15 dni przed startem; w każdej chwili przejść z trybu "na sali" na zdalny.
Dostępne również na zamówienie, w terminie i lokalizacji do uzgodnienia, dla grup od 4 osób.

4,7/5 (123)
Stars
cena netto
dla podmiotów publicznych - zwolnione z VAT

Cena szkolenia: 1990 PLN

poczęstunek w cenie

stanowisko komputerowe w cenie

Kategorie: Analiza danych, statystyka, data science, AI, R

To praktyczne i kompleksowe szkolenie przygotowaliśmy dla wszystkich kursantów, którzy chcą poznać tajniki analizy danych w szybko zyskującym popularność programie statystycznym R.

Wiedzę o programie R uzyskaną na początku szkolenia kursanci będą mogli od razu wykorzystać podczas nauki podstaw statystyki. Drugiego dnia skupimy się na regresji liniowej – jednej z podstawowych metod analizy stosowanej w małych i dużych firmach. Trzeciego dnia poszerzymy znajomość R i uczymy się wykorzystywać jego możliwości do prezentowania wyników w formie czytelnych wykresów.

Szkolenie prowadzone jest w formie warsztatów, gdzie teoria przeplata się z praktyką umożliwiając natychmiastowe przećwiczenie nowo poznanych narzędzi na życiowych, praktycznych przykładach.

Szkolenie jest dość intensywne i skupia się na warsztacie analityka – poznaniu środowiska R i wykorzystaniu go do przeprowadzenia przerabianych przykładów. Nie uczymy tutaj samych idei/fundamentów analizy danych od podstaw. Osobom, które dopiero zaczynają przygotowanie do pracy analityka, sugerujemy nasz dłuższy, pełny kurs Analiza danych w R.

Czas trwania

3 dni

Program

  1. Wprowadzenie do R i RStudio
    • R jako język programowania i RStudio jako wygodny interfejs użytkownika
    • Typy danych w R: skalar, wektor, macierz, ramka danych, factor, lista
    • R jako kalkulator: operatory arytmetyczne, porównawcze i logiczne, rodzaje poleceń: wyrażenia vs przypisania
    • Przetwarzanie danych: wybór elementów wektora/macierzy na podstawie indeksów, tworzenie nowych kolumn w ramce danych, wybór wierszy z ramki danych na podstawie warunków
    • Podstawowa analiza danych numerycznych (obliczanie średniej, sumy, itp.) i tekstowych (tabela częstości)
  2. Statystyka opisowa
    • Rodzaje danych statystycznych: ilościowe vs jakościowe
    • Obliczanie i interpretacja statystyk opisowych dotyczących wartości przeciętnej, zróżnicowania oraz kształtu rozkładu zmiennej ilościowej
    • Nieparametryczne miary rozkładu: dominanta/moda, mediana, kwartyle, decyle, kwantyle
    • Podsumowanie rozkładu zmiennej jakościowej – tabele częstości
  3. Wnioskowanie statystyczne
    • Popularne rozkłady prawdopodobieństwa, m.in. jednostajny, normalny, t-Studenta, Chi-kwadrat, F-Snedecora
    • Generowanie liczb (pseudo)losowych, określanie ziarna generatora
    • Estymacja punktowa vs. estymacja przedziałowa: przedział ufności, poziom istotności, wartość p
    • Testowanie hipotez dotyczących średniej i wariancji w jednej próbie
    • Testowanie hipotez dotyczących porównania średniej i wariancji w dwóch próbach zależnych i dwóch próbach niezależnych
    • Analiza korelacji liniowej Pearsona i Spearmana dla zmiennych ilościowych
    • Analiza zależności dla zmiennych jakościowych (test chi-kwadrat)
    • Testowanie hipotez dotyczących średniej i wariancji w więcej niż dwóch próbach niezależnych (jednoczynnikowa ANOVA), testy porównań wielokrotnych
    • Testy nieparametryczne do porównywania rozkładów: test Wilcoxona-Manna-Whitney’a, test Kruskala-Wallisa
  4. Analiza regresji liniowej w R
    • Założenia modelu regresji liniowej, interpretacja wyników regresji (parametry, dopasowanie, istotność zmiennych i modelu)
    • Jakościowe zmienne objaśniające w modelu
    • Wykrywanie obserwacji nietypowych
    • Metody doboru zmiennych
    • Diagnostyka modelu, testowanie spełnienia założeń: testowanie normalności reszt, testowanie homoskedastyczności, testowanie braku autokorelacji
    • Postępowanie w przypadku niespełnienia założeń
    • Regresja logistyczna
    • Prognozowanie na podstawie stworzonego modelu, sprawdzanie jakości prognozy, podział na próbę uczącą i testową
  5. Wizualizacja danych z wykorzystaniem pakietu ggplot2
    • Przegląd typów wykresów
    • Dodawanie i dostosowywanie elementów wykresu
    • Wizualizacja danych w grupach i podgrupach
    • Tworzenie wykresów z wykorzystaniem kreatora (pakiet esquisse)
    • Wykresy interaktywne (pakiet ggplotly)
    • Przykładowe pakiety wspomagające tworzenie wykresów
    • Zestawianie kilku wykresów w jednym oknie graficznym
    • Eksport wykresów do różnych formatów plików

Pobierz w wersji PDF

Training also available in English.

Przeznaczenie i wymagania

Znajomość statystyki ani R nie jest konieczna do uczestnictwa w szkoleniu.

Certyfikaty

Uczestnicy szkolenia otrzymują imienne certyfikaty sygnowane przez ALX.

Zapisz się
Wybierz interesujący Cię termin oraz miasto
Warszawa:
Zdalnie:
Żaden termin nie pasuje?
Podaj swój adres e-mail, a my powiadomimy Cię o przyszłych terminach