Poznaj możliwości języka R!
Naucz się, jak profesjonalnie analizować i wizualizować dane
Popularne narzędzia, dużo ćwiczeń, praktyczne umiejętności!
-
Tematyka:Język R, RStudio, analiza danych, import/eksport danych, statystyka opisowa i wizualizacja danych, wnioskowanie statystyczne, rozkłady prawdopodobieństwa, estymacja, testowanie hipotez, analiza korelacji i zależności, analiza regresji liniowej, prognozowanie, współpraca R z pakietem MS Office (pakiety ReporteRs, XLConnect, BERT, RExcel)
-
Zastosowanie:instytucje, duże organizacje, finanse, bankowość, uczelnie wyższe, działy R&D
-
Czas trwania:48 godzin zegarowych zajęć na żywo
+ 24 godziny pracy w domu z naszymi
materiałami = w sumie 72 godzin -
Tryby zajęć:
- weekendowo (sob-niedz., średnio co 2 tygodnie)
- dziennie (dwa 3-dniowe bloki co ok. 2 tyg.)
-
Grupa:Zajęcia stacjonarne - na sali max 12 osób.
Dla kursów zdalnych - do 17 osób łącznie.
-
Rekrutacja:brak wymagań, kurs od kompletnych podstaw
-
Miejsce:Warszawa lub Zdalnie (online na żywo z trenerem i grupą)
-
Elastyczność:a) do 15 dni przed startem można zrezygnować
b) podczas zajęć można:
- przejść z trybu stacjonarnego na zdalny
- ze zdalnego na stacjonarny
- w razie potrzeby otrzymać nagrania z zajęć
- zawiesić uczestnictwo i dokończyć później
(w miarę dostępności miejsc)
-
Cena:3 590 PLN*
Analiza danych i język R
Umiejętność pozyskiwania i analizowania danych jest w dzisiejszych czasach kluczowa, zarówno w obszarze nauki jak i biznesu. Wyciąganie trafnych wniosków ze zbieranych na bieżąco danych, a także danych historycznych, pozwala osiągnąć postęp przy zarządzaniu firmą jak i prowadzeniu badań naukowych.
Nie każda instytucja potrafi wykorzystać potencjał, jaki kryje się w danych. Aby analizować duże ilości, często niepełnych informacji konieczne jest zastosowanie metod statystycznych i znajomość odpowiednich technologii. Te umiejętności zdobędziesz na naszym kursie!
R jest jednym z najpopularniejszych języków do analizy danych dzięki wieloletniemu rozwojowi, bogatemu zapleczu narzędzi i zaangażowanemu środowisku specjalistów z niego korzystających.
Olbrzymie repozytorium gotowych rozwiązań dla R, czyli CRAN, pakiety tidyverse, caret czy ggplot2 i inne stanowią dojrzały ekosystem gotowych do użycia modułów, a założenia przyświecające twórcom języka R pozwalają na sprawne posługiwanie się metodami statystycznymi i efektowną wizualizację danych.
Na naszym kursie można poszerzyć swoją wiedzę o zagadnienia związane z analizą danych i poznać narzędzia wykorzystywane w tym celu.
Od uczestników oczekiwana jest podstawowa znajomość matematyki i obsługi komputera. Jeśli chcesz się dodatkowo przygotować, możesz (ale absolutnie nie musisz) skorzystać z naszej oferty - bootcampa Specjalista MS Excel lub Analiza danych. Nie musisz być profesjonalnym programistą ani mieć doświadczenia w analizie danych.
To nie wykład z matematyki, tylko praktyczne warsztaty
Nie koncentrujemy się na nauce teorii - przekazujemy wiedzę praktyczną. Nauczymy Cię warsztatu analityka - abyś w profesjonalny sposób umiał przygotowywać, analizować i interpretować duże ilości danych, korzystając z języka R i jego dodatków. Podczas zajęć będziesz ćwiczyć poznawane techniki na realistycznych danych, podobnych do tych, z jakimi możesz spotkać się w praktyce zawodowej.
Czego nauczysz się na kursie?
sprawnie używać języka R i pakietu RStudio do przetwarzania danych
stosować statystykę opisową i wizualizację danych w R
prowadzić wnioskowanie statystyczne - testować, estymować, analizować zależności
stosować analizę regresji liniowej w R aby prognozować wyniki
używać języka R wraz z pakietem MS Office
Czy lepiej wybrać język R czy Python?
Zarówno język R jak i Python są wykorzystywane do analizy danych. Przy zastosowaniu najnowszych pakietów dla tych języków ich możliwości przy pracy z danymi są bardzo zbliżone. Pewne różnice pojawiają się, gdy weźmie się pod uwagę genezę tych języków, ich główne zastosowania oraz szerszy kontekst.
Język R został stworzony do zastosowań statystycznych, budowy modeli, np. ekonometrycznych i do wizualizacji danych. Jest uznawany raczej za język stosowany w środowiskach akademickich i podmiotach, dla których analiza danych jest jednym z głównych obszarów działalnności. Ekosystem i środowisko języka R, pomimo dostępności wielu pakietów, jest stosunkowo proste w instalacji. Język R jest prawdopodobnie lepszym wyborem dla osób, które bardziej są zainteresowane "czystą" pracą z danymi i statystyką.
Język Python, tak jak np. C++ czy Java, jest obiektowym językiem programowania. Ma on bardzo szerokie zastosowanie, nie tylko służy do analizy danych, ale też np. do budowy serwisów internetowych, skryptów automatyzujących pracę i innych rozwiązań zarówno akademickich jak i biznesowych. Ze względu na wydajność i uniwersalność wydaje się też lepszym rozwiązaniem do tzw. uczenia maszynowego. Język Python jest prawdopodobnie lepszym wyborem dla osób, które poza analizą danych są też zainteresowane "zwykłym" programowaniem i umieszczeniem swoich rozwiązań analitycznych w ramach zintegrowanych systemów produkcyjnych.
Bardziej od języka R interesuje Cię analiza danych z wykorzystaniem języka Python?
Program kursu
Jest to autorski program, którego nie znajdziesz nigdzie indziej - stworzony przez ludzi, którzy od lat pracują przy analizie danych w firmach i instytucjach.
To obszerny zakres materiału - przekazany w prosty i przystępny sposób. Program kursu jest ułożony tak, abyś w 6 dni mógł poznać podstawy analizy danych z wykorzystaniem języka R i jego dodatków.
W przypadku realizacji szkolenia na zamówienie dla Twojej firmy, możliwe jest indywidualne dostosowanie programu i czasu trwania kursu - np. rozpoczęcie od wprowadzenia do podstawowych zagadnień analizy danych i statystyki lub poruszenie bardziej zaawansowanych tematów związanych np. z uczeniem maszynowym.
Dla kogo jest ten kurs?
-
Dla osób, które chcą zajmować się analizą danych.
Program tego kursu jest tak ułożony, że większość naszych kursantów może rozpocząć pracę przy analizie danych wykorzystując zaprezentowane przez nas narzędzia. -
Dla osób, które na co dzień pracują z dużą ilością danych i chcą nauczyć się je
analizować.
Ten kurs podnosi kwalifikacje zawodowe i otwiera drogę do awansu bądź zmiany pracy na lepszą! - Dla osób, które prowadzą badania
Kurs będzie użyteczny dla wszystkich, którzy na co dzień pracują zbierając dane, np. prowadząc badania na uczelni lub badania rynków i chcą nauczyć się analizować zebrane dane.
Co trzeba umieć przed kursem?
Na kurs zapraszamy wszystkich, którzy znają podstawy matematyki i obsługi komputera. Jeśli chcesz napierw poczuć się pewniej pracując z danymi przy komputerze, możesz (ale absolutnie nie jest to konieczne) skorzystać z innej naszej oferty - bootcampa Specjalista MS Excel lub Analiza danych
Nie jest potrzebne żadne doświadczenie w analizie danych.
Nie musisz być profesjonalnym programistą.
W jaki sposób uczymy?
Postawiliśmy przede wszystkim na zajęcia praktyczne!
Kurs jest zorganizowany w formie warsztatów - to oznacza, że tutaj nie ma wykładów jak na studiach.
Pracujemy w
małych grupach, przez cały czas z trenerem. Wszystkie moduły kursu są wypełnione praktycznymi ćwiczeniami.
Nasi
trenerzy przedstawią Ci zestaw najczęstszych problemów, które w realnych warunkach biznesowych pojawią się
podczas
pracy z danymi - sam przekonasz się jak ważna i unikalna jest to wiedza.
Zapewniamy go! Nowoczesny sprzęt komputerowy będzie do Twojej dyspozycji podczas kursu. Oprócz motywacji i chęci do nauki nie musisz niczego ze sobą zabierać!
Nauka w domu
Kurs trwa 48 godzin i jest bardzo intensywny, ale można i warto wyciągnąć z niego jeszcze więcej! Jak to zrobić? Trzeba przyłożyć się do nauki również w domu. Nasi trenerzy zawsze zachęcają do samodzielnej pracy w domu, przygotowują ciekawe zadania, nad którymi pracujesz w przerwie między zajęciami. Duża ilość ćwiczeń sprawi, że utrwalisz zdobytą wiedzę i bardzo szybko opanujesz technologię. Jeśli masz problem z zadaniem - zawsze możesz skontaktować się ze swoim trenerem.
Nasi trenerzy to zawodowi analitycy
Kurs jest prowadzony przez doświadczonych specjalistów - praktyków. Są to eksperci, którzy na codzień pracują przy analizie danych, finansach i statystyce - mają wieloletnie doświadczenie w nauczaniu i tworzeniu oprogramowania. Prowadzą żywe, obfitujące w realistyczne przykłady zajęcia. Trenerzy pokażą Ci szeroką gamę narzędzi i technik analizy danych oraz nauczą Cię pracy z bazami danych.
Kurs na zamówienie
Możemy zorganizować kurs szyty na miarę - specjalnie dla Twojej firmy. Skutecznie szkolimy już 3 osobowe grupy.
Kurs może odbyć się w naszych biurach w całej Polsce (Warszawa, Łódź, Wrocław, Gdańsk, Katowice, Kraków, Poznań) lub w siedzibie Twojej firmy.
Bardzo często realizujemy szkolenia oparte na danych otrzymanych od klienta. Wówczas nasi trenerzy elastycznie dopasowują program kursu do specyfiki Twoich danych - dobierają odpowiednie metody analizy tych danych, tak aby wycisnąć z nich maksymalnie dużo korzyści dla Twojego biznesu.
Koszt takiego kursu jest ustalany indywidualnie, zależnie od wielkości grupy i miejsca przeprowadzania szkolenia. Kurs może odbywać się również w języku angielskim.
Program szkolenia
- Wprowadzenie do R i RStudio
- R jako język programowania i RStudio jako wygodny interfejs użytkownika
- Typy danych w R: skalar, wektor, macierz, ramka danych, factor, lista
- R jako kalkulator: operatory arytmetyczne, porównawcze i logiczne, rodzaje poleceń: wyrażenia vs przypisania
- Przetwarzanie danych: wybór elementów wektora/macierzy na podstawie indeksów, tworzenie nowych kolumn w ramce danych, wybór wierszy z ramki danych na podstawie warunków
- Podstawowa analiza danych numerycznych (obliczanie średniej, sumy, itp.) i tekstowych (tabela częstości)
- Statystyka opisowa
- Rodzaje danych statystycznych: ilościowe vs jakościowe
- Obliczanie i interpretacja statystyk opisowych dotyczących wartości przeciętnej, zróżnicowania oraz kształtu rozkładu zmiennej ilościowej
- Nieparametryczne miary rozkładu: dominanta/moda, mediana, kwartyle, decyle, kwantyle
- Podsumowanie rozkładu zmiennej jakościowej – tabele częstości
- Wnioskowanie statystyczne
- Popularne rozkłady prawdopodobieństwa, m.in. jednostajny, normalny, t-Studenta, Chi-kwadrat, F-Snedecora
- Generowanie liczb (pseudo)losowych, określanie ziarna generatora
- Estymacja punktowa vs. estymacja przedziałowa: przedział ufności, poziom istotności, wartość p
- Testowanie hipotez dotyczących średniej i wariancji w jednej próbie
- Testowanie hipotez dotyczących porównania średniej i wariancji w dwóch próbach zależnych i dwóch próbach niezależnych
- Analiza korelacji liniowej Pearsona i Spearmana dla zmiennych ilościowych
- Analiza zależności dla zmiennych jakościowych (test chi-kwadrat)
- Testowanie hipotez dotyczących średniej i wariancji w więcej niż dwóch próbach niezależnych (jednoczynnikowa ANOVA), testy porównań wielokrotnych
- Testy nieparametryczne do porównywania rozkładów: test Wilcoxona-Manna-Whitney’a, test Kruskala-Wallisa
- Analiza regresji liniowej w R
- Założenia modelu regresji liniowej, interpretacja wyników regresji (parametry, dopasowanie, istotność zmiennych i modelu)
- Jakościowe zmienne objaśniające w modelu
- Wykrywanie obserwacji nietypowych
- Metody doboru zmiennych
- Diagnostyka modelu, testowanie spełnienia założeń: testowanie normalności reszt, testowanie homoskedastyczności, testowanie braku autokorelacji
- Postępowanie w przypadku niespełnienia założeń
- Regresja logistyczna
- Prognozowanie na podstawie stworzonego modelu, sprawdzanie jakości prognozy, podział na próbę uczącą i testową
- Wizualizacja danych z wykorzystaniem pakietu ggplot2
- Przegląd typów wykresów
- Dodawanie i dostosowywanie elementów wykresu
- Wizualizacja danych w grupach i podgrupach
- Tworzenie wykresów z wykorzystaniem kreatora (pakiet esquisse)
- Wykresy interaktywne (pakiet ggplotly)
- Przykładowe pakiety wspomagające tworzenie wykresów
- Zestawianie kilku wykresów w jednym oknie graficznym
- Eksport wykresów do różnych formatów plików
- Zarządzanie danymi w R
- Sortowanie i filtrowanie baz danych wg. wybranych kryteriów – pakiet dplyr
- Praca ze zmiennymi tekstowymi – pakiety stringr i glue
- Rekodowanie zmiennych jakościowych (np. łączenie kilku poziomów w jeden) – pakiet forcats
- Zamiana zmiennej ilościowej na jakościową (podział na przedziały) – cut()
- Praca z danymi w formacie daty – pakiet lubridate
- Łącznie kilku baz danych według pola z „kluczem” – funkcje *_join()
- Podstawy programowania w R
- Struktury danych w R – praca z ramkami danych (data frames) oraz z listami – operator $, funkcja class()
- „Potoki” poleceń – operator >
- Tworzenie własnych funkcji
- Pętle i przetwarzanie warunkowe – for(), if … else, ifelse()
- Korzystanie z wartości domyślnych dla argumentów funkcji
- Jednoczesne przekazywanie wielu argumentów do funkcji już istniejących – mechanizm „…”
- Automatyzacja powtarzalnych obliczeń – pakiet purrr
- Podstawowa obsługa błędów – funkcje stop() i tryCatch(); possibly()
- Debugging – lokalizowanie błędów w kodzie i poszukiwanie ich przyczyn
- Praca z plikami zewnętrznymi
- Import/eksport danych do/z R z/do innych formatów (np. pliki tekstowe, csv, Excel, SPSS)- pakiety foreign i readxl
- Współpraca R z pakietem MS Office
- Tworzenie raportów z analiz w R w postaci dokumentów MS Word – pakiet officer
- Stosowanie własnych szablonów raportów w MS Word
- Zarządzanie zawartością plików Excela z poziomu R – pakiet openxlsx
- Wykorzystanie wcześniejszych elementów szkolenia do utworzenia rozbudowanego raportu z wykonanych analiz
- Gdzie szukać pomocy
- Korzystanie z plików pomocy
- Strony WWW autorów pakietów