Kategorie: Analiza danych, statystyka, data science, AI, R
Szkolenie skierowane jest do osób, które potrafią już wykorzystać R jako narzędzie do obliczeń statystycznych, a chciałyby nauczyć się również korzystać z niego jak z pełnoprawnego języka programowania – którym zresztą jest. R stworzony został do analizy danych i w takim celu zwykle jest używany. Celem szkolenia jest więc przede wszystkim przedstawienie sposobów na usprawnienie realizacji zadań związanych z przetwarzaniem danych i, równie ważnym, raportowaniem wyników tegoż przetwarzania.
Oprócz, obecnych w programie każdego szkolenia z programowania w każdym języku: pętli, wykonań warunkowych i klas obiektów – uczestnicy poznają również narzędzia ułatwiające pracę z bazami danych (filtrowanie, sortowanie, modyfikowanie zmiennych itp.) oraz współpracę z pakietem MS Word i MS Excel. Pliki tych dwóch programów służą podczas szkolenia jako wygodne dla szerokiego odbiorcy formy przekazywania danych oraz prezentacji wyników obliczeń.
Szkolenie kierujemy do osób, które: znają podstawy R, potrafią wykonać w nim podstawowe przekształcenia danych, skorzystać z podstawowych funkcji (np. wyliczyć średnią czy medianę) i przeprowadzić podstawowe testy statystyczne (np. test t-Studenta czy test Shapiro-Wilka). Umiejętność programowania w żadnym języku nie jest wymagana.
Czas trwania
3 dni
Program
- Zarządzanie danymi w R
- Sortowanie i filtrowanie baz danych wg. wybranych kryteriów – pakiet dplyr
- Praca ze zmiennymi tekstowymi – pakiety stringr i glue
- Rekodowanie zmiennych jakościowych (np. łączenie kilku poziomów w jeden) – pakiet forcats
- Zamiana zmiennej ilościowej na jakościową (podział na przedziały) – cut()
- Praca z danymi w formacie daty – pakiet lubridate
- Łącznie kilku baz danych według pola z „kluczem” – funkcje *_join()
- Podstawy programowania w R
- Struktury danych w R – praca z ramkami danych (data frames) oraz z listami – operator $, funkcja class()
- „Potoki” poleceń – operator >
- Tworzenie własnych funkcji
- Pętle i przetwarzanie warunkowe – for(), if … else, ifelse()
- Korzystanie z wartości domyślnych dla argumentów funkcji
- Jednoczesne przekazywanie wielu argumentów do funkcji już istniejących – mechanizm „…”
- Automatyzacja powtarzalnych obliczeń – pakiet purrr
- Podstawowa obsługa błędów – funkcje stop() i tryCatch(); possibly()
- Debugging – lokalizowanie błędów w kodzie i poszukiwanie ich przyczyn
- Praca z plikami zewnętrznymi
- Import/eksport danych do/z R z/do innych formatów (np. pliki tekstowe, csv, Excel, SPSS)- pakiety foreign i readxl
- Współpraca R z pakietem MS Office
- Tworzenie raportów z analiz w R w postaci dokumentów MS Word – pakiet officer
- Stosowanie własnych szablonów raportów w MS Word
- Zarządzanie zawartością plików Excela z poziomu R – pakiet openxlsx
- Wykorzystanie wcześniejszych elementów szkolenia do utworzenia rozbudowanego raportu z wykonanych analiz
- Gdzie szukać pomocy
- Korzystanie z plików pomocy
- Strony WWW autorów pakietów
Training also available in English.
Przeznaczenie i wymagania
Znajomość statystyki ani R nie jest konieczna do uczestnictwa w szkoleniu.
Certyfikaty
Uczestnicy szkolenia otrzymują imienne certyfikaty sygnowane przez ALX.