Program studiów podyplomowych

Moduł 1 Podstawowe techniki przetwarzania danych

Wykłady (20 godz.)

  1. Procedura vs własny blok użytkownika
  2. Odczyt i zapis danych
  3. Modyfikacje wierszy i kolumn
  4. Techniki łączenia danych
  5. Budowa własnych funkcji
  6. Przetwarzanie w różnych trybach: ETL, ELT oraz In-database

Laboratorium (15 godz.)

  1. Wyznaczenie rentowności prostego instrumentu finansowego
  2. Wyznaczenie ROI dla grupy instrumentów finansowych o różnych okresach zapadalności
  3. Budowa własnej funkcji wyceny instrumentu finansowego
  4. Opracowanie projektu dotyczącego zastosowań podstawowych technik przetwarzania danych
Moduł 2 -Przetwarzanie danych w architekturze Big Data

Wykłady (15 godz.)

  1. SMP (Symetric Multiprocessing) vs MPP (Massively Parallel Processing)
  2. Procedury SAS High Performance jako przykład modelu MPP
  3. Przetwarzanie danych w trybie In-Memory
  4. Hadoop jako przykładowe repozytorium Big Data

Laboratorium (10 godz.)

  1. Zarządzanie danymi w modeli In-Memory
  2. Podstawowe techniki przetwarzania danych typu Big Data
  3. Opracowanie projektu związanego z wybranymi technikami przetwarzania Big Data
Moduł 3 Statystyka w praktyce

Wykłady (20 godz.)

  1. Testy statystyczne w analizie danych
  2. Techniki próbkowania danych
  3. Techniki identyfikacji i eliminacji redundantnej informacji
  4. Analiza zmiennych kategoryzujących
  5. Podstawowe modele statystyczne
  6. ANOVA, ANCOVA, regresja liniowa

Laboratorium (15 godz.)

  1. Identyfikacja związków liniowych i nieliniowych w danych
  2. Przygotowanie prób: treningowej i walidacyjnej na potrzeby budowy modeli predykcyjnych
  3. Posługiwanie się testami statystycznymi w analizie danych
  4. Budowa modeli liniowych
  5. Opracowanie projektu dotyczącego modelowania statystycznego w analizie danych
 
Moduł 4 Uczenie maszynowe

Wykłady

Wykład wprowadzający: „Uczenie maszynowe w organizacji inteligentnej” (5 godz.)

Wykłady (20 godz.)

  1. Supervised learning – uczenie maszynowe
  2. Krytyczne kroki procesu przygotowania danych: partycjonowanie, imputacja baraków danych, analiza rozkładów
  3. Metody doboru\selekcji zmiennych
  4. Drzewa decyzyjne
  5. Lasy losowe
  6. Regresja logistyczna
  7. Modele złożone
  8. Sieci neuronowe
  9. Walidacja i kalibracja modeli
  10. Współpraca ze środowiskami open-source, standard PMML w praktyce
  11. Unsupervised learning
  12. Techniki segmentacyjne

Laboratorium (20 godz.)

  1. Kompleksowe case study procesu budowy modelu predykcyjnego
  2. Opracowanie projektu dotyczącego uczenia maszynowego
Moduł 5 Modelowanie na potrzeby sektora finansów

Wykłady (25 godz.)

  1. Modelowanie szeregów czasowych
  2. Wycena przykładowego portfela inwestycyjnego

Laboratorium (15 godz.)

  1. Modelowanie szeregu czasowego jako czynnika ryzyka dla procesu wyceny portfela
  2. Definicja i wycena portfela instrumentów finansowych
  3. Opracowanie projektu dotyczącego modelowania na potrzeby sektora finansów