Opis kursu: Kurs adresowany jest do wszystkich osób, które przygotowują prognozy zapotrzebowania na energię elektryczną lub cieplną i jej przyszłego zużycia - w elektrowniach, elektrociepłowniach, zakładach energetycznych itp. Od podstaw wprowadza niezbędne pojęcia statystyczne, a następnie kolejne metody analityczne: analizę regresji, metody prognozowania szeregów czasowych, prognozowanie za pomocą sieci neuronowych, a także metody klasyfikacji. Na kursie poruszane będą nie tylko zagadnienia prognozowania, ale także klasyfikacyjne, np. wyodrębnianie grup klientów o podobnych cechach. Na kursie zostaną wykorzystane rzeczywiste dane pochodzące z polskich przedsiębiorstw.
Wymagania: umiejętność obsługi komputera w środowisku Windows.
Kontynuacją mogą być np. kursy:
Data mining I - kurs podstawowy,
Data mining II b - modele i metody,
Sieci neuronowe,
Praktyczne zastosowania technik regresyjnych w STATISTICA.
Termin: 13-14-15-16.03.2012
Program kursu:
-
Wprowadzenie do statystycznej analizy danych
-
Podstawowe pojęcia
-
Zakres zastosowań metod statystycznych
-
Wybrane operacje na danych
-
Import arkusza MS Excel i sposoby sprawdzania poprawności danych
-
Czyszczenie danych
-
Elementy statystyki opisowej
-
Badanie rozkładu zmiennych
-
Charakterystyki liczbowe rozkładu zmiennej
-
Analiza statystyk opisowych w grupach
-
Elementy wnioskowania statystycznego
-
Testowanie hipotez statystycznych
-
Przykłady weryfikacji hipotez statystycznych
-
Wybrane metody analizy współzależności pomiędzy zmiennymi
-
Wprowadzenie
-
Elementy analizy korelacyjnej
-
Regresja liniowa dwóch zmiennych (regresja prosta)
-
Regresja wieloraka
-
Estymacja modeli nieliniowych
-
Metody prognozowania szeregów czasowych - wprowadzenie
-
Składniki szeregu czasowego
-
Metody prognozowania
-
Miary oceny trafności prognoz
-
Analiza trendu
-
Średnie ruchome
-
Analityczna metoda wyodrębniania trendu
-
Eliminacja trendu
-
Analiza wahań okresowych
-
Sezonowość addytywna i multiplikatywna
-
Metoda Census I
-
Eliminacja wahań okresowych
-
Zastosowanie modeli regresji w prognozowaniu szeregów czasowych
-
Trendy
-
Modele ze zmiennymi zerojedynkowymi
-
Modele autoregresji
-
Uwzględnianie informacji ze zmiennych dodatkowych
-
Trendy jednoimiennych okresów
-
Modele ARIMA
-
Struktura modelu
-
Doprowadzanie analizowanego procesu do stacjonarności
-
Poszukiwanie dopuszczalnego modelu
-
Weryfikacja modelu
-
Wyrównywanie wykładnicze
-
Zasady wyrównywania wykładniczego
-
Wybór modelu
-
Ocena wyników
-
Analiza skupień
-
Podstawy analizy skupień
-
Wybór miary odległości, metody i strategii grupowania
-
Metoda Warda i metoda k-średnich
-
Zastosowanie metod analizy skupień w analizie szeregów czasowych
-
Analiza obserwacji ekstremalnych i nietypowych
-
Analiza dyskryminacyjna
-
Modele logitowe
-
Sieci neuronowe
- Neuron i jego budowa
- Sieć neuronowa - architektura, funkcje aktywacji i błędu
- Uczenie sieci
- Zalety sieci i zagrożenia związane z ich stosowaniem
- Neuronowe modele regresyjne
- Wykorzystanie sieci do prognozowania szeregów czasowych
- Techniki klasyfikacji wzorcowej