Kursy
 Nasze kursy
 Terminarz
 Programy kursów
 Cykle szkoleniowe
 Informacje organizacyjne
 Zgłoszenie
 Broszura w pdf
Inne usługi
 Kursy na zamówienie
 Usługi konsultingowe
 Usługi implementacyjne
 Statystyka w badaniach
naukowych

 Seminaria
 Studia podyplomowe
 Opinie o kursach




Przygotowanie danych na potrzeby analiz i raportowania

Opis kursu: Celem kursu jest przekazanie praktycznej wiedzy i umiejętności w dziedzinie przygotowania danych na potrzeby analiz statystycznych, data mining i raportowania. Z praktycznych doświadczeń wynika zasada obowiązująca dla ogółu zagadnień analizy danych: zdecydowana większość czasu poświęcana jest na przygotowanie danych (najczęściej mówi się o 80%), właściwa analiza wymaga dużo mniej pracy. Przygotowanie danych to przede wszystkim czyszczenie danych, czyli rozwiązywanie problemów z jakością danych. Druga część przygotowania danych, to przekształcenie ich od postaci ułatwiającej uzyskanie pożądanych wyników analiz, np. trafnego modelu lub segmentacji, dobrze opisującej zbiorowość klientów. Kurs 2-dniowy.

Wymagania: umiejętność obsługi komputera w środowisku Windows, znajomość podstaw analizy danych i obsługi programu STATISTICA. Zdecydowanie zalecamy wcześniejszy udział w kursie STATISTICA kurs podstawowy lub Statystyka dla niestatystyków, pomocne może być wcześniejsze odbycie kursów Metodyki data mining i Data mining I - kurs podstawowy.

Kontynuacją mogą być: zaawansowane kursy z cykli Statystyczna analiza danych, Data mining, Prognozowanie oraz Marketing i badania rynku.

Terminy: 2-3.04.2012

Program kursu:

  1. Czyszczenie danych
    1. Analityczne i graficzne wykrywanie obserwacji błędnych i nietypowych
    2. Obsługa i zastępowanie braków danych
    3. Identyfikacja i usuwanie powtórzonych rekordów
  2. Przekształcenia danych
    1. Obliczanie zmiennych pochodnych
    2. Zmiana przypisania kategorii (przekodowania)
    3. Przypisywanie rang
    4. Zmienne opóźnione
    5. Operacje na wartościach tekstowych
  3. Wykorzystanie selekcji przypadków i stanów przypadków
  4. Zmiana układu danych
    1. Scalanie plików
    2. Przekształcenia Ułóż w stertę i Rozrzuć po zmiennych (operacje na danych typu LIMS)
  5. Losowanie i próbkowanie