Szczegółowe informacje
 O seminarium
 Tematy wystąpień
 Streszczenia
 Wykładowcy
 Lista referencyjna
 Materiały
 Prezentacje
 Zdjęcia
 Inne seminaria
Powiązane informacje
 Ogólne cechy systemu
 Kursy
 Usługi konsultingowe
 Studia podyplomowe

Seminarium
ANALIZA DANYCH W PROGRAMIE STATISTICA 9 - PRZEGLĄD



Najnowsza wersja STATISTICA 9

Przedstawione zostaną najważniejsze składniki oferty StatSoft Polska w zakresie analizy danych: oprogramowanie STATISTICA oraz usługi szkoleniowe, konsultingowe, wdrożeniowe itp. Szczególna uwaga zostanie poświęcona zmianom, jakie zostały wprowadzone w najnowszej, już dziewiątej wersji oprogramowani STATISTICA.
Program wystąpienia:

  • Wstęp
  • Oprogramowanie STATISTICA
    • Najważniejsze cechy
    • Wybrane zestawy narzędzi analitycznych STATISTICA i rozszerzenia
    • Dedykowane rozwiązania
  • Usługi StatSoft w zakresie analizy danych
    • Kursy otwarte i na zamówienie, warsztaty
    • Konsulting, wdrożenia i inne

Ankieta i co dalej? - system wprowadzania danych i podstawowe narzędzia analizy w badaniach ankietowych

W prezentacji przedstawiony zostanie system wprowadzania danych ankietowych, który umożliwia umieszczenie kwestionariuszy w sieci internetowej i gromadzenie odpowiedzi w centralnej bazie danych. W programie STATISTICA zebrane odpowiedzi ankietowe poddane będą wstępnej obróbce i sprawdzeniu poprawności danych. Następnie do przedstawienia prostych zestawień i podsumowania wyników kwestionariusza wykorzystane zostaną podstawowe narzędzia analityczne stosowane w badaniach ankietowych.

Eksploracja danych, testowanie hipotez badawczych i modelowanie zależności – przykłady w STATISTICA 9

Praktyczne przeprowadzenie analizy zgromadzonych danych składa się zazwyczaj z kilku etapów. Na każdym z tych etapów analityk potrzebuje różnych narzędzi wspomagających przebieg analizy. Przy wstępnej eksploracji danych przydatne są narzędzia do łatwej (analitycznej i graficznej) identyfikacji obserwacji nietypowych oraz możliwość szybkiej oceny ich wpływu na charakterystyki liczbowe rozkładów analizowanych zmiennych. Z kolei na etapie testowania postawionych hipotez badawczych potrzebny jest dostęp do metod sprawdzania założeń, występujących w przypadku określonych testów oraz szeroki zakres wyboru różnych testów parametrycznych i ich nieparametrycznych odpowiedników. W przypadku modelowania zależności pomiędzy analizowanymi zmiennymi wymagany jest zarówno dostęp do predefiniowanych modeli jak również możliwość estymacji parametrów modelu, zdefiniowanego samodzielnie przez użytkownika. W trakcie wystąpienia zostaną pokazane przykłady stosowania wspomnianych powyżej narzędzi analiz statystycznych w środowisku najnowszej wersji programu STATISTICA.

Dopasowanie rozkładu i eksperyment symulacyjny na przykładzie danych o wypadkach drogowych

W prezentacji omówione zostaną możliwości nowego modułu w programie STATISTICA 9 służącego do dopasowywania rozkładów i eksperymentów symulacyjnych. Działanie modułu zostanie przedstawione na żywo na danych dotyczących wypadków drogowych. Przedstawiony zostanie przykładowy scenariusz wypłat z polis AC/OC dla osób poszkodowanych w wypadkach.

  • Krótki wstęp omawiający cel powstania i ogólną funkcjonalność modułu.
    • Dopasowanie rozkładów
      • Dostępne rozkłady ciągłe
      • Dostępne rozkłady dyskretne
      • Informacje o dopasowaniu
    • Eksperymenty symulacyjne – bootstrap parametryczny
      • Sposób generowania nowych danych
      • Zachowanie struktury korelacji
    • Zastosowania
      • Modelowanie zjawisk
      • Analiza ryzyka – tworzenie scenariuszy, analiza „what-if”
      • Testowanie wytrzymałości systemu po drobnej zmianie parametrów modeli
  • Prezentacja danych wykorzystywanych w prezentacji
    • Dane o wypadkach drogowych oraz rannych i zabitych w tych wypadkach
      • Źródło danych: strona WWW Policji
      • Prezentacja danych na wykresie
    • Omówienie struktury danych o wypadkach, osobach rannych i zabitych
      • Obliczenie współczynników korelacji
      • Podkreślenie wysokiej i istotnej korelacji i konieczności jej zachowania przy losowaniu
    • Dane o wysokości szkód
      • Źródło danych – symulacja danych o zadanym rozkładzie
      • Charakterystyka i szczególnie użyteczne własności rozkładów o ciężkich ogonach
  • Opis mechanizmu generowania szkód w wypadkach komunikacyjnych.
    • Złożony rozkład zmiennej losowej
      • Definicja rozkładu złożonego
      • Przykład rozkładu złożonego
    • Rozkłady ilości szkód
      • Omówienie rozkładów dyskretnych wykorzystywanych do modelowania ilości wypadków
    • Rozkłady wysokości szkody
      • Omówienie rozkładów ciągłych wykorzystywanych do modelowania wysokości szkody
  • Dopasowanie ręczne rozkładów do danych o wypadkach wraz z omówieniem opcji modułu, prezentacją wykresów i zestawu generowanych wyników
    • Dopasowanie do ilości wypadków, liczby rannych i zabitych rozkładu Poissona
    • Dopasowanie do wysokości szkody rozkładu GEV
  • Omówienie mechanizmu generowania danych i uruchomienie makra
    • Omówienie sposobu działania makra
  • Prezentacja otrzymanych wyników.

Tworzenie i stosowanie modelu data mining za pomocą Przepisów STATISTICA Data Miner na przekładzie wykrywania nadużyć

Przykład poświecony będzie wykorzystaniu Przepisów STATISTICA Data Miner do tworzenia modelu i stosowania go dla nowych danych. Zadaniem będzie wskazanie transakcji w sklepie internetowym, które najprawdopodobniej wiążą się próbą wyłudzenia. Do budowy modelu przewidującego, czy transakcja jest, czy nie jest nadużyciem wykorzystane zostaną drzewa klasyfikacyjne, drzewa wzmacniane (boosted trees) oraz rożne architektury sieci neuronowych. Modele uzyskane różnymi metodami zostaną ocenione, a najlepszy z nich zostanie wdrożony w STATISTICA Enterprise.

  • Wczytanie danych z bazy danych przez konfigurację analizy STATISTICA Enterprise
  • Zbudowanie modelu w Przepisach SDM
    • Połączenie z plikiem danych i wybór zmiennych
    • Próba testowa: losowy wybór 20% przypadków
    • Eliminacja nieważnych zmiennych
    • Uczenie modeli
  • Wdrożenie w STATISTICA Enterprise




Patronat nad seminariami objęło:




Patronat medialny: