co_nowego_w_ibm_spss_statistics_23

Transkrypt

co_nowego_w_ibm_spss_statistics_23
Co nowego w IBM SPSS Statistics 23
Nowe rozwiązania i funkcjonalności, które przyśpieszą
i znacznie uproszczą Twoje analizy
IBM SPSS Statistics to uznany standard w świecie analizy danych ilościowych. Obecny na rynku
już od ponad czterdziestu lat. Z każdą nową wersją, narzędzie jest rozbudowywane o nowe
procedury analityczne oraz udoskonalane pod kątem działania. Wspólnym mianownikiem
dla zmian jest zawsze ułatwienie pracy użytkownikowi i osiągnięcie jak najlepszej wydajności.
Wraz z nową wersją, oznaczoną numerem 23, jej użytkownicy otrzymują szereg niedostępnych wcześniej procedur analitycznych. Warto wymienić tutaj chociażby modelowanie
przyczynowe szeregów czasowych czy predykcję przestrzenno-czasową. Na użytkowników
czekają również istotne ulepszenia, jak np. optymalizacja zapisu do bazy danych. Poniżej
prezentujemy wybrane nowości w IBM SPSS Statistics 23.
Reguły asocjacji geoprzestrzennych
Procedura dodaje nowy wymiar do wielu analiz. Dzięki tej technice można odkryć relacje
pomiędzy danymi związanymi z lokalizacją (takimi, jak np. współrzędne geograficzne) i danymi
skrywającymi spostrzeżenia dotyczące ludzi, wydarzeń i zjawisk.
Rysunek 1.
Mapa reguł asocjacji geoprzestrzennych
Za pomocą reguł asocjacji geoprzestrzennych można dość łatwo zidentyfikować związki
pomiędzy cechami przestrzennymi i tymi odnoszącymi się do obiektów ulokowanych w tej
przestrzeni. Na przykład, procedura pozwala zidentyfikować wzorce przestępczości w odniesieniu do lokalizacji i cech demograficznych. Z wzorców tych można skorzystać budując
reguły predykcyjne, typujące, w jakich rejonach wystąpienie pewnych typów przestępstw
jest bardziej prawdopodobne.
www.predictivesolutions.pl
Co nowego w IBM SPSS Statistics 23 /// Nowe rozwiązania i funkcjonalności, które przyśpieszą i znacznie uproszczą Twoje analizy
2
Predykcja przestrzenno-czasowa
Nowa wersja programu oferuje również możliwość dopasowania modeli liniowych do pomiarów prowadzonych w różnym czasie i w różnych przestrzeniach (dwu– i trójwymiarowych).
Zaimplementowana technika wyznacza trendy w przekroju czasowo-przestrzennym. Pozwala
to organizacjom zidentyfikować „gorące” obszary i prognozować ich zmianę w czasie.
Prognozowanie czasowo-przestrzenne korzysta z danych zawierających informację o lokalizacji (np. współrzędnych geograficznych), predyktorów charakteryzujących zjawisko, zmiennej
będącej znacznikiem czasu dla zachodzącego zjawiska oraz zmiennej przewidywanej. Każda
lokalizacja posiada liczne rekordy danych (gęstości punktów), które reprezentują wartości
każdego predyktora w każdym przedziale czasu i w każdej lokalizacji. Wynikiem działania
procedury są macierze korelacji i kowariancji przestrzennej, a także szeregi czasowe prognozowanego zjawiska w wybranej lokalizacji.
Rysunek 2.
Obiekty wynikowe dla predykcji
przestrzenno-czasowej
Modelowanie przyczynowe szeregów czasowych
Modelowanie przyczynowe szeregów czasowych jest próbą odkrycia kluczowych relacji
przyczynowych w szeregach czasowych.
W procedurze użytkownik definiuje zestaw prognozowanych szeregów czasowych oraz
zestaw kandydujących danych wejściowych dla tych szeregów. Procedura buduje autoregresyjny model szeregów czasowych dla każdego prognozowanego szeregu i zawiera tylko
www.predictivesolutions.pl
Co nowego w IBM SPSS Statistics 23 /// Nowe rozwiązania i funkcjonalności, które przyśpieszą i znacznie uproszczą Twoje analizy
3
te dane wejściowe, które posiadają z nim przyczynową relację. Takie podejście różni się
od tradycyjnego modelowania szeregów czasowych, gdzie muszą być dokładnie określone
predyktory dla prognozowanych szeregów. Ponieważ modelowanie przyczynowe szeregów
czasowych zazwyczaj obejmuje budowę modeli dla wielokrotnie powiązanych ze sobą szeregów czasowych, uzyskany wynik jest określany jako układ modelowy.
Wsadowe ładowanie danych do baz danych
IBM SPSS Statistics w wersji 23 zapewnia zdecydowanie lepszą wydajność zapisu przy zwracaniu danych do baz danych, dzięki mechanizmowi wsadowego ładowania danych. Podczas
takiego hurtowego eksportu danych, z programu SPSS do bazy danych, większość z nich
jest ładowana w partiach (paczkami) zamiast całym zbiorem. W ten sposób możliwe jest
znaczne przyspieszenie operacji, zwłaszcza w przypadku pracy z dużymi zbiorami danych.
Rozszerzenia programistyczne
Użytkownicy programu IBM SPSS Statistics mają możliwość rozwijania i testowania własnych
programów i rozszerzeń opartych na R oraz Python, za pomocą w pełni funkcjonalnego,
zintegrowanego w programie IBM SPSS Statistics środowiska deweloperskiego. Programy
R mogą być więc wywoływane z poziomu aplikacji SPSS, która również zarządza wynikami.
Ponadto, funkcje R używane przez IBM SPSS Statistics mogą być pisane w języku poleceń
SPSS (syntax) i wywoływane z poziomu R, wyniki natomiast też mogą być z powodzeniem
zwracane do R.
Rozszerzenia programistyczne dla języka Python lub R, wspierają teraz użycie słów kluczowych
TO i ALL występujących na liście zmiennych. Wraz z IBM SPSS Statistics dystrybuowanych jest
wiele procedur rozszerzających funkcjonalność tego programu wraz z dołączonym do nich
interfejsem GUI (niestandardowymi oknami dialogowymi). System pomocy dla wszystkich
poleceń dodatkowych, które są instalowane z wymienionymi dodatkami jest teraz dostępny
po naciśnięciu klawisza F1 w edytorze komend.
Predictive Solutions
ul. Racławicka 58 /// 30–017 Kraków
t 12 636 96 80 /// f wew. 102