Glosariusz

A

AICC

Miara wybierania i porównywania modeli mieszanych tworzonych na podstawie -2 logarytmu wiarygodności (ograniczonego). Mniejsze wartości oznaczają lepszy model. Wartość AICC „poprawia” wartość AIC w przypadku małych prób. Przy wzroście wielkości próby wartość AICC zbiega do wartości AIC.

ANOVA dla każdej zmiennej

Dla każdej zmiennej niezależnej wykonuje test istotności różnic między średnimi grupowymi metodą jednoczynnikowej analizy wariancji.

B

Bayesowskie kryterium informacyjne (BIC)

Miara wybierania i porównywania modeli mieszanych tworzonych na podstawie -2 logarytmu wiarygodności. Mniejsze wartości oznaczają lepszy model. Wartość BIC „karze” także modele przeparametryzowane (na przykład złożone modele z dużą liczbą danych wejściowych), jednak silniej niż miara AIC.

Błąd standardowy

Miara tego, jak bardzo wartość statystyki testowej (sprawdzianu testu) zmienia się pomiędzy próbami. Jest to odchylenie standardowe rozkładu wartości danej statystyki dla poszczególnych prób. Na przykład błąd standardowy średniej to odchylenie standardowe średnich z prób.

Błąd standardowy kurtozy

Iloraz kurtozy i jej błędu standardowego; może być wykorzystywany jako test normalności (tzn. można odrzucić założenie normalności, jeśli wartość ilorazu jest mniejsza od -2 lub większa od +2). Wysoka dodatnia wartość dla kurtozy wskazuje na to, iż krańce rozkładu są dłuższe niż te dla rozkładu normalnego; ujemna wartość dla kurtozy wskazuje na krótsze krańce (podobnie jak w rozkładach prostokątnych).

Błąd standardowy skośności

Iloraz skośności i jej błędu standardowego; może być wykorzystywany jako test normalności (tzn. można odrzucić założenie o normalności, jeśli wartość ilorazu jest mniejsza od -2 lub większa od +2). Wysoka dodatnia wartość dla skośności wskazuje na długi prawy kraniec; skrajnie ujemna wartość wskazuje na długi lewy kraniec.

Błąd standardowy średniej

Miara tego, jak bardzo wartość średniej może się zmieniać dla różnych prób losowanych z tego samego rozkładu. Może być wykorzystywana do pobieżnego porównania rzeczywistej wartości średniej z wartością hipotetyczną (tj. można sądzić, że te dwie wartości są różne, jeśli iloraz różnicy i błędu standardowego jest mniejszy od -2 lub większy od +2).

F

Fishera

Wyświetla współczynniki funkcji klasyfikacyjnej Fishera, które mogą być bezpośrednio używane do klasyfikowania. Dla każdej grupy otrzymywany jest oddzielny zestaw współczynników funkcji klasyfikacji, a przypadek klasyfikuje się do tej grupy, dla której ma najwyższą ocenę dyskryminacyjną (wartość funkcji klasyfikacji).

J

Jeden minus przeżycie

Umożliwia wykreślenie funkcji Jeden minus przeżycie na skali liniowej.

K

Klasyfikacja typu pozostaw-jedną-poza

Każda analizowana obserwacja jest klasyfikowana przez funkcję wyprowadzoną w oparciu o wszystkie pozostałe obserwacje z wyłączeniem tej jednej. Znana również jako „metoda U”.

Korelacja wewnątrzgrupowa

Wyświetla macierz sumarycznych (połączonych) korelacji wewnątrzgrupowych, uzyskiwaną przez uśrednienie macierzy kowariancji dla wszystkich grup przed obliczeniem korelacji.

Kowariancja

Nieustandaryzowana miara powiązania dwóch zmiennych, równa sumie iloczynów wektorowych odchyleń wartości tych zmiennych od ich średnich podzielonej przez N-1.

Kowariancja całkowita

Wyświetla macierz kowariancji obliczanych na podstawie wszystkich obserwacji, tak jakby pochodziły z jednej próby.

Kowariancja wewnątrzgrupowa

Wyświetla macierz sumarycznych (połączonych) kowariancji wewnątrzgrupowych, która może być różna od całkowitej macierzy kowariancji. Macierz jest uzyskiwana przez uśrednienie poszczególnych macierzy kowariancji dla wszystkich grup.

Kowariancje dla odrębnych grup

Wyświetla osobne macierze kowariancji dla każdej grupy.

Kurtoza

Miara ilości skrajnych wartości odstających. W przypadku rozkładu normalnego wartość statystyki kurtozy wynosi zero. Kurtoza dodatnia oznacza, że w danych jest więcej skrajnych wartości odstających niż w rozkładzie normalnym. Kurtoza ujemna wskazuje, że w danych istnieje mniej dodatnich wartości odstających niż w przypadku rozkładu normalnego.

M

MaksBB

Maksymalny błąd bezwzględny. Największy prognozowany błąd, wyrażony w jednostkach używanych przez szereg. Podobnie jak w przypadku MaksPBB, błąd ten jest pomocny w wyobrażaniu najgorszego możliwego scenariusza prognozy. Maksymalny błąd bezwzględny oraz maksymalny procentowy błąd bezwzględny mogą wystąpić w różnych miejscach szeregu, np. gdy błąd bezwzględny dużego szeregu jest w niewielkim stopniu większy od błędu bezwzględnego wartości małego szeregu. W takim wypadku maksymalny błąd bezwzględny wystąpi dla wartości dużego szeregu, a maksymalny procentowy błąd bezwzględny wystąpi dla wartości małego szeregu.

MaksPBB

Maksymalny procentowy błąd bezwzględny. Największy prognozowany błąd, wyrażony jako procent. Miara ta jest pomocna w wyobrażaniu najgorszego możliwego scenariusza prognozy.

Maksymalizacja najmniejszego ilorazu F — metoda wprowadzania

Metoda doboru zmiennych przy analizie metodą krokową, oparta na maksymalizacji ilorazu F, obliczanego na podstawie odległości Mahalanobisa pomiędzy grupami.

Mapa terytorialna

Oparty o wartości funkcji dyskryminacyjnej wykres granic, wykorzystany do klasyfikowania obserwacji do grup. Liczby odpowiadają grupom, do których zostały zaklasyfikowane poszczególne obserwacje. Średnie dla kolejnych grup są na wykresie oznaczone gwiazdkami, które znajdują się wewnątrz granic określonych dla tych grup. Mapa nie zostaje wyświetlona wtedy, gdy istnieje tylko jedna funkcja dyskryminacyjna.

MAPE

Bezwzględny procentowy błąd średniej. Mierzy, jak bardzo szereg zależny odbiega od poziomu przewidywanego przez model. Jest niezależny od używanych jednostek i tym samym może być używany do porównywania szeregów używających różnych jednostek.

Maximum

Największa wartość zmiennej numerycznej.

Mean

Miara tendencji centralnej. Średnia arytmetyczna; suma podzielona przez liczbę obserwacji.

Median

Jest to 50. percentyl, czyli taka wartość, że połowa obserwacji ma wartości mniejsze, a druga połowa ma wartości większe od niej. W sytuacji parzystej liczby obserwacji mediana jest średnią dwóch środkowych obserwacji w próbie posortowanej rosnąco lub malejąco. W przeciwieństwie do średniej, na którą wpływ może mieć nawet kilka ekstremalnie dużych lub małych wartości, mediana jest miarą tendencji centralnej niewrażliwą na wartości odstające.

Minimalizacja lambdy Wilksa

Metoda doboru zmiennych w krokowej analizie dyskryminacyjnej, przy której wybierane są takie zmienne, które po wprowadzeniu do równania najbardziej zmniejszą współczynnik lambda Wilksa. W każdym kolejnym kroku procedury wprowadzona zostaje ta zmienna, która minimalizuje wartość tego współczynnika.

Minimum

Najmniejsza wartość zmiennej numerycznej.

Mode

Wartość występująca najczęściej. Jeśli więcej niż jedna wartość występuje z taką samą, największą częstością, każda z nich jest dominantą (wartością modalną).

N

Niestandaryzowane

Wyświetla niestandaryzowane współczynniki funkcji dyskryminacyjnej.

O

Obserwacji

Dla każdej wyświetlane są kody rzeczywistej grupy, przewidywanej grupy, prawdopodobieństw a posteriori i ocen dyskryminacyjnych.

Odchylenie standardowe

Miara rozproszenia wokół wartości średniej, równa pierwiastkowi z wariancji. Odchylenie standardowe mierzy się w tych samych jednostkach co pierwotną wartość.

Odchylenie standardowe

Miara rozproszenia wokół średniej. W przypadku rozkładu normalnego, 68% obserwacji znajduje się w obszarze oddalonym o jedno odchylenie standardowe od średniej, zaś 95% — w przedziale oddalonym o dwa odchylenia standardowe. Na przykład, jeśli średnia wieku osób wynosi 45 lat, a odchylenie standardowe wynosi 10, wówczas 95% rozważanych osób znajduje się w przedziale wiekowym między 25 a 65 lat.

Odległość Mahalanobisa

Miara stopnia, w jakim wartości zmiennych niezależnych dla danej obserwacji różnią się od wartości przeciętnej dla wszystkich obserwacji. Duże wartości wskaźnika Mahalanobisa oznaczają, że obserwacja zawiera skrajne wartości jednej albo większej liczby zmiennych niezależnych.

Odrębne grupy

Wykorzystuje do klasyfikacji macierze kowariancji dla poszczególnych grup. Ponieważ klasyfikacja oparta jest na funkcjach dyskryminacyjnych a nie na pierwotnych zmiennych, opcja ta nie zawsze jest równoważna dyskryminacji kwadratowej.

P

PPOK

Pierwiastek z przeciętnego odchylenia kwadratowego. Pierwiastek kwadratowy obliczany z przeciętnego odchylenia kwadratowego. Mierzy, jak bardzo szereg zależny odbiega od poziomu przewidywanego przez model; miara wyrażona w jednostkach używanych przez szereg zależny.

R

R-kwadrat

Miara dobroci dopasowania modelu liniowego, czasami nazywana współczynnikiem determinacji. Jest to część zmienności w zmiennej zależnej wyjaśniona przez model regresji. Przyjmuje wartości z przedziału od 0 do 1. Małe wartości statystyki wskazują na słabe dopasowanie modelu do danych.

S

Sekwencyjna Bonferroniego

Jest to sekwencyjne zstępująca odrzucająca procedura Bonferroniego, która jest mniej konserwatywna w zakresie odrzucania indywidualnych hipotez, ale zachowuje identyczny całościowy poziom istotności.

Sekwencyjna Sidaka

Jest to sekwencyjnie zstępująca odrzucająca procedura Bonferroniego, która jest mniej konserwatywna w zakresie odrzucania indywidualnych hipotez, ale zachowuje identyczny całościowy poziom istotności.

Skośność

Miara asymetrii rozkładu. Rozkład normalny jest symetryczny, a jego wartość skośności wynosi 0. Rozkład o dużej skośności dodatniej posiada długi kraniec z prawej strony. Gdy zaś współczynnik skośności jest ujemny, rozkład ma długi kraniec z lewej strony. Jako wytyczna, wartość skośności przekraczająca dwukrotnie swój błąd standardowy na ogół oznacza odstępstwo od symetrii rozkładu.

Stacjonarność r-kwadrat

Miara porównująca stacjonarną część modelu z modelem średniej prostej. Miara ta jest używana zamiast zwykłego r-kwadrat, gdy istnieje trend lub wzorzec sezonowy. Stacjonarna miara r-kwadrat może mieć wartość ujemną z przedziałem od minus nieskończoności do 1. Wartości ujemne oznaczają, że brany pod uwagę model jest gorszy niż model bazowy. Wartości dodatnie oznaczają, że brany pod uwagę model jest lepszy niż model bazowy.

Sum

Suma wartości wszystkich obserwacji nieposiadających braków danych.

Swoista

Oszacowuje wielkość wszystkich efektów równocześnie, korygując każdy z nich ze względu na wszystkie inne efekty każdego typu.

Ś

ŚBB

Średni błąd bezwzględny. Mierzy, jak bardzo szereg odbiega od poziomu przewidywanego przez model. ŚBB jest zgłaszany w pierwotnych jednostkach szeregu.

Średnie

Wyświetla średnią ogólną i średnie w grupach oraz odchylenia standardowe dla zmiennych niezależnych.

T

Test M Boxa

Test równości macierzy kowariancji grupowych. Przy odpowiednio dużych wielkościach prób nieistotna wartość p oznacza, że dowód nierówności macierzy jest niewystarczający. Test jest wrażliwy na odstępstwa od normalności rozkładu wielowymiarowego.

U

Użyj wartości F

Zmienna zostaje wprowadzona do modelu, jeśli wartość F jest większa niż określona wartość kryterium wprowadzenia, a zostaje wyłączona, jeśli wartość F jest mniejsza niż wartość przyjęta jako kryterium usunięcia. Wartość wprowadzenia musi być większa od wartości usunięcia i obie muszą być dodatnie. Chcąc wprowadzić więcej zmiennych do modelu, należy obniżyć wartość wprowadzenia. Chcąc usunąć więcej zmiennych, należy zwiększyć wartość usunięcia.

V

V Rao (analiza dyskryminacyjna)

Miara różnic między średnimi grupowymi. Znana jest także pod nazwą śladu Lawleya-Hotellinga. W każdym kolejnym kroku procedury wprowadzona zostaje ta zmienna, która powoduje największy wzrost wskaźnika V. Po wybraniu tej opcji wprowadź minimalną wartość, którą zmienna musi posiadać, aby została wprowadzona do analizy.

Variance

Miara rozproszenia wokół średniej, równa sumie podniesionych do kwadratu odchyleń od średniej, podzielonej przez liczbę obserwacji minus jeden. Wariancja jest mierzona w jednostkach będących kwadratami jednostek miary dla zmiennej, do której wariancja się odnosi.

W

Wariancja niewyjaśniona

W każdym kolejnym kroku analizy do modelu wprowadzana jest zmienna, która minimalizuje sumę niewyjaśnionej zmienności między grupami.

Ważne

Poprawne obserwacje nieposiadające systemowych ani zdefiniowanych przez użytkownika braków danych.

Wewnątrzgrupowe

Do klasyfikacji obserwacji wykorzystywana jest połączona macierz kowariancji wewnątrzgrupowych.

Wykładnik potęgi od

Różnica między największą a najmniejszą wartością zmiennej numerycznej; maksimum minus minimum.

Wykres hazardu

Umożliwia wyświetlenie funkcji skumulowanego przeżycia na skali liniowej.

Wykres przeżycia

Umożliwia wyświetlenie funkcji skumulowanego przeżycia na skali liniowej.

Wykresy Odrębne grupy

Tworzy wykresy rozrzutu oddzielne dla każdej z grup, z uwzględnieniem pierwszych dwu funkcji dyskryminacyjnych. Jeśli istnieje tylko jedna funkcja, wyświetlone zostaną histogramy.

Wykresy Połączone grupy

Po zaznaczeniu tej opcji tworzony jest wykres rozrzutu wartości dwóch pierwszych funkcji dyskryminacyjnych, obejmujący wszystkie grupy. Jeśli istnieje tylko jedna funkcja, wyświetlany jest histogram.

Wyniki klasyfikacji

Liczba obserwacji prawidłowo i nieprawidłowo przypisanych do każdej grupy na podstawie analizy dyskryminacyjnej. Czasem zwana „Macierzą nieporozumień”.

Z

Zastosuj prawdopodobieństwo F

Zmienna zostaje wprowadzona do modelu, jeśli oszacowany dla niej poziom istotności dla wartości F jest mniejszy niż określona wartość kryterium wprowadzenia, a zostaje wyłączona, jeśli poziom istotności jest większy niż wartość przyjęta jako kryterium usunięcia. Wartość wprowadzenia musi być mniejsza od wartości usunięcia i obie muszą być dodatnie. Chcąc wprowadzić więcej zmiennych do modelu, należy zwiększyć wartość wprowadzenia. Aby usunąć więcej zmiennych, należy zmniejszyć wartość usunięcia.

Znormalizowane BKI

Znormalizowane Bayesowskie kryterium informacyjne. Ogólna miara całkowitego dopasowania modelu, która ma na celu uwzględnienie złożoności modelu. Jest to ocena oparta na średnim błędzie kwadratowym, zawierająca karę za liczbę parametrów w modelu oraz długość szeregu. Kara powoduje usunięcie przewagi modeli z większą liczbą parametrów, ułatwiając porównanie statystyki w różnych modelach tego samego szeregu.