Glosariusz
A
AICC
Miara wybierania i porównywania modeli mieszanych tworzonych na podstawie -2 logarytmu wiarygodności (ograniczonego). Mniejsze wartości oznaczają lepszy model. Wartość AICC „poprawia” wartość AIC w przypadku małych prób. Przy wzroście wielkości próby wartość AICC zbiega do wartości AIC.
ANOVA dla każdej zmiennej
Dla każdej zmiennej niezależnej wykonuje test istotności różnic między średnimi grupowymi metodą jednoczynnikowej analizy wariancji.
B
Bayesowskie kryterium informacyjne (BIC)
Miara wybierania i porównywania modeli mieszanych tworzonych na podstawie -2 logarytmu wiarygodności. Mniejsze wartości oznaczają lepszy model. Wartość BIC „karze” także modele przeparametryzowane (na przykład złożone modele z dużą liczbą danych wejściowych), jednak silniej niż miara AIC.
Błąd standardowy
Miara tego, jak bardzo wartość statystyki testowej (sprawdzianu testu) zmienia się pomiędzy próbami. Jest to odchylenie standardowe rozkładu wartości danej statystyki dla poszczególnych prób. Na przykład błąd standardowy średniej to odchylenie standardowe średnich z prób.
Błąd standardowy kurtozy
Iloraz kurtozy i jej błędu standardowego; może być wykorzystywany jako test normalności (tzn. można odrzucić założenie normalności, jeśli wartość ilorazu jest mniejsza od -2 lub większa od +2). Wysoka dodatnia wartość dla kurtozy wskazuje na to, iż krańce rozkładu są dłuższe niż te dla rozkładu normalnego; ujemna wartość dla kurtozy wskazuje na krótsze krańce (podobnie jak w rozkładach prostokątnych).
Błąd standardowy skośności
Iloraz skośności i jej błędu standardowego; może być wykorzystywany jako test normalności (tzn. można odrzucić założenie o normalności, jeśli wartość ilorazu jest mniejsza od -2 lub większa od +2). Wysoka dodatnia wartość dla skośności wskazuje na długi prawy kraniec; skrajnie ujemna wartość wskazuje na długi lewy kraniec.
Błąd standardowy średniej
Miara tego, jak bardzo wartość średniej może się zmieniać dla różnych prób losowanych z tego samego rozkładu. Może być wykorzystywana do pobieżnego porównania rzeczywistej wartości średniej z wartością hipotetyczną (tj. można sądzić, że te dwie wartości są różne, jeśli iloraz różnicy i błędu standardowego jest mniejszy od -2 lub większy od +2).
F
Fishera
Wyświetla współczynniki funkcji klasyfikacyjnej Fishera, które mogą być bezpośrednio używane do klasyfikowania. Dla każdej grupy otrzymywany jest oddzielny zestaw współczynników funkcji klasyfikacji, a przypadek klasyfikuje się do tej grupy, dla której ma najwyższą ocenę dyskryminacyjną (wartość funkcji klasyfikacji).
J
Jeden minus przeżycie
Umożliwia wykreślenie funkcji Jeden minus przeżycie na skali liniowej.
K
Klasyfikacja typu pozostaw-jedną-poza
Każda analizowana obserwacja jest klasyfikowana przez funkcję wyprowadzoną w oparciu o wszystkie pozostałe obserwacje z wyłączeniem tej jednej. Znana również jako „metoda U”.
Korelacja wewnątrzgrupowa
Wyświetla macierz sumarycznych (połączonych) korelacji wewnątrzgrupowych, uzyskiwaną przez uśrednienie macierzy kowariancji dla wszystkich grup przed obliczeniem korelacji.
Kowariancja
Nieustandaryzowana miara powiązania dwóch zmiennych, równa sumie iloczynów wektorowych odchyleń wartości tych zmiennych od ich średnich podzielonej przez N-1.
Kowariancja całkowita
Wyświetla macierz kowariancji obliczanych na podstawie wszystkich obserwacji, tak jakby pochodziły z jednej próby.
Kowariancja wewnątrzgrupowa
Wyświetla macierz sumarycznych (połączonych) kowariancji wewnątrzgrupowych, która może być różna od całkowitej macierzy kowariancji. Macierz jest uzyskiwana przez uśrednienie poszczególnych macierzy kowariancji dla wszystkich grup.
Kowariancje dla odrębnych grup
Wyświetla osobne macierze kowariancji dla każdej grupy.
Kurtoza
Miara ilości skrajnych wartości odstających. W przypadku rozkładu normalnego wartość statystyki kurtozy wynosi zero. Kurtoza dodatnia oznacza, że w danych jest więcej skrajnych wartości odstających niż w rozkładzie normalnym. Kurtoza ujemna wskazuje, że w danych istnieje mniej dodatnich wartości odstających niż w przypadku rozkładu normalnego.
M
MaksBB
Maksymalny błąd bezwzględny. Największy prognozowany błąd, wyrażony w jednostkach używanych przez szereg. Podobnie jak w przypadku MaksPBB, błąd ten jest pomocny w wyobrażaniu najgorszego możliwego scenariusza prognozy. Maksymalny błąd bezwzględny oraz maksymalny procentowy błąd bezwzględny mogą wystąpić w różnych miejscach szeregu, np. gdy błąd bezwzględny dużego szeregu jest w niewielkim stopniu większy od błędu bezwzględnego wartości małego szeregu. W takim wypadku maksymalny błąd bezwzględny wystąpi dla wartości dużego szeregu, a maksymalny procentowy błąd bezwzględny wystąpi dla wartości małego szeregu.
MaksPBB
Maksymalny procentowy błąd bezwzględny. Największy prognozowany błąd, wyrażony jako procent. Miara ta jest pomocna w wyobrażaniu najgorszego możliwego scenariusza prognozy.
Maksymalizacja najmniejszego ilorazu F — metoda wprowadzania
Metoda doboru zmiennych przy analizie metodą krokową, oparta na maksymalizacji ilorazu F, obliczanego na podstawie odległości Mahalanobisa pomiędzy grupami.
Mapa terytorialna
Oparty o wartości funkcji dyskryminacyjnej wykres granic, wykorzystany do klasyfikowania obserwacji do grup.
Liczby odpowiadają grupom, do których zostały zaklasyfikowane poszczególne obserwacje. Średnie dla kolejnych grup są na wykresie oznaczone gwiazdkami, które znajdują się wewnątrz granic określonych dla tych grup. Mapa nie zostaje wyświetlona wtedy, gdy istnieje tylko jedna funkcja dyskryminacyjna.
MAPE
Bezwzględny procentowy błąd średniej. Mierzy, jak bardzo szereg zależny odbiega od poziomu przewidywanego przez model. Jest niezależny od używanych jednostek i tym samym może być używany do porównywania szeregów używających różnych jednostek.
Maximum
Największa wartość zmiennej numerycznej.
Mean
Miara tendencji centralnej. Średnia arytmetyczna; suma podzielona przez liczbę obserwacji.
Median
Jest to 50. percentyl, czyli taka wartość, że połowa obserwacji ma wartości mniejsze, a druga połowa ma wartości większe od niej. W sytuacji parzystej liczby obserwacji mediana jest średnią dwóch środkowych obserwacji w próbie posortowanej rosnąco lub malejąco. W przeciwieństwie do średniej, na którą wpływ może mieć nawet kilka ekstremalnie dużych lub małych wartości, mediana jest miarą tendencji centralnej niewrażliwą na wartości odstające.
Minimalizacja lambdy Wilksa
Metoda doboru zmiennych w krokowej analizie dyskryminacyjnej, przy której wybierane są takie zmienne, które po wprowadzeniu do równania najbardziej zmniejszą współczynnik lambda Wilksa. W każdym kolejnym kroku procedury wprowadzona zostaje ta zmienna, która minimalizuje wartość tego współczynnika.
Minimum
Najmniejsza wartość zmiennej numerycznej.
Mode
Wartość występująca najczęściej. Jeśli więcej niż jedna wartość występuje z taką samą, największą częstością, każda z nich jest dominantą (wartością modalną).
N
Niestandaryzowane
Wyświetla niestandaryzowane współczynniki funkcji dyskryminacyjnej.
O
Obserwacji
Dla każdej wyświetlane są kody rzeczywistej grupy, przewidywanej grupy, prawdopodobieństw a posteriori i ocen dyskryminacyjnych.
Odchylenie standardowe
Miara rozproszenia wokół wartości średniej, równa pierwiastkowi z wariancji. Odchylenie standardowe mierzy się w tych samych jednostkach co pierwotną wartość.
Odchylenie standardowe
Miara rozproszenia wokół średniej. W przypadku rozkładu normalnego, 68% obserwacji znajduje się w obszarze oddalonym o jedno odchylenie standardowe od średniej, zaś 95% — w przedziale oddalonym o dwa odchylenia standardowe. Na przykład, jeśli średnia wieku osób wynosi 45 lat, a odchylenie standardowe wynosi 10, wówczas 95% rozważanych osób znajduje się w przedziale wiekowym między 25 a 65 lat.
Odległość Mahalanobisa
Miara stopnia, w jakim wartości zmiennych niezależnych dla danej obserwacji różnią się od wartości przeciętnej dla wszystkich obserwacji. Duże wartości wskaźnika Mahalanobisa oznaczają, że obserwacja zawiera skrajne wartości jednej albo większej liczby zmiennych niezależnych.
Odrębne grupy
Wykorzystuje do klasyfikacji macierze kowariancji dla poszczególnych grup. Ponieważ klasyfikacja oparta jest na funkcjach dyskryminacyjnych a nie na pierwotnych zmiennych, opcja ta nie zawsze jest równoważna dyskryminacji kwadratowej.
P
PPOK
Pierwiastek z przeciętnego odchylenia kwadratowego. Pierwiastek kwadratowy obliczany z przeciętnego odchylenia kwadratowego. Mierzy, jak bardzo szereg zależny odbiega od poziomu przewidywanego przez model; miara wyrażona w jednostkach używanych przez szereg zależny.
R
R-kwadrat
Miara dobroci dopasowania modelu liniowego, czasami nazywana współczynnikiem determinacji. Jest to część zmienności w zmiennej zależnej wyjaśniona przez model regresji. Przyjmuje wartości z przedziału od 0 do 1. Małe wartości statystyki wskazują na słabe dopasowanie modelu do danych.
S
Sekwencyjna Bonferroniego
Jest to sekwencyjne zstępująca odrzucająca procedura Bonferroniego, która jest mniej konserwatywna w zakresie odrzucania indywidualnych hipotez, ale zachowuje identyczny całościowy poziom istotności.
Sekwencyjna Sidaka
Jest to sekwencyjnie zstępująca odrzucająca procedura Bonferroniego, która jest mniej konserwatywna w zakresie odrzucania indywidualnych hipotez, ale zachowuje identyczny całościowy poziom istotności.
Skośność
Miara asymetrii rozkładu. Rozkład normalny jest symetryczny, a jego wartość skośności wynosi 0. Rozkład o dużej skośności dodatniej posiada długi kraniec z prawej strony. Gdy zaś współczynnik skośności jest ujemny, rozkład ma długi kraniec z lewej strony. Jako wytyczna, wartość skośności przekraczająca dwukrotnie swój błąd standardowy na ogół oznacza odstępstwo od symetrii rozkładu.
Stacjonarność r-kwadrat
Miara porównująca stacjonarną część modelu z modelem średniej prostej. Miara ta jest używana zamiast zwykłego r-kwadrat, gdy istnieje trend lub wzorzec sezonowy. Stacjonarna miara r-kwadrat może mieć wartość ujemną z przedziałem od minus nieskończoności do 1. Wartości ujemne oznaczają, że brany pod uwagę model jest gorszy niż model bazowy. Wartości dodatnie oznaczają, że brany pod uwagę model jest lepszy niż model bazowy.
Sum
Suma wartości wszystkich obserwacji nieposiadających braków danych.
Swoista
Oszacowuje wielkość wszystkich efektów równocześnie, korygując każdy z nich ze względu na wszystkie inne efekty każdego typu.
Ś
ŚBB
Średni błąd bezwzględny. Mierzy, jak bardzo szereg odbiega od poziomu przewidywanego przez model. ŚBB jest zgłaszany w pierwotnych jednostkach szeregu.
Średnie
Wyświetla średnią ogólną i średnie w grupach oraz odchylenia standardowe dla zmiennych niezależnych.
T
Test M Boxa
Test równości macierzy kowariancji grupowych. Przy odpowiednio dużych wielkościach prób nieistotna wartość p oznacza, że dowód nierówności macierzy jest niewystarczający. Test jest wrażliwy na odstępstwa od normalności rozkładu wielowymiarowego.
U
Użyj wartości F
Zmienna zostaje wprowadzona do modelu, jeśli wartość F jest większa niż określona wartość kryterium wprowadzenia, a zostaje wyłączona, jeśli wartość F jest mniejsza niż wartość przyjęta jako kryterium usunięcia. Wartość wprowadzenia musi być większa od wartości usunięcia i obie muszą być dodatnie. Chcąc wprowadzić więcej zmiennych do modelu, należy obniżyć wartość wprowadzenia. Chcąc usunąć więcej zmiennych, należy zwiększyć wartość usunięcia.
V
V Rao (analiza dyskryminacyjna)
Miara różnic między średnimi grupowymi. Znana jest także pod nazwą śladu Lawleya-Hotellinga. W każdym kolejnym kroku procedury wprowadzona zostaje ta zmienna, która powoduje największy wzrost wskaźnika V. Po wybraniu tej opcji wprowadź minimalną wartość, którą zmienna musi posiadać, aby została wprowadzona do analizy.
Variance
Miara rozproszenia wokół średniej, równa sumie podniesionych do kwadratu odchyleń od średniej, podzielonej przez liczbę obserwacji minus jeden. Wariancja jest mierzona w jednostkach będących kwadratami jednostek miary dla zmiennej, do której wariancja się odnosi.
W
Wariancja niewyjaśniona
W każdym kolejnym kroku analizy do modelu wprowadzana jest zmienna, która minimalizuje sumę niewyjaśnionej zmienności między grupami.
Ważne
Poprawne obserwacje nieposiadające systemowych ani zdefiniowanych przez użytkownika braków danych.
Wewnątrzgrupowe
Do klasyfikacji obserwacji wykorzystywana jest połączona macierz kowariancji wewnątrzgrupowych.
Wykładnik potęgi od
Różnica między największą a najmniejszą wartością zmiennej numerycznej; maksimum minus minimum.
Wykres hazardu
Umożliwia wyświetlenie funkcji skumulowanego przeżycia na skali liniowej.
Wykres przeżycia
Umożliwia wyświetlenie funkcji skumulowanego przeżycia na skali liniowej.
Wykresy Odrębne grupy
Tworzy wykresy rozrzutu oddzielne dla każdej z grup, z uwzględnieniem pierwszych dwu funkcji dyskryminacyjnych. Jeśli istnieje tylko jedna funkcja, wyświetlone zostaną histogramy.
Wykresy Połączone grupy
Po zaznaczeniu tej opcji tworzony jest wykres rozrzutu wartości dwóch pierwszych funkcji dyskryminacyjnych, obejmujący wszystkie grupy. Jeśli istnieje tylko jedna funkcja, wyświetlany jest histogram.
Wyniki klasyfikacji
Liczba obserwacji prawidłowo i nieprawidłowo przypisanych do każdej grupy na podstawie analizy dyskryminacyjnej. Czasem zwana „Macierzą nieporozumień”.
Z
Zastosuj prawdopodobieństwo F
Zmienna zostaje wprowadzona do modelu, jeśli oszacowany dla niej poziom istotności dla wartości F jest mniejszy niż określona wartość kryterium wprowadzenia, a zostaje wyłączona, jeśli poziom istotności jest większy niż wartość przyjęta jako kryterium usunięcia.
Wartość wprowadzenia musi być mniejsza od wartości usunięcia i obie muszą być dodatnie. Chcąc wprowadzić więcej zmiennych do modelu, należy zwiększyć wartość wprowadzenia. Aby usunąć więcej zmiennych, należy zmniejszyć wartość usunięcia.
Znormalizowane BKI
Znormalizowane Bayesowskie kryterium informacyjne. Ogólna miara całkowitego dopasowania modelu, która ma na celu uwzględnienie złożoności modelu. Jest to ocena oparta na średnim błędzie kwadratowym, zawierająca karę za liczbę parametrów w modelu oraz długość szeregu. Kara powoduje usunięcie przewagi modeli z większą liczbą parametrów, ułatwiając porównanie statystyki w różnych modelach tego samego szeregu.