Analiza korespondencji
Tabela korespondencji to dowolna tabela dwustronna, której komórki zawierają pewien pomiar korespondencji między wierszami i kolumnami. Miarą korespondencji może być dowolne wskazanie podobieństwa, powinowactwa, splątania, powiązania lub interakcji między zmiennymi wierszami i kolumnami. Bardzo powszechnym typem tabeli korespondencji jest tabela krzyżowa, w której komórki zawierają liczebności.
Takie tabele można łatwo uzyskać za pomocą procedury Crosstabs. Jednak tabela krzyżowa nie zawsze zapewnia jasny obraz natury relacji między tymi dwiema zmiennymi. Jest to szczególnie prawdziwe, jeżeli zmienne odsetki są nominalne (bez wrodzonej kolejności lub rangi) i zawierają liczne kategorie. Tabela krzyżowa może stwierdzić, że obserwowane częstotliwości komórek różnią się znacznie od oczekiwanych wartości w tabeli krzyżowej 10 x 9 zawód i płatki śniadaniowe, ale może być trudne do zauważenia, które grupy zawodowe mają podobne gusta lub jakie są te upodobania.
Analiza korespondencji pozwala na zbadanie zależności pomiędzy dwiema zmiennymi nominalnymi graficznie w przestrzeni wielowymiarowej. Wylicza wyniki wierszy i kolumn i tworzy wykresy na podstawie wyników. Kategorie, które są podobne do siebie, są zbliżone do siebie na wykresach. W ten sposób łatwo jest zobaczyć, które kategorie zmiennej są podobne do siebie lub które kategorie obu zmiennych są ze sobą powiązane. Procedura Analizy Korespondencji pozwala również na dopasowanie punktów uzupełniających do przestrzeni określonej przez punkty aktywne.
Jeśli porządkowanie kategorii zgodnie z ich wynikami jest niepożądane lub nieintuicyjne, ograniczenia zamówień mogą być narzucane przez ograniczenie wyników dla niektórych kategorii, aby były równe. Załóżmy na przykład, że oczekiwana jest zmienna palenie tytoniu, z kategoriami none, light, mediumi heavy, aby mieć wyniki odpowiadające tej kolejności porządkowania. Jeśli jednak analiza porząduje kategorie brak, światło, ciężkiei średnie, ograniczając wyniki dla produktów ciężkie i średnie , tak aby były równe, zachowuje kolejność kategorii w ich wynikach.
Interpretacja analizy korespondencji w aspekcie odległości zależy od zastosowanej metody normalizacji. Procedura analizy korespondencji może być używana do analizowania różnic między kategoriami zmiennej lub różnic między zmiennymi. Przy użyciu domyślnej normalizacji analizuje on różnice między zmiennymi wiersza i kolumny.
Algorytm analizy korespondencji jest zdolny do wielu rodzajów analiz. Centrowanie wierszy i kolumn oraz użycie odległości chi-kwadrat odpowiada standardowej analizie korespondencji. Jednak użycie alternatywnych opcji centrowania w połączeniu z odległościach Euklidesa pozwala na alternatywną reprezentację macierzy w przestrzeni o niskiej wymiarowej.
Zaprezentowane zostaną trzy przykłady. Pierwszy z nich korzysta ze stosunkowo małej tabeli korespondencji i obrazuje pojęcia związane z analizą korespondencji. Drugi przykład demonstruje praktyczną aplikację marketingową. W ostatnim przykładzie zastosowano tabelę odległości w wielowymiarowym podejściu skalowania.