Sposób działania algorytmu SVM

Działanie algorytmu SVM polega na mapowaniu danych na wielowymiarową przestrzeń właściwości w sposób umożliwiający kategoryzację punktów danych, nawet jeśli danych tych nie można w inny sposób liniowo oddzielić. Najpierw odszukiwany jest separator między kategoriami. Następnie dane są przekształcane w sposób umożliwiający wyrysowanie separatora jako hiperpłaszczyzny. Po wykonaniu tych czynności charakterystyki nowych danych mogą służyć do przewidywania grupy, do której powinien należeć nowy rekord.

Rozważmy na przykład poniższy rysunek, na którym punkty danych przypadają do dwu różnych kategorii.

Rysunek 1. Oryginalny zbiór danych
Oryginalny zbiór danych

Te dwie kategorie można oddzielić krzywą, tak jak pokazano na poniższym rysunku.

Rysunek 2. Dane z dodanym separatorem
Dane z dodanym separatorem

Po dokonaniu przekształcenia granicę między dwiema kategoriami można zdefiniować za pomocą hiperpłaszczyzny, tak jak przedstawiono to na poniższym rysunku.

Rysunek 3. Przekształcone dane
Przekształcone dane

Funkcja matematyczna używana do przekształceń jest znana jako algorytm domyślny. Algorytm SVM w programie IBM® SPSS Modeler obsługuje następujące typy algorytmów domyślnych:

  • Liniowy
  • Wielomianowy
  • Radialna funkcja bazowa (RBF)
  • Sigmoidalny

Funkcja algorytmu domyślnego jest zalecana, o ile liniowa separacja danych jest nieskomplikowana. W innych przypadkach należy użyć jednej z pozostałych funkcji. Konieczne będzie wypróbowanie różnych funkcji w celu uzyskania najlepszego modelu w przypadku każdej obserwacji, ponieważ każda z nich wykorzystuje inne algorytmy i parametry.