Skalowanie wielowymiarowe pozwala na redukcję wymiaru cech. Dla macierzy danych:
będziemy chcieli zrzutować ,,optymalnie” dane na , czyli zmniejszyć macierz do o wymiarch , .
Optymalność zdefiniujemy w kategoriach macierzy odległości lub podobieństwa dla obiektów. Zadaniem będzie znalezienie optymalnej reprezentacji obiektów w .
Macierz odległości to taka macierz, która spełnia własności:
Macierz podobieństwa jest macierzą konstruowaną w sposób przeciwstawny do macierzy odległości o własnościach:
Dla macierzy danych o wymiarach , zdefiniujmy jako macierz odległości euklidesowych pomiędzy obiektami:
Classical multidimensional scaling:
Sammon scaling:
Kruskal-Shepard scaling:
Niech oznacza macierz ortogonalną , , o wymiarze . Oznaczmy , czyli rzut na . Zdefiniujmy macierz odległości dla jako . Zauważmy, że:
ponieważ mnożenie wektora przez macierz ortogonalną nie zmienia jego normy. Mamy więc:
Rzut na pierwszych składowych głównych minimalizuje wyrażenie wśród wszystkich rzutów . Jest więc rozwiązaniem zadania classical multidimensional scaling.
Przyjrzyjmy się następującej macierzy:
dla ,
gdzie jest macierzą kowariancji próbkowej (estymator obciążony).
Wróćmy do minimalizacji wyrażenia:
Ponieważ jest stałą, zadanie minimalizacji wyrażenia jest równoważne zadaniu maksymalizacji . Maksymalizujemy po ortogonalnym układzie wektorów wyrażenie:
korzystając z rozkładu spektralnego ,
Dalszy dowód przebiega analogicznie do dowodu stwierdzenia 3.6. Można zauważyć związek pomiędzy własnościami składowych głównych dla podejścia populacyjnego i próbkowego.
∎Skalowanie wielowymiarowe:
porównanie skalowania wielowymiarowego i analizy składowych głównych dla danych Kraby: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/mds.R
porównanie skalowania wielowymiarowego i analizy składowych głównych dla danych Iris i Kraby: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/rzutDanych.R
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.