Skalowanie wielowymiarowe pozwala na redukcję wymiaru cech. Dla macierzy danych:
![]() |
będziemy chcieli zrzutować ,,optymalnie” dane na , czyli zmniejszyć macierz
do
o wymiarch
,
.
Optymalność zdefiniujemy w kategoriach macierzy odległości lub podobieństwa dla obiektów. Zadaniem będzie znalezienie optymalnej reprezentacji obiektów w
.
Macierz odległości to taka macierz, która spełnia własności:
![]() |
Macierz podobieństwa jest macierzą konstruowaną w sposób przeciwstawny do macierzy odległości o własnościach:
![]() |
Dla macierzy danych o wymiarach
, zdefiniujmy
jako macierz odległości euklidesowych pomiędzy obiektami:
![]() |
Classical multidimensional scaling:
![]() |
Sammon scaling:
![]() |
![]() |
Kruskal-Shepard scaling:
![]() |
Niech oznacza macierz ortogonalną
,
,
o wymiarze
. Oznaczmy
, czyli rzut
na
. Zdefiniujmy macierz odległości dla
jako
. Zauważmy, że:
![]() |
ponieważ mnożenie wektora przez macierz ortogonalną nie zmienia jego normy. Mamy więc:
![]() |
Rzut na
pierwszych składowych głównych minimalizuje wyrażenie
wśród wszystkich rzutów
. Jest więc rozwiązaniem zadania classical multidimensional scaling.
Przyjrzyjmy się następującej macierzy:
![]() |
dla ,
![]() |
![]() |
![]() |
gdzie jest macierzą kowariancji próbkowej (estymator obciążony).
Wróćmy do minimalizacji wyrażenia:
![]() |
![]() |
Ponieważ jest stałą, zadanie minimalizacji wyrażenia
jest równoważne zadaniu maksymalizacji
. Maksymalizujemy po ortogonalnym układzie wektorów
wyrażenie:
![]() |
![]() |
![]() |
korzystając z rozkładu spektralnego ,
![]() |
![]() |
Dalszy dowód przebiega analogicznie do dowodu stwierdzenia 3.6. Można zauważyć związek pomiędzy własnościami składowych głównych dla podejścia populacyjnego i próbkowego.
∎Skalowanie wielowymiarowe:
porównanie skalowania wielowymiarowego i analizy składowych głównych dla danych Kraby: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/mds.R
porównanie skalowania wielowymiarowego i analizy składowych głównych dla danych Iris i Kraby: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/rzutDanych.R
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.