Skalowanie wielowymiarowe pozwala na redukcję wymiaru cech. Dla macierzy danych:
będziemy chcieli zrzutować ,,optymalnie” dane na
Optymalność zdefiniujemy w kategoriach macierzy odległości lub podobieństwa dla
Macierz odległości to taka macierz, która spełnia własności:
Macierz podobieństwa jest macierzą konstruowaną w sposób przeciwstawny do macierzy odległości o własnościach:
Dla macierzy danych
Classical multidimensional scaling:
Sammon scaling:
Kruskal-Shepard scaling:
Niech
ponieważ mnożenie wektora przez macierz ortogonalną nie zmienia jego normy. Mamy więc:
Rzut
Przyjrzyjmy się następującej macierzy:
dla
gdzie
Wróćmy do minimalizacji wyrażenia:
Ponieważ
korzystając z rozkładu spektralnego
Dalszy dowód przebiega analogicznie do dowodu stwierdzenia 3.6. Można zauważyć związek pomiędzy własnościami składowych głównych dla podejścia populacyjnego i próbkowego.
∎Skalowanie wielowymiarowe:
porównanie skalowania wielowymiarowego i analizy składowych głównych dla danych Kraby: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/mds.R
porównanie skalowania wielowymiarowego i analizy składowych głównych dla danych Iris i Kraby: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/rzutDanych.R
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.