Dana jest próbka treningowa
0.5 0.58 \column
Klasyfikatorem liniowym nazywamy funkcję
Próbka
0.5 0.5 \column
Uproszczony warunek:
dla każdego
Każda z tych linii dobrze seperuje punkty;
Która z nich jest najlepsza?
Margines = szerokość bezpiecznego obszaru po obu stronach hiperpłaszczyzny;
Margines jest wyznaczony przez 2 hiperpłaszczyzny.
Chcemy znaleźć klasyfikator z maksymalnym marginesem
0.5
Niech
Powiniśmy oprzeć brzegi o punkty z próbki treningowej
Te punkty nazywamy wektorami podpierającymi
Równanie
0.5
Odległość między
Maksymalizujemy
Zadanie LSVM
Znaleźć
przy ograniczeniach
Q: Jak rozwiązać tego typu zagadnienia?
A: Metodą gradientu?, symulowanego wyżrzania?, odwracanie macierzy? EM? Newton? PROGRAMOWANIE KWADRATOWE?
Znaleźć
przy założeniach:
oraz
To zagadnienie jest dobrze zbadane i istnieją bardzo efektywne algorytmy rozwiązujące ten problem
Rozwiązywanie zagadnienia LSVM
gdzie
Punkt siodłowy = maksimum funkcji względem
Twierdzenie Karusha-Kuhna-Tuckera: warunkiem koniecznym istnienia punktu siodlowego jest
zerowanie się gradientu wzg.
(10.1) |
zerowanie się pochodnej wzg.
(10.2) |
spełnienie warunku:
(10.3) |
Po uwzględnieniu tych warunków (na istnienie punktu siodłowego) mamy nowy problem optymalizacyjny:
Znaleźć wektor
(10.4) |
przy ograniczeniach
(10.5) |
Niech wektor
Z (3) wynika, że jeśli
Równania (4) i (5) odbywają się faktycznie tylko po wektorach podpierających.
Hyperpłaszczyzna rozdzielająca ma postać
tu
Ostateczna funkcja decyzyjna:
(10.6) |
Założenie o separowalności klas jest nienaturalna;
Modyfikacja:
gdzie stałe
Zmodyfikowana funkcja do minimalizacji
Ogólne zadanie SVM
Znaleźć
przy ograniczeniach
Można pokazać, że zarówno i w tym przypadku, możemy sprowadzić do problemu
Znaleźć wektor
(10.7) |
przy ograniczeniach
(10.8) |
A następnie stosować funkcję decyzyjną: \block
(10.9) |
Przekształcimy dane do bogatszej przetrzeni cech:
Wystarczy zamienić iloczyny skalarne
PROBLEM OBLICZENIOWY: czas wykonania iloczynu skalarnego
TRIK: Kernel functions
Zmieniona funkcja:
Problem
wektor
przy ograniczeniach
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.