Np. Pokazać, że dla każdego
<+-> Indukcja pełna:
<+-> Indukcja niepełna: czy wystarczy sprawdzić, np.
Podejście indukcyjne: Wnioskowanie na podstawie skończonego zbioru obserwacji
<2-> Jakie prawa rządzą procesem indukcyjnego uczenia się pojęć? <3-> Szukamy teorii obejmującej zagadnienia: \onslide\block
Szansy na skuteczne wyuczanie się pojęć;
Niezbędnej liczby przykładów treningowych;
Złożoności przestrzeni hipotez;
Jakości aproksymacji;
Metod reprezentacji danych treningowych;
<+-> Niech
<+-> Dane są
skończona próbka etykietowanych obiektów:
gdzie
przestrzeń hipotez
<+-> Szukana
hipoteza
<+-> Wymagane
dobra jakość aproksymacji
szybki czas wyuczania.
0.65
<+-> Pojęcie: ”człowieka o średniej budowie ciała”.
<+-> Dane – czyli osoby – są reprezentowane przez ich
wagę
<+-> Dodatkowa wiedza: szukane pojęcie można wyrazić za pomocą PROSTOKĄTA
<7-> 0.35\column\onslide<4->Uczenie prostokąta \block
<+->
<+->
<+-> Przykład zbioru treningowego
<+->
Uczenie półosi (lub dyskretyzacji):
Uczenie hiperpłaszczyzny:
gdzie
Uczenie jednomianów Boolowskich:
Błąd rzeczywisty
<+-> Błąd hipotezy
gdzie
<+->[Statystyka:] Jeśli przykłady z
<+->
<+-> z prawdopodobieństwem
Idea modelu PAC (Probably Approximately
Correct): Określenie warunków, przy których uczeń (algorytm
uczenia się) z ,,dużym prawdopodobieństwem”
znajdzie ,,dobrą hipotezę” na podstawie danych
<2>
PAC-owy uczeń Niech \block
dla każdych
Wówczas mówimy w skrócie, że
znaleźć
<2->Algorytm: \block
Set
<3-> Twierdzenie: Powyższy algorytm jest PAC \block
<+->
<+->Niech
<+-> Wówczas
<+->Stąd
<+-> Aby to prawdopodobieństwo było
Niech
Jeśli
Wówczas mówimy, że prawdopodobnie
<+-> Niech
zbiór hipotez zgodnych z
<+->
<4->
Definicja: Potencjalna wyuczalność
Mówimy, że \block
<1-> Algorytm
Twierdzenie W przestrzeni potencjalnie wyuczalnej, każdy wzorowy uczeń (niesprzeczny algorytm) jest PAC-owy.
<2->
Twierdzenie (Haussler, 1988)
Jeśli
Dowód: Niech
Aby
<+-> Niech
<+->
<+-> Gdy
<+-> Niech
<+-> Na przykład: W przypadku klasy pojęć ”półosi” postaci
Uwagi:
<+-> Jeśli
<+-> Maksymalna wartość
<3->
Definicja: wymiar \block
gdzie maksimum wynosi
0.7
<+->
<+->
<+->
<+->
VC(H) = 2 jeśli “+” są zawsze w środku
VC(H) = 3 jeśli w środku mogą być zarówno “+” i “-”
<+->
<+-> czy istnieje
0.3
Twierdzenie
Dla każdej liczby naturalnej
Dowód:
Twierdzenie
Jeśli
<+-> (Lemat Sauer'a) Jeśli
<+-> Wniosek:
<+-> Jeśli
Twierdzenie: (Warunek konieczny)
Jeśli przestrzeń hipotez ma nieskończony wymiar
<2-> Twierdzenie: (fundamentalne) Jeśli przestrzeń hipotez ma skończony wymiar VC, to jest ona potencjalnie wyuczalna. \block
<+-> Definiujemy
<+-> Szukamy górnego ograniczenia
- być niezależne od
- dążyć do 0 przy
<+-> Twierdzenie Niech
o ile
<+-> Korzystamy z lematu Sauer'a, aby pokazać, że
Dla skończonych przestrzeni hipotez
Twierdzenie Niech
Dolne ograniczenia:
Jeśli
1. Wyuczalność Kiedy każdy ,,wzorowy uczeń” będzie PAC-owy?
2. Liczba przykładów Ile przykładów musi mieć uczeń, by się nauczyć?
<2->
Skończoność wymiaru \block
<2->
<3-> Wówczas
3. Ocena ucznia
na podstawie
Kiedy i jak szybko
Skończoność wymiaru
<2->[3] Dla algorytmów typu ERM,
Znaleźć optimum nieznanej funkcji
Działanie algorytmu przeszukiwania
Ocena algorytmu:
Np.
Warunek NFL: Dla dowolnej funkcji
Twierdzenie o NFL
zachodzi równoważność
Prawdopodobieństwo wylosowania niepustej klasy funkcji zamkniętej wzg. permutacji wynosi:
Algorytm
Niech
Czy można stwierdzić wiedzieć, że
”No Free Lunch theorem” (Wolpert, Schaffer) w wersji problemów uczenia się głosi, że:
Żaden algorytm nie może być najlepszy w uczeniu wszystkich pojęć.
Każdy algorytm jest najlepszy dla takiej samej liczby pojęć
Ale interesuje nas tylko pewna klasa problemów czyli klasa pojęć
Wniosek: Należy znaleźć odp. algorytm do każdego problemu.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.