Założenie: Dany jest skończony zbiór obiektów
Każdy obiekt (rekord) jest opisany wektorem informacyjnym, składającym się z wartości pochodzących z dziedziny pewnych atrybutów warunkowych.
Wyróżniony jest jeden atrybut, zwany też atrybutem decyzyjnym
Cel: wyznaczyć klasę decyzyjną, do której należy nowy nieznany dotąd obiekt.
Jak? Znaleźć zależność (najlepiej funkcyjną) między atrybutem decyzyjnym a atrybutami warunkowymi.
Tworzenie modelu: opisywanie klas decyzyjnych
Klasa decyzyjna = zbiór obiektów mających taką samą wartość na atrybucie decyzyjnym
Klasyfikator: algorytm określenia klasy decyzyjnej obiektów za pomocą ich wartości na atrybutach warunkowych.
Klasyfikatory mogą być opisane za pomocą formuł logicznych, drzew decyzyjnych lub formuł matematycznych.
Korzystanie z modelu do przypisanie nowym nieznanym obiektom ich klasy decyzyjne.
Problem: Jak oceniać model?
Wiele problemów decyzyjnych można opisać jako problem klasyfikacji
DSS (Decision Support System) jest systemem komputerowym dostarczającym narzędzia do rozwiązywania problemów klasyfikacji.
Zbiór treningowy
Klasyfikator(y)
Wymagania:
Szybkość podejmowania decyzji, skalowalność
Skuteczność
Racjonalność
Możliwość współpracy z ekspertem: doradztwo, adaptacja, negocjacja, adopcja wiedzy eksperskiej, …
Są to metody leniwej klasyfikacji, które opóźniają proces przetwarzania danych aż do momentu kiedy pojawi się nowy obiekt do klasyfikowania
Typowe metody:
algorytm najbliższych sąsiadów
Tablica decyzyjna
Klasa decyzyjna, do której należy
Szukaj w zbiorze
Wyznacz klasę dla
0.4 0.59 \column
Najczęściej wykorzystany dla danych z atrybutami numerycznymi
Wymagania:
Zbiór treningowy
Funkcja odległości między obiektami
Wartość parametru
Podczas klasyfikacji:
Wyznaczanie k najbliższych sąsiadów
Wyznaczenie klasy decyzyjnej nowego obiektu na podstawie klas decyzyjnych najbliższych sąsiadów (np. przez głosowanie).
Jest to przykład metody leniwej, gdyż
Nie buduje jawnego modelu wiedzy
Proces klasyfikacji może być czasochłonny
Jeśli k jest za mała, klasyfikator będzie wrażliwa na drobne szumy w danych
Jeśli k jest zbyt duża:
Wysoka złożoność obliczeniowa
Otoczenia mogą zawierać obiekty z innych klas
Algorytm k-NN dla ciągłej decyzji
Wystarczy obliczyć średnią z decyzji najbliższych sąsiadów
Problem skalowania atrybutów
Np. opis człowieka:
(Wzrost [m], Waga [kg], Klasa)
Wzrost odchyla się od 1.5 m do 1.85 m
Waga może mieć wartość od 45 kg do 120 kg
Odległość euklidesowa jest bardziej wrażliwa na różnicę wag niż różnicę wzrostu.
Przekleństwo wymiarów
Może produkować wyniki niezgodne z intuicją (np. klasyfikacji dokumentów)
Rozwiązanie: Normalizacja
Sąsiedzi ważeni względem odległośc
Wpływ sąsiada
Bliżsi sąsiedzi mają większy wpływ
0.6
Dany jest zbiór treningowy
MAP (maximum posteriori) hypothesis
Trudności: ta metoda wymaga znajomości wielu rozkładów prawdopodobieństw
0.39
Klasyfikacja obiektu opisanego przez
Znaleźć
Problem: obliczenie
Naiwne założenie: atrybuty są warunkowo niezależne!
Wówczas
Czyli
To założenie znacznie obniża złożoność obliczeniowy.
Nowy obiekt
X jest klasyfikowany do klasy n (don’t play)
Założenie o niezależności:
Próby pokonania te ograniczenia:
Sieci Bayesowskie, które łączą metody wnioskowania Bayesowskiego z zależnościami między atrybutami
Drzewa decyzyjne, które przeprowadzają dedukcyjne kroki na pojedyńczych atrybutach, począwszy od najważniejszego
Sieci Bayesowskie dopuszczają “warunkową niezależność” podzbiorów zmiennych.
Jest to graficzny model zależności przyczynowo-skutkowych
Naive Bayes jest szczególnym przypadkiem sieci Bayesowskiej (jakim?)
Problemy związane uczeniem sieci Bayesowskich:
Prypadek najłatwiejszy: zarówno struktura sieci, jak i wszystkie zmienne są znane.
Znana jest struktura, ale brakuje rozkładów zmiennych.
Nawet struktura sieci nie jest z góry zadana.
Ogólna formuła
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.