Teoria zbiorów przybliżonych została wprowadzona w latach 80-tych przez prof. Zdzisława Pawlaka.
Głównym celem jest dostarczanie narzędzi dla problemu aproksymacji pojęć (zbiorów).
Zastosowania w systemach decyzyjnych:
Redukcja danych, selekcja ważnych atrybutów;
Generowanie reguł decyzyjnych;
Odkrywanie wzorców z danych: szablony, reguły asocjacyjne;
Odkrywanie zależności w danych.
Definicja
Jest to para
Dla
Zbiór sygnatur względem
Tablica decyzyjna powstaje ze zwykłych tablic danych poprzez sprecyzowanie:
Atrybutów (nazwanych warunkowymi): cechy, których wartości na obiektach są dostępne, np. pomiary, parametry, dane osobowe, …
Decyzji (atrybut decyzyjny):, t.j. cecha “ukryta” związana z pewną znaną częściowo wiedzą o pewnym pojęciu:
Decyzja jest znana tylko dla obiektów z (treningowej) tablicy decyzyjnej;
Jest podana przez eksperta (np. lekarza) lub na podstawie późniejszych obserwacji (np. ocena giełdy);
Chcemy podać metodę jej wyznaczania dla dowolnych obiektów na podstawie wartości atrybutów warunkowych na tych obiektach.
4.5cm Przedstawiona tablica decyzyjna zawiera:
8 obiektów będących opisami pacjentów
3 atrybuty: Headache Muscle pain, Temp.
Decyzję stwierdzącą czy pacjent jest przeziębiony czy też nie. lub nie
8cm \example
Ból głowy | Ból mięśni | Temp. | Grypa | |
---|---|---|---|---|
p1 | Tak | Tak | N | Nie |
p2 | Tak | Tak | H | Tak |
p3 | Tak | Tak | VH | Tak |
p4 | Nie | Tak | N | Nie |
p5 | Nie | Nie | H | Nie |
p6 | Nie | Tak | VH | Tak |
p7 | Nie | Tak | H | Tak |
p8 | Nie | Nie | VH | Nie |
Dane są obiekty
Dla każdych obiektów
albo
albo
Relacja
jest relacją równoważności.
Każdy zbiór atrybutów
Dla
4.5cm
obiekty
są 3 klasy nierozróżnialności relacji
8cm \example
Ból głowy | Ból mięśni | Temp. | Grypa | |
---|---|---|---|---|
p1 | Tak | Tak | N | Nie |
p2 | Tak | Tak | H | Tak |
p3 | Tak | Tak | VH | Tak |
p4 | Nie | Tak | N | Nie |
p5 | Nie | Nie | H | Nie |
p6 | Nie | Tak | VH | Tak |
p7 | Nie | Tak | H | Tak |
p8 | Nie | Nie | VH | Nie |
Każdy zbiór obiektów
dokładny opis: jeśli
przybliżony opis: w przeciwnym przypadku (ZBIORY PRZYBLIŻONE)
W obu przypadkach
Obszar brzegowy (ang.
Obszar wewnętrzny (ang.
Zbiór jest przybliżony (ang. rough set) jeśli obszar brzegowy jest niepusty, w przeciwnym przypadku zbiór jest nazwany dokładny (ang. crisp set).
6cmNiech
<3-> Chcemy aproksymować pojęcie definiowane przez klasę decyzyjną (play=no)
<4-> Aproksymacje pojęcia
<5-> Reguła pewna:
5.4cm
\onslide<1->
ID
outlook
temp.
hum.
windy
play
1
sunny
hot
high
FALSE
no
2
sunny
hot
high
TRUE
no
3
overcast
hot
high
FALSE
yes
4
rainy
mild
high
FALSE
yes
5
rainy
cool
normal
FALSE
yes
6
rainy
cool
normal
TRUE
no
7
overcast
cool
normal
TRUE
yes
8
sunny
mild
high
FALSE
no
9
sunny
cool
normal
FALSE
yes
10
rainy
mild
normal
FALSE
yes
11
sunny
mild
normal
TRUE
yes
12
overcast
mild
high
TRUE
yes
13
overcast
hot
normal
FALSE
yes
14
rainy
mild
high
TRUE
no
<5-> Reguły przybliżone:
Jakość aproksymacji (ang. accuracy of approximation)
Jeśli
Jeśli
W systemach decyzyjnych, nie wszystkie atrybuty są potrzebne do procesie podejmowania decyzji;
Chcemy wybrać pewne podzbiory atrybutów niezbędnych do tego celu;
Redukty to minimalne podzbiory atrybutów zachowujących charakterystykę całego zbioru atrybutów.
W teorii zbiorów przybliżonych, istnieją co najmniej 2 pojęcia reduktów: informacyjne i decyzyjne.
Definicja reduktu informacyjnego
Zbiór atrybutów
t.j. dla dowolnych obiektów
jeśli
tzn. żaden właściwy podzbiór
Definicja reduktu decyzyjnego
Zbiór atrybutów
t.j. dla dowolnych obiektów
jeśli
tzn. żaden właściwy podzbiór
Jeśli
rdzeń: zbiór atrybutów będących we wszystkich reduktach
Znaleźć rdzeń danej tablicy decyzyjnej;
Znaleźć jakiś redukt;
Znaleźć krótkie redukty;
Znaleźć długie redukty.
<1-2> Problem najkrótszego reduktu \block
Tablica decyzyjna
“najkrótszy redukt tablicy decyzyjnej
<2> Twierdzenie Problem szukania najkrótszego reduktu jest NP-zupełny. \block
<+-| alert@+> Ogólnie musimy pokazać, że jakiś znany NP-zupełny problem jest “łatwiejszy” od problemu najkrótszego reduktu;
<+-| alert@+> Wybierzmy problem minimalnego pokrycia wierzchołkami:
“Dany jest graf
<+-| alert@+> Wielomianowa transformacja:
<4->
0 | 0 | 0 | 0 | 0 | 0 | |
1 | 1 | 0 | 0 | 0 | 1 | |
1 | 0 | 0 | 1 | 0 | 1 | |
0 | 1 | 0 | 0 | 1 | 1 | |
0 | 1 | 0 | 1 | 0 | 1 | |
1 | 0 | 1 | 0 | 0 | 1 | |
0 | 0 | 1 | 0 | 1 | 1 |
<+-> Można też pokazać, że problem najkrótszego reduktu jest “łatwiejszy” niż znany problem “Minimal Hitting Set” (minimalny zbiór przecinający?)
Dane: Zbiór
Szukane: minimalny zbiór przecinający.
<+-> Te problemy są obliczeniowo równoważne!
Czyli każdy algorytm dla jednego problemu można przeksztalcić w czasie wielomianowym na odpowiedni algorytmu dla drugiego problemu, który posiada te same cechy zlożonościowe.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.