Dla próby losowej zajmiemy się reprezentacją graficzną danych. Zaczniemy od boxplotu.
Boxplot. Przykładowy boxplot znajduje się na rysunku 2.1. Do jego narysowania potrzebne są następujące elementy:
kwartyle próbkowe ;
rozstęp międzykwartylowy (wysokość pudełka) ;
wąs górny , gdzie oznacza element maksymalny z próby;
wąs dolny , gdzie oznacza element minimalny z próby;
obserwacje odstające, które nie mieszczą się w przedziale i nanosimy je oddzielnie w postaci punktów.
Załóżmy, że próba pochodzi z rozkładu o gęstości i jest iid (niezależna o tym samym rozkładzie), będziemy szukać estymatora dla gęstości .
Histogram. Przykładowy histogram znajduje się na rysunku 2.1. Wybieramy dowolne . Dla ustalonego , oznaczającego szerokość klasy, tworzymy odcinki:
Histogramem nazywamy funkcję :
Podczas rysowania histogramu ważną kwestią jest dobór odpowiedniej szerokości przedziału, . Istnieje wiele konwencji wyboru, niektóre z nich to:
Jeżeli , .
Jeśli jest normalna, .
Inny wybór to .
Estymator jądrowy gęstości. Przykładowy estymator jądrowy gęstości znajduje się na rysunku 2.1.
Dla budowy tego estymatora ważny jest dobór dwóch parametrów: szerokości pasma oraz funkcji jądra . Jądro jest gęstością dowolnego rozkładu, czyli jest dowolną funkcją określoną na o własnościach , . Jednym z wyborów może być jądro postaci:
Jeśli oraz , to w klasie symetrycznych jąder , asymptotycznie optymalne jest . Ponadto:
Jeśli jest gęstością rozkładu normalnego, to .
Jeśli jądro jest gęstością standardowego rozkładu normalnego oraz jest rozkładem normalnym, to .
Jeśli jądro jest równe oraz jest rozkładem normalnym, to
Domyślnie w programie R nastawiona jest metoda Silvermana wyboru parametru : .
Estymator jądrowy gęstości:
dla danych Pima jednowymiarowy: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/density.R
dla danych Pima dwuwymiarowy: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/density2d.R
nastawianie szerokosci pasma w estymatorze jadrowym gestosci http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/bandwidth.pp.R
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.