Dla próby losowej zajmiemy się reprezentacją graficzną danych. Zaczniemy od boxplotu.
Boxplot. Przykładowy boxplot znajduje się na rysunku 2.1. Do jego narysowania potrzebne są następujące elementy:
kwartyle próbkowe ;
rozstęp międzykwartylowy (wysokość pudełka) ;
wąs górny , gdzie
oznacza element maksymalny z próby;
wąs dolny , gdzie
oznacza element minimalny z próby;
obserwacje odstające, które nie mieszczą się w przedziale i nanosimy je oddzielnie w postaci punktów.
Załóżmy, że próba pochodzi z rozkładu o gęstości
i jest iid (niezależna o tym samym rozkładzie), będziemy szukać estymatora dla gęstości
.
Histogram. Przykładowy histogram znajduje się na rysunku 2.1. Wybieramy dowolne . Dla ustalonego
, oznaczającego szerokość klasy, tworzymy odcinki:
![]() |
![]() |
Histogramem nazywamy funkcję :
![]() |
Podczas rysowania histogramu ważną kwestią jest dobór odpowiedniej szerokości przedziału, . Istnieje wiele konwencji wyboru, niektóre z nich to:
![]() |
Jeżeli ,
.
Jeśli jest normalna,
.
Inny wybór to .
Estymator jądrowy gęstości. Przykładowy estymator jądrowy gęstości znajduje się na rysunku 2.1.
![]() |
Dla budowy tego estymatora ważny jest dobór dwóch parametrów: szerokości pasma oraz funkcji jądra
. Jądro jest gęstością dowolnego rozkładu, czyli jest dowolną funkcją określoną na
o własnościach
,
. Jednym z wyborów może być jądro postaci:
![]() |
Jeśli oraz
, to w klasie symetrycznych jąder
, asymptotycznie optymalne jest
. Ponadto:
![]() |
![]() |
Jeśli jest gęstością rozkładu normalnego, to
.
Jeśli jądro jest gęstością standardowego rozkładu normalnego oraz
jest rozkładem normalnym, to
.
Jeśli jądro jest równe oraz
jest rozkładem normalnym, to
Domyślnie w programie R nastawiona jest metoda Silvermana wyboru parametru :
.
Estymator jądrowy gęstości:
dla danych Pima jednowymiarowy: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/density.R
dla danych Pima dwuwymiarowy: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/density2d.R
nastawianie szerokosci pasma w estymatorze jadrowym gestosci http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/bandwidth.pp.R
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.