Dla próby losowej
zajmiemy się reprezentacją graficzną danych. Zaczniemy od boxplotu.
Boxplot. Przykładowy boxplot znajduje się na rysunku 2.1. Do jego narysowania potrzebne są następujące elementy:
kwartyle próbkowe
;
rozstęp międzykwartylowy (wysokość pudełka)
;
wąs górny
, gdzie
oznacza element maksymalny z próby;
wąs dolny
, gdzie
oznacza element minimalny z próby;
obserwacje odstające, które nie mieszczą się w przedziale
i nanosimy je oddzielnie w postaci punktów.
Załóżmy, że próba
pochodzi z rozkładu o gęstości
i jest iid (niezależna o tym samym rozkładzie), będziemy szukać estymatora dla gęstości
.
Histogram. Przykładowy histogram znajduje się na rysunku 2.1. Wybieramy dowolne
. Dla ustalonego
, oznaczającego szerokość klasy, tworzymy odcinki:
Histogramem nazywamy funkcję
:
![]() |
Podczas rysowania histogramu ważną kwestią jest dobór odpowiedniej szerokości przedziału,
. Istnieje wiele konwencji wyboru, niektóre z nich to:
Jeżeli
,
.
Jeśli
jest normalna,
.
Inny wybór to
.
Estymator jądrowy gęstości. Przykładowy estymator jądrowy gęstości znajduje się na rysunku 2.1.
![]() |
Dla budowy tego estymatora ważny jest dobór dwóch parametrów: szerokości pasma
oraz funkcji jądra
. Jądro jest gęstością dowolnego rozkładu, czyli jest dowolną funkcją określoną na
o własnościach
,
. Jednym z wyborów może być jądro postaci:
![]() |
Jeśli
oraz
, to w klasie symetrycznych jąder
, asymptotycznie optymalne jest
. Ponadto:
![]() |
Jeśli
jest gęstością rozkładu normalnego, to
.
Jeśli jądro
jest gęstością standardowego rozkładu normalnego oraz
jest rozkładem normalnym, to
.
Jeśli jądro jest równe
oraz
jest rozkładem normalnym, to ![]()
Domyślnie w programie R nastawiona jest metoda Silvermana wyboru parametru
:
.
Estymator jądrowy gęstości:
dla danych Pima jednowymiarowy: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/density.R
dla danych Pima dwuwymiarowy: http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/density2d.R
nastawianie szerokosci pasma w estymatorze jadrowym gestosci http://www.mimuw.edu.pl/~pokar/StatystykaII/EKSPLORACJA/bandwidth.pp.R
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010.
Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.