Statistique et Probabilités [M3201]
TP 4 : Estimateurs et estimation
Introduction
Pour commencer, lisez la partie du cours relative aux estimateurs et à l’estimation.
Illustration du biais et de la variance d’un estimateur:
source: http://scott.fortmann-roe.com/docs/BiasVariance.html
Exercice 1
1) Estimateurs de \(\mu\)
On souhaite tirer aléatoirement N échantillons de taille n d’une v.a \(X\) suivant une loi normale \(\mathcal N(\mu,1)\).
Choisir une valeur arbitraire de \(\mu\).
On choisit \(N=10000\) et \(n=100\).
On considère les estimateurs \(T_1\) des moyennes empiriques et \(T_2\) des médianes empiriques sur des échantillons de taille \(n\).
Les deux estimateurs estiment la valeur de \(\mu\) (rappelons que \(\mathbb E[X] = \mu\) et Mediane(\(X\)) = \(\mu\))
Evaluez \(N\) fois les estimateurs \(T_1\) et \(T_2\) puis estimer leurs biais, variances et erreurs quadratique moyenne pour les comparer.
2) Estimateurs de \(\sigma^2\)
On choisit maintenant la loi \(\mathcal N(0,\sigma^2)\).
Choisir une valeur arbitraire de \(\sigma^2\).
On souhaite estimer l’écart type \(\sigma\) avec trois estimateurs :
- L’estimateur \(T_1(X_1,\ldots, X_n) = \sqrt{\displaystyle \frac{1}{n-1} \displaystyle \sum_{k=1}^{n} (X_k-\bar X_n)^2}\).
- La racine carrée de la variance empirique \(T_2(X_1,\ldots, X_n)=\sqrt{\displaystyle \frac{1}{n} \displaystyle \sum_{k=1}^{n} (X_k-\bar X_n)^2}\).
- La distance interquartile (différence entre le troisième et le premier quartile) divisée par qnorm(0.75)-qnorm(0.25) : \(T_3(X_1,\ldots, X_n)=\displaystyle\frac{Q_3-Q_1}{1.34898}\).
Evaluez \(N\) fois les estimateurs \(T_1\), \(T_2\) et \(T_3\) puis comparer les. Visualiser des histogrammes (\(\color{blue}{\texttt{hist}}\)) ou des diagramme en boite (\(\color{blue}{\texttt{boxplot}}\)) des trois estimateurs.
Exercice 2
Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi uniforme sur l’intervalle \([0,\theta]\), où \(\theta\) est le paramètre inconnu que l’on cherche à estimer. On propose trois estimateurs de \(\theta\) :
\(T_1= 2 \bar X_n\)
\(T_2 = \max_{i=1,...,n} (X_i)\)
\(T_3 = \displaystyle \frac{n+1}{n} T_2\)
Pour chaque estimateur, calculer l’espérance et la variance, ainsi que l’erreur quadratique moyenne.
Mettre en oeuvre un programme pour illustrer vos calculs.
Exercice 3
1) Loi de Poisson:
Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi de Poisson de paramètre \(\lambda\) (\(X\sim\mathcal P(\lambda)\)), où \(\lambda\) est le paramètre inconnu que l’on cherche à estimer.
Proposer deux estimateurs \(T_1\) et \(T_2\) pour \(\lambda\).
Etudier et comparer les deux estimateurs.
2) Loi exponentielle:
Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi expoenentielle de paramètre \(\lambda\) (\(X\sim\mathcal E(\lambda)\)), où \(\lambda\) est le paramètre inconnu que l’on cherche à estimer.
Proposer deux estimateurs \(T_1\) et \(T_2\) pour \(\lambda\).
Etudier et comparer les deux estimateurs.
3) Loi binomiale:
Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi binomiale \(B(10,p)\), où \(p\) est le paramètre inconnu que l’on cherche à estimer.
Proposer deux estimateurs \(T_1\) et \(T_2\) pour \(p\).
Etudier et comparer les deux estimateurs.
Exercice 4
Un Sériciculteur a pesé 100 cocons de son élevage de vers à soie. Il a obtenu les résultats suivants (télécharger cocons.txt)
donnees <- read.table(file="cocons.txt", header=F, dec=".")
summary(donnees)
## V1
## Min. :0.6400
## 1st Qu.:0.6900
## Median :0.7100
## Mean :0.7132
## 3rd Qu.:0.7400
## Max. :0.7900
On appelle \(\mu\) le poids moyen de tous les cocons de l’élevage et on suppose que le poids d’un cocon suit une loi normale, \(\mathcal N(\mu,\sigma^2)\), avec \(\sigma^2 = 0.0016 g^2\). On suppose que \(X_i\) est le poids du i-ème cocon de cet échantillon. On suppose que ces \(n\) variables aléatoires sont indépendantes et identiquement distribuées.
- Donner la loi de \(\bar X_n = \displaystyle \frac 1n \sum_{i=1}^n X_i\). Centrez et réduisez cette variable aléatoire. On notera \(Z_n\), cette variable centrée réduite. Donner la loi de \(Z_n\).
- Déterminer un réel \(t\) tel que \(\rm P(-t\leq Z_n\leq t)\geq 0.95\).
- Montrer que \(\rm P(\bar X_n-0.00784\leq \mu \leq \bar X_n + 0.00784) \geq 0.95\)