tp4.utf8.md

Introduction

Pour commencer, lisez la partie du cours relative aux estimateurs et à l’estimation.

Illustration du biais et de la variance d’un estimateur:

biais et variance
source: http://scott.fortmann-roe.com/docs/BiasVariance.html

Exercice 1

1) Estimateurs de \(\mu\)

On souhaite tirer aléatoirement N échantillons de taille n d’une v.a \(X\) suivant une loi normale \(\mathcal N(\mu,1)\).

Choisir une valeur arbitraire de \(\mu\).

On choisit \(N=10000\) et \(n=100\).

On considère les estimateurs \(T_1\) des moyennes empiriques et \(T_2\) des médianes empiriques sur des échantillons de taille \(n\).

Les deux estimateurs estiment la valeur de \(\mu\) (rappelons que \(\mathbb E[X] = \mu\) et Mediane(\(X\)) = \(\mu\))

Evaluez \(N\) fois les estimateurs \(T_1\) et \(T_2\) puis estimer leurs biais, variances et erreurs quadratique moyenne pour les comparer.

2) Estimateurs de \(\sigma^2\)

On choisit maintenant la loi \(\mathcal N(0,\sigma^2)\).

Choisir une valeur arbitraire de \(\sigma^2\).

On souhaite estimer l’écart type \(\sigma\) avec trois estimateurs :

  • L’estimateur \(T_1(X_1,\ldots, X_n) = \sqrt{\displaystyle \frac{1}{n-1} \displaystyle \sum_{k=1}^{n} (X_k-\bar X_n)^2}\).
  • La racine carrée de la variance empirique \(T_2(X_1,\ldots, X_n)=\sqrt{\displaystyle \frac{1}{n} \displaystyle \sum_{k=1}^{n} (X_k-\bar X_n)^2}\).
  • La distance interquartile (différence entre le troisième et le premier quartile) divisée par qnorm(0.75)-qnorm(0.25) : \(T_3(X_1,\ldots, X_n)=\displaystyle\frac{Q_3-Q_1}{1.34898}\).

Evaluez \(N\) fois les estimateurs \(T_1\), \(T_2\) et \(T_3\) puis comparer les. Visualiser des histogrammes (\(\color{blue}{\texttt{hist}}\)) ou des diagramme en boite (\(\color{blue}{\texttt{boxplot}}\)) des trois estimateurs.

Exercice 2

Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi uniforme sur l’intervalle \([0,\theta]\), où \(\theta\) est le paramètre inconnu que l’on cherche à estimer. On propose trois estimateurs de \(\theta\) :

  • \(T_1= 2 \bar X_n\)

  • \(T_2 = \max_{i=1,...,n} (X_i)\)

  • \(T_3 = \displaystyle \frac{n+1}{n} T_2\)

Pour chaque estimateur, calculer l’espérance et la variance, ainsi que l’erreur quadratique moyenne.

Mettre en oeuvre un programme pour illustrer vos calculs.

Exercice 3

1) Loi de Poisson:

Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi de Poisson de paramètre \(\lambda\) (\(X\sim\mathcal P(\lambda)\)), où \(\lambda\) est le paramètre inconnu que l’on cherche à estimer.

  1. Proposer deux estimateurs \(T_1\) et \(T_2\) pour \(\lambda\).

  2. Etudier et comparer les deux estimateurs.

2) Loi exponentielle:

Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi expoenentielle de paramètre \(\lambda\) (\(X\sim\mathcal E(\lambda)\)), où \(\lambda\) est le paramètre inconnu que l’on cherche à estimer.

  1. Proposer deux estimateurs \(T_1\) et \(T_2\) pour \(\lambda\).

  2. Etudier et comparer les deux estimateurs.

3) Loi binomiale:

Soient \(X_1,\ldots,X_n\), \(n\) variables aléatoires indépendantes suivants la loi binomiale \(B(10,p)\), où \(p\) est le paramètre inconnu que l’on cherche à estimer.

  1. Proposer deux estimateurs \(T_1\) et \(T_2\) pour \(p\).

  2. Etudier et comparer les deux estimateurs.

Exercice 4

Un Sériciculteur a pesé 100 cocons de son élevage de vers à soie. Il a obtenu les résultats suivants (télécharger cocons.txt)

donnees <- read.table(file="cocons.txt", header=F, dec=".")
summary(donnees)
##        V1        
##  Min.   :0.6400  
##  1st Qu.:0.6900  
##  Median :0.7100  
##  Mean   :0.7132  
##  3rd Qu.:0.7400  
##  Max.   :0.7900

On appelle \(\mu\) le poids moyen de tous les cocons de l’élevage et on suppose que le poids d’un cocon suit une loi normale, \(\mathcal N(\mu,\sigma^2)\), avec \(\sigma^2 = 0.0016 g^2\). On suppose que \(X_i\) est le poids du i-ème cocon de cet échantillon. On suppose que ces \(n\) variables aléatoires sont indépendantes et identiquement distribuées.

  1. Donner la loi de \(\bar X_n = \displaystyle \frac 1n \sum_{i=1}^n X_i\). Centrez et réduisez cette variable aléatoire. On notera \(Z_n\), cette variable centrée réduite. Donner la loi de \(Z_n\).
  1. Déterminer un réel \(t\) tel que \(\rm P(-t\leq Z_n\leq t)\geq 0.95\).
  1. Montrer que \(\rm P(\bar X_n-0.00784\leq \mu \leq \bar X_n + 0.00784) \geq 0.95\)