Exercice 1 : formule à la calculatrice pour simuler l’expérience aléatoire
a) Pour simuler cette expérience aléatoire, on peut utiliser une variable aléatoire binomiale. La formule pour une loi binomiale est :
\[ X \sim \mathcal{B}(n, p) \]
où \( n \) est le nombre de répétitions de l’expérience (le nombre d’habitants dans l’échantillon) et \( p \) est la probabilité de succès (avoir les yeux bleus). Ici, \( n = 30 \) et \( p = 0{,}3 \).
b) Pour simuler la constitution d’un échantillon de 30 habitants qui indiqueraient la couleur de leurs yeux avec une calculatrice, vous pouvez utiliser la fonction binomiale de votre calculatrice. La fonction à utiliser est généralement de la forme :
\[ \text{randBin}(n, p) \]
où \( n = 30 \) et \( p = 0{,}3 \).
Sur une calculatrice graphique, la commande exacte peut varier. Par exemple, sur une calculatrice CASIO, vous pourriez entrer :
\[ \text{randBin}(30, 0{,}3) \]
Cette commande vous donnera un nombre aléatoire correspondant au nombre de personnes ayant les yeux bleus dans un échantillon de 30 habitants. Répétez cette commande plusieurs fois pour obtenir différentes simulations et observer la variabilité des résultats.
Exercice 2 : tableur et simuler une expérience aléatoire
[a)] Pour simuler cette expérience aléatoire, nous pouvons utiliser une formule dans un tableur qui génère des nombres aléatoires entre 0 et 100. Si le nombre généré est inférieur ou égal à 40, nous considérons qu’il s’agit d’un véhicule de marque A. Sinon, il s’agit d’un véhicule de marque B. En langage LaTeX et avec une fonction comme `ALEA()` dans Excel, la formule pourrait être décrite comme suit:
\[
\text{Si Alea()}\times 100 \leq\, 40 \text{ alors } A, \text{ sinon } B
\]
En langage Excel, cela pourrait être traduit par:
\[
=SI(ALEA()*100 \leq\, 40, « A », « B »)
\]
[b)] Pour constituer un échantillon de taille 10 à l’aide du tableur, nous pouvons étendre la formule ci-dessus sur 10 lignes. Chaque ligne représentera un tirage aléatoire. Supposons que nous commençons dans la cellule A1, nous aurons alors:
\[
\begin{array}{|c|}
\hline
Rnd\times 100 \leq\, 40 \text{ ?}\\
\hline
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
=SI(ALEA()*100 \leq\, 40, « A », « B ») \\
\hline
\end{array}
\]
Chaque `SI(ALEA()*100 \leq\, 40, « A », « B »)` sera placé dans les cellules A1 à A10 respectivement pour générer les dix valeurs de l’échantillon aléatoire. Cela nous donnera une séquence de 10 valeurs indiquant s’il s’agit de véhicules de marque A ou B conformément aux probabilités données.
Exercice 3 : chaîne de production et échantillon
Soit \(p\) la proportion de pièces avec des imperfections sans gravité dans la population. On considère que \(p = 0,37\).
On souhaite tester si l’échantillon de 200 pièces (\(n = 200\)) donne une proportion significativement différente de \(0,37\).
Soit \(\hat{p}\) la proportion observée dans l’échantillon. On a :
\[
\hat{p} = \frac{86}{200} = 0,43
\]
On effectue un test de proportion. L’hypothèse nulle \(H_0\) est que la proportion de pièces défectueuses est de \(0,37\).
L’hypothèse alternative \(H_a\) est que la proportion est différente de \(0,37\).
La statistique de test pour une proportion est donnée par :
\[
z = \frac{\hat{p} – p}{\sqrt{\frac{p(1-p)}{n}}}
\]
Calculons cette statistique :
\[
z = \frac{0,43 – 0,37}{\sqrt{\frac{0,37 \times (1 – 0,37)}{200}}}
\]
D’abord, calculons le dénominateur :
\[
\sqrt{\frac{0,37 \times 0,63}{200}} = \sqrt{\frac{0,2331}{200}} = \sqrt{0,0011655} \approx 0,03414
\]
Ensuite, calculons la statistique \(z\) :
\[
z = \frac{0,43 – 0,37}{0,03414} \approx \frac{0,06}{0,03414} \approx 1,76
\]
On compare la valeur de \(z\) à des valeurs critiques pour un niveau de confiance spécifique pour décider de rejeter ou non \(H_0\). Pour un test bilatéral (à deux queues), on utilise les valeurs \(\pm 1,96\) pour un niveau de confiance de 95%.
Dans notre cas, \(z = 1,76\), ce qui n’est pas supérieur à 1,96. Cela signifie que nous ne pouvons pas rejeter l’hypothèse nulle au niveau de confiance de 95%.
Conclusion : D’après notre échantillon, il n’est pas significatif au niveau de confiance de 95% que la proportion de pièces défectueuses soit différente de 37%. Par conséquent, il n’est pas nécessaire d’envisager de faire réviser la chaîne de production sur la base de cet échantillon.
Exercice 4 : fournisseur d’électricité et échantillon
Pour vérifier si l’objectif de 75 % de clients satisfaits est atteint, nous devons comparer la proportion de clients satisfaits dans l’échantillon aux 75 % attendus.
\( n = 200 \) est la taille de l’échantillon, et \( x = 147 \) est le nombre de clients satisfaits.
La proportion observée de clients satisfaits est donnée par :
\[ \hat{p} = \frac{x}{n} = \frac{147}{200} = 0.\overline{73}5 \]
L’objectif du PDG est que 75 % des clients soient satisfaits, ce qui correspond à \( p_0 = 0.75 \).
Nous effectuerons un test d’hypothèse pour une proportion :
– Hypothèse nulle \( H_0 \) : \( p = 0.75 \)
– Hypothèse alternative \( H_a \) : \( p \neq 0.75 \)
La statistique de test pour une proportion est donnée par :
\[ z = \frac{\hat{p} – p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \]
Calculons cette statistique :
\[ \hat{p} = 0.735 \]
\[ p_0 = 0.75 \]
\[ n = 200 \]
\[ z = \frac{0.735 – 0.75}{\sqrt{\frac{0.75 \cdot 0.25}{200}}} = \frac{-0.015}{\sqrt{\frac{0.1875}{200}}} = \frac{-0.015}{0.0306} \approx -0.49 \]
Sous l’hypothèse nulle, cette statistique suit une loi normale standard \( N(0,1) \).
Nous devons maintenant comparer cette statistique au seuil critique pour un test bilatéral au niveau de signification \( \alpha \) typiquement choisi à 0.05 (ce qui donne \( z_\alpha/2 = 1.96 \) pour une valeur bilatérale).
Puisque \( | -0.49 | < 1.96 \), nous ne rejetons pas l’hypothèse nulle.
Par conséquent, avec un niveau de confiance de 95 %, nous ne pouvons pas conclure que la proportion de clients satisfaits est différente de 75 %. Le PDG peut donc considérer que son objectif de 75 % de satisfaction est atteint sur la base de cet échantillon.
Exercice 5 : une épidémie de grippe et effectif de l’échantillon
L’objectif est de déterminer la taille minimale de l’échantillon pour que l’intervalle de fluctuation au seuil de 95 % ait une longueur inférieure ou égale à \(0,02\).
On considère une proportion \( p = 0,015 \) (1,5 %).
L’intervalle de fluctuation au seuil de 95 % pour une proportion est donné par :
\[ [ \hat{p} – 1,96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}}, \hat{p} + 1,96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} ] \]
On veut que la longueur de cet intervalle soit \( \leq\, 0,02 \).
La longueur de l’intervalle est :
\[ 2 \times 1,96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} \leq\, 0,02 \]
Simplifions cela :
\[ 1,96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} \leq\, 0,01 \]
En élevant au carré des deux côtés :
\[ (1,96)^2 \frac{\hat{p}(1 – \hat{p})}{n} \leq\, (0,01)^2 \]
Soit :
\[ 3,8416 \frac{0,015 \times (1 – 0,015)}{n} \leq\, 0,0001 \]
En simplifiant :
\[ 3,8416 \frac{0,015 \times 0,985}{n} \leq\, 0,0001 \]
\[ 3,8416 \times 0,014775 \leq\, 0,0001 \times n \]
\[ 0,05673384 \leq\, 0,0001 \times n \]
\[ n \geq\, \frac{0,05673384}{0,0001} \]
\[ n \geq\, 567,3384 \]
En arrondissant à l’entier supérieur :
\[ n \geq\, 568 \]
Donc, l’effectif de l’échantillon doit être au moins de 568 pour que l’intervalle de fluctuation au seuil de 95 % ait une longueur inférieure ou égale à \(0,02\).
Exercice 6 : composants électroniques et fréquence
Soit \( p = 0,04 \) la proportion de composants défectueux.
\[\]a) Pour \( n = 1600 \), quelle est la longueur de \( I \) ?\[\]
L’intervalle de fluctuation au seuil de 95% est donné par :
\[ I = [ \hat{p} – 1,96 \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p} + 1,96 \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} ] \]
où \( \hat{p} = 0,04 \).
La longueur de l’intervalle \( I \) est donc :
\[ L = 2 \times 1,96 \sqrt{\frac{0,04 (1 – 0,04)}{1600}} \]
Calculons ceci :
\[ L = 2 \times 1,96 \sqrt{\frac{0,04 \times 0,96}{1600}} \]
\[ L = 2 \times 1,96 \sqrt{\frac{0,0384}{1600}} \]
\[ L = 2 \times 1,96 \sqrt{0,000024} \]
\[ L = 2 \times 1,96 \times 0,0049 \]
\[ L \approx 2 \times 0,009604 \]
\[ L \approx 0,0192 \]
La longueur de \( I \) pour \( n = 1600 \) est environ \( 0,0192 \).
\[\]b) Pour quelle valeur de \( n \) la longueur de \( I \) est-elle deux fois plus petite ?\[\]
Soit \( L_n \) la longueur de l’intervalle pour un échantillon de taille \( n \). Nous voulons trouver \( n \) tel que la longueur de \( I \) soit deux fois plus petite que celle trouvée en a).
Donc, nous cherchons \( n \) tel que :
\[ L_n = \frac{0,0192}{2} \]
\[ L_n = 0,0096 \]
Nous savons que :
\[ L_n = 2 \times 1,96 \sqrt{\frac{0,04 \times 0,96}{n}} = 0,0096 \]
Alors,
\[ 2 \times 1,96 \sqrt{\frac{0,0384}{n}} = 0,0096 \]
Résolvons pour \( n \) :
\[ 1,96 \sqrt{\frac{0,0384}{n}} = 0,0048 \]
\[ \sqrt{\frac{0,0384}{n}} = \frac{0,0048}{1,96} \]
\[ \sqrt{\frac{0,0384}{n}} = 0,002448 \]
\[ \frac{0,0384}{n} = 0,002448^2 \]
\[ \frac{0,0384}{n} = 0,000005996 \]
\[ n = \frac{0,0384}{0,000005996} \]
\[ n \approx 6404 \]
Pour que la longueur de l’intervalle \( I \) soit deux fois plus petite, il faut que \( n \approx 6404 \).
Exercice 7 : lancer de dé et fréquence d’obtention
a) Pour simuler un échantillon de 50 lancers et afficher la fréquence d’obtention d’un numéro supérieur ou égal à 5, nous pouvons procéder comme suit :
1. Initialiser un compteur à zéro pour compter les occurrences des résultats supérieurs ou égaux à 5.
2. Répéter l’action de lancer un dé 50 fois.
3. Vérifier si le résultat du lancer est supérieur ou égal à 5.
4. Si le résultat est supérieur ou égal à 5, incrémenter le compteur.
5. À la fin des 50 lancers, diviser le compteur par 50 pour obtenir la fréquence.
Écrivons cet algorithme en pseudo-code :
« `
Compteur <- 0
Pour i allant de 1 à 50 faire
Lancer <- nombre aléatoire entre 1 et 6
Si Lancer >= 5 alors
Compteur <- Compteur + 1
Fin Si
Fin Pour
Fréquence <- Compteur / 50
Afficher Fréquence
« `
b) Voici la traduction de cet algorithme en Python :
« `python
import random
# Initialiser le compteur
compteur = 0
# Répéter l’action de lancer un dé 50 fois
for _ in range(50):
lancer = random.randint(1, 6) # Générer un nombre aléatoire entre 1 et 6
if lancer >= 5:
compteur += 1
# Calculer la fréquence
frequence = compteur / 50
# Afficher la fréquence
print(f’Fréquence d\’obtention d\’un nombre supérieur ou égal à 5: {frequence}’)
« `
Le résultat peut varier en fonction de l’exécution aléatoire du code. Cependant, en moyenne, sur un grand nombre de simulations, on s’attend à obtenir une fréquence d’environ \( \frac{1}{3} \).
Exécutons une simulation pour obtenir une estimation. Par exemple, supposons que le programme affiche une fréquence de \(0.36\), cela signifie qu’environ 36% des lancers ont donné un résultat supérieur ou égal à 5.
Exercice 8 : champ de fleur et algorithme pour simuler un échantillon
[a)] Pour simuler un échantillon de 45 fleurs et afficher la fréquence des fleurs bleues, nous pouvons utiliser l’algorithme suivant :
\begin{verbatim}
Algorithme:
1. Initialiser le compteur de fleurs bleues à 0.
2. Pour i allant de 1 à 45:
a. Générer un nombre aléatoire r entre 0 et 1.
b. Si r < 0.4 alors:
– Ajouter 1 au compteur de fleurs jaunes.
c. Sinon:
– Ajouter 1 au compteur de fleurs bleues.
3. Calculer la fréquence des fleurs bleues comme suit:
Frequence_bleues = (compteur de fleurs bleues) / 45.
4. Afficher Frequence_bleues.
\end{verbatim}
[b)] Pour modifier l’algorithme afin de pouvoir saisir la taille de l’échantillon, nous pouvons utiliser ce code modifié:
\begin{verbatim}
Algorithme:
1. Saisir la taille de l’échantillon, notée n.
2. Initialiser le compteur de fleurs bleues à 0.
3. Pour i allant de 1 à n:
a. Générer un nombre aléatoire r entre 0 et 1.
b. Si r < 0.4 alors:
– Ajouter 1 au compteur de fleurs jaunes.
c. Sinon:
– Ajouter 1 au compteur de fleurs bleues.
4. Calculer la fréquence des fleurs bleues comme suit:
Frequence_bleues = (compteur de fleurs bleues) / n.
5. Afficher Frequence_bleues.
\end{verbatim}
Exercice 9 : formule de tableur et intervalle
a) La fonction \texttt{ALEA()} génère un nombre aléatoire uniformément distribué entre 0 et 1. Donc, l’intervalle des nombres possibles est :
\[ [0, 1] \]
b) La fonction \texttt{ALEA()} + 0,65 génère un nombre aléatoire initialement entre 0 et 1, auquel on ajoute 0,65. Par conséquent, l’intervalle des nombres possibles devient :
\[ [0 + 0,65, 1 + 0,65] = [0,65, 1,65] \]
c) La fonction \texttt{ALEA()} + \(\frac{1}{4}\) génère un nombre aléatoire initialement entre 0 et 1, auquel on ajoute \(\frac{1}{4}\) (soit 0,25). Par conséquent, l’intervalle des nombres possibles devient :
\[ [0 + 0,25, 1 + 0,25] = [0,25, 1,25] \]
Exercice 10 : tableur et probabilité
{Correction :}
Pour chaque formule, \[ENT(x)\] représente la partie entière de \[x\] et \[ALEA()\] renvoie un nombre aléatoire uniforme entre 0 et 1.
{a) =ENT(ALEA()+0,5)}
Nous devons déterminer la probabilité que \[ENT(ALEA() + 0,5) = 1\] et que \[ENT(ALEA() + 0,5) = 0\].
\[
\begin{aligned}
\text{Pour } ENT(ALEA()+0,5) = 1, \\
0,5 \leq\, ALEA() + 0,5 < 1,5 \\
0 \leq\, ALEA() < 1 \\
\end{aligned}
\]
La partie entière sera égale à \[1\] si \[0,5 \leq\, ALEA() < 1\],
\[
\mathbb{P}(1) = 1 – 0,5 = 0,5
\]
La partie entière sera égale à \[0\] si \[0 \leq\, ALEA() < 0,5\],
\[
\mathbb{P}(0) = 0,5 – 0 = 0,5
\]
{b) =ENT(ALEA()+0,27)}
Nous devons déterminer la probabilité que \[ENT(ALEA() + 0,27) = 1\] et que \[ENT(ALEA() + 0,27) = 0\].
\[
\begin{aligned}
\text{Pour } ENT(ALEA()+0,27) = 1, \\
0,73 \leq\, ALEA() + 0,27 < 1,27 \\
0,73 \leq\, ALEA() < 1 \\
\end{aligned}
\]
La partie entière sera égale à \[1\] si \[0,73 \leq\, ALEA() < 1\],
\[
\mathbb{P}(1) = 1 – 0,73 = 0,27
\]
La partie entière sera égale à \[0\] si \[0 \leq\, ALEA() < 0,73\],
\[
\mathbb{P}(0) = 0,73 – 0 = 0,73
\]
{c) =ENT(ALEA()+\frac{4}{7})}
Nous devons déterminer la probabilité que \[ENT(ALEA()+\frac{4}{7}) = 1\] et que \[ENT(ALEA()+\frac{4}{7}) = 0\].
\[
\begin{aligned}
\text{Pour } ENT(ALEA()+\frac{4}{7}) = 1, \\
\frac{3}{7} \leq\, ALEA() + \frac{4}{7} < \frac{11}{7} \\
0,4286 \leq\, ALEA() < 1 \\
\end{aligned}
\]
La partie entière sera égale à \[1\] si \[0,4286 \leq\, ALEA() < 1\],
\[
\mathbb{P}(1) = 1 – 0,4286 = 0,5714
\]
La partie entière sera égale à \[0\] si \[0 \leq\, ALEA() < 0,4286\],
\[
\mathbb{P}(0) = 0,4286 – 0 = 0,4286
\]
Exercice 11 : sac d’haricots et tableur pour simuler un échantillon
a) Pour simuler cette expérience aléatoire avec la formule \( \text{ENT}(\text{ALEA()} + 0,6) \) dans un tableur, on exploite la fonction \(\text{ALEA()}\) qui génère un nombre aléatoire compris entre 0 et 1. En ajoutant 0,6 à ce nombre, on obtient un nombre compris entre 0,6 et 1,6. Ensuite, en appliquant la fonction \(\text{ENT()}\), qui arrondit à l’entier inférieur, nous obtenons 0 si le nombre aléatoire est compris entre 0 et 0,6 (ce qui couvre 60% des cas) et 1 si le nombre est compris entre 0,6 et 1 (ce qui couvre 40% des cas). La formule génère donc un 0 (pour un haricot blanc) avec une probabilité de 60% et un 1 (pour un haricot rouge) avec une probabilité de 40%.
b) Pour simuler un échantillon de 38 haricots extraits de ce sac, on doit utiliser la formule précédente 38 fois. Voici un exemple de simulation (plusieurs simulations peuvent être effectuées, ci-dessous n’est qu’un exemple possible) :
\[
\begin{array}{ccccccccccccc}
0 1 0 0 0 1 1 0 0 1 0 0 0 \\
1 0 0 1 0 1 1 0 0 0 0 1 1 \\
0 1 1 0 0 1 0 0 1 1 0 0 1 \\
0 0 1 0 1 0
\end{array}
\]
Dans cet exemple, on a simulé 38 tirages au sort. Le nombre de 0 et de 1 tirés sera utilisé pour calculer les fréquences dans la partie suivante.
c) Calculons la fréquence des haricots blancs dans cet échantillon. Supposons que nous ayons obtenu 23 zeros (haricots blancs) parmi les 38 tirages.
La fréquence des haricots blancs dans cet échantillon est donnée par :
\[
\frac{\text{Nombre de haricots blancs}}{\text{Total des haricots}} = \frac{23}{38} \approx 0,605
\]
La fréquence théorique est de 0,6, mais la fréquence observée dans un échantillon peut varier en raison des fluctuations aléatoires inhérentes à tout processus d’échantillonnage. Ainsi, la fréquence obtenue (environ 0,605 ici) n’est pas nécessairement égale à la fréquence théorique de 0,6.
Exercice 12 : une boîte de perles et fréquence de cet échantillon
a) La simulation peut être effectuée en utilisant un générateur de nombres aléatoires pour sélectionner les perles dorées et argentées. Par exemple, en utilisant un générateur de nombres aléatoires qui donne un nombre entre 0 et 1 :
– Si le nombre est inférieur ou égal à 0,75, choisir une perle dorée.
– Sinon, choisir une perle argentée.
Répéter cette opération 45 fois pour obtenir l’échantillon.
b) Supposons que, dans l’échantillon de 45 perles, le nombre de perles dorées soit noté \( n_d \).
La fréquence des perles dorées dans cet échantillon est :
\[
f_d = \frac{n_d}{45}
\]
Cette fréquence peut ne pas être égale à 0,75 en raison de la variabilité inhérente à l’échantillonnage aléatoire. Par exemple, si on effectue une seule simulation et on obtient \( n_d = 34 \):
\[
f_d = \frac{34}{45} \approx 0,756
\]
Ce résultat diffère de 0,75 à cause de la fluctuation due à l’échantillonnage aléatoire. Plus la taille de l’échantillon est grande, plus la fréquence observée devrait se rapprocher de la proportion théorique de 0,75, conformément à la loi des grands nombres. Cependant, pour un échantillon de taille finie (comme 45), on peut observer des écarts.
Exercice 13 : montures de lunettes et intervalle de fluctuation
Pour déterminer un intervalle de fluctuation au seuil de 95 % centré sur 0,38 de la fréquence des montures pour femmes, pour des échantillons de taille 50, nous allons utiliser l’intervalle de fluctuation d’une proportion dans une loi binomiale approchée par une loi normale.
### 1. Les données
La proportion théorique de montures pour femmes est \( p = 0,38 \).
La taille de chaque échantillon est \( n = 50 \).
### 2. Calcul de l’espérance et de la variance
L’espérance de la proportion dans chaque échantillon est \( \mu = p = 0,38 \).
La variance de la proportion est donnée par :
\[ \sigma^2 = \frac{p(1 – p)}{n} = \frac{0.38 \times 0.62}{50} \]
Calculons la variance \( \sigma^2 \) :
\[ \sigma^2 = \frac{0.38 \times 0.62}{50} = \frac{0.2356}{50} = 0.004712 \]
### 3. L’écart-type
L’écart-type \( \sigma \) est la racine carrée de la variance :
\[ \sigma = \sqrt{0.004712} \approx 0.0686 \]
### 4. Intervalle de fluctuation
Pour un intervalle de confiance de 95 %, nous cherchons un intervalle autour de la proportion théorique \( p \) qui capture la proportion observée avec une probabilité de 95 %. Dans une loi normale, cela correspond à 1.96 écart-types de part et d’autre de \( p \).
L’intervalle de fluctuation est donc donné par:
\[ [p – 1.96 \cdot \sigma, p + 1.96 \cdot \sigma] \]
\[ [0.38 – 1.96 \cdot 0.0686, 0.38 + 1.96 \cdot 0.0686] \]
Calculons les bornes de cet intervalle :
\[ 0.38 – 1.96 \cdot 0.0686 \approx 0.38 – 0.1345 = 0.2455 \]
\[ 0.38 + 1.96 \cdot 0.0686 \approx 0.38 + 0.1345 = 0.5145 \]
### 5. Résultat final
L’intervalle de fluctuation au seuil de 95 % est :
\[ [0.2455, 0.5145] \]
Ainsi, pour des échantillons de taille 50, la fréquence observée des montures féminines devrait se situer entre 0.2455 et 0.5145 dans 95 % des cas.
Exercice 14 : des céréales et des lentilles avec intervalles de fluctuation
a) Soit \( n \) la taille de l’échantillon, ici \( n = 100 \).
Soit \( p \) la proportion de grains dans la population.
Pour déterminer les intervalles de fluctuation au seuil de 95%, on utilise la formule :
\[ I = [ p – 1,96 \times \sqrt{\frac{p(1-p)}{n}},\ p + 1,96 \times \sqrt{\frac{p(1-p)}{n}} ] \]
1. Pour les grains de blé :
\[ p = 0,58 \]
\[ I_{\text{blé}} = [ 0,58 – 1,96 \times \sqrt{\frac{0,58 \times 0,42}{100}},\ 0,58 + 1,96 \times \sqrt{\frac{0,58 \times 0,42}{100}} ] \]
Calculons \( \sqrt{\frac{0,58 \times 0,42}{100}} \) :
\[ \sqrt{\frac{0,58 \times 0,42}{100}} = \sqrt{\frac{0,2436}{100}} = \sqrt{0,002436} \approx 0,04936 \]
Donc :
\[ I_{\text{blé}} = [ 0,58 – 1,96 \times 0,04936,\ 0,58 + 1,96 \times 0,04936 ] \]
\[ I_{\text{blé}} = [ 0,58 – 0,09678,\ 0,58 + 0,09678 ] \]
\[ I_{\text{blé}} = [ 0,48322,\ 0,67678 ] \]
2. Pour les grains d’épeautre :
\[ p = 0,22 \]
\[ I_{\text{épeautre}} = [ 0,22 – 1,96 \times \sqrt{\frac{0,22 \times 0,78}{100}},\ 0,22 + 1,96 \times \sqrt{\frac{0,22 \times 0,78}{100}} ] \]
Calculons \( \sqrt{\frac{0,22 \times 0,78}{100}} \) :
\[ \sqrt{\frac{0,22 \times 0,78}{100}} = \sqrt{\frac{0,1716}{100}} = \sqrt{0,001716} \approx 0,04143 \]
Donc :
\[ I_{\text{épeautre}} = [ 0,22 – 1,96 \times 0,04143,\ 0,22 + 1,96 \times 0,04143 ] \]
\[ I_{\text{épeautre}} = [ 0,22 – 0,0812,\ 0,22 + 0,0812 ] \]
\[ I_{\text{épeautre}} = [ 0,1388,\ 0,3012 ] \]
b) Pour les grains de riz rouge et les lentilles, les proportions sont faibles (\( p = 0,10 \)). La formule du cours utilisée pour calculer les intervalles de fluctuation suppose que \( np \) et \( n(1-p) \) sont tous les deux supérieurs à 5.
Pour le riz rouge :
\[ np = 100 \times 0,10 = 10 \]
\[ n(1-p) = 100 \times 0,90 = 90 \]
Pour les lentilles :
\[ np = 100 \times 0,10 = 10 \]
\[ n(1-p) = 100 \times 0,90 = 90 \]
Bien que \( n(1-p) \) soit supérieur à 5, \( np \) est tout juste égal à 10, ce qui est à la limite acceptable pour l’utilisation de la formule normale. Ainsi, la précision de l’intervalle pourrait être réduite et d’autres méthodes pourraient être plus adaptées pour des proportions faibles.
Exercice 15 : déformation du crâne et proportions
La proportion observée de bébés présentant une déformation du crâne est \(\hat{p} = \frac{205}{440}\).
Calculons cette proportion :
\[
\hat{p} = \frac{205}{440} \approx 0,4659 \approx 46,59\%
\]
Pour tester si cette étude permet de rejeter les différentes proportions proposées (50 %, 61 %, et 3 %), nous utiliserons un test de z pour une proportion.
Le test statistique pour une proportion est donné par :
\[
z = \frac{\hat{p} – p_0}{\sqrt{\frac{p_0 (1 – p_0)}{n}}}
\]
où :
– \(\hat{p}\) est la proportion observée,
– \(p_0\) est la proportion hypothétique que nous testons,
– \(n\) est la taille de l’échantillon.
### a) Pour \(p_0 = 0,50\):
\[
z = \frac{0,4659 – 0,50}{\sqrt{\frac{0,50 \cdot (1 – 0,50)}{440}}} = \frac{-0,0341}{\sqrt{\frac{0,25}{440}}} = \frac{-0,0341}{0,0237} \approx -1,44
\]
Pour un seuil de signification \(\alpha = 0,05\) (test bilatéral), la valeur critique de \(z\) est \(\pm1,96\). Puisque \(|z| < 1,96\), nous ne rejetons pas l’hypothèse nulle et donc cette étude n’amène pas à rejeter la proportion de 50 %.
### b) Pour \(p_0 = 0,61\):
\[
z = \frac{0,4659 – 0,61}{\sqrt{\frac{0,61 \cdot (1 – 0,61)}{440}}} = \frac{-0,1441}{\sqrt{\frac{0,2379}{440}}} = \frac{-0,1441}{0,0232} \approx -6,21
\]
Avec \(|z| > 1,96\), nous rejetons l’hypothèse nulle. Cette étude amène donc à rejeter la proportion de 61 %.
### c) Pour \(p_0 = 0,03\):
\[
z = \frac{0,4659 – 0,03}{\sqrt{\frac{0,03 \cdot (1 – 0,03)}{440}}} = \frac{0,4359}{\sqrt{\frac{0,0291}{440}}} = \frac{0,4359}{0,0081} \approx 53,82
\]
Avec \(|z| > 1,96\), nous rejetons l’hypothèse nulle. Cette étude amène donc à rejeter la proportion de 3 %.
### Conclusion:
– Pour la proportion de 50 %, l’étude n’amène pas à rejeter cette proportion.
– Pour la proportion de 61 %, l’étude amène à rejeter cette proportion.
– Pour la proportion de 3 %, l’étude amène à rejeter cette proportion.
Exercice 16 : accès au musée du Louvre et échantillon constitué
Correction de l’exercice :
### Données :
– Proportion de visiteurs français les jours de gratuité, \( p = 0.59 \).
– Nouvelle proportion observée \( p_{\text{observé}} = 0.67 \).
### a) Pour un échantillon de 50 visiteurs :
La proportion observée est une variable aléatoire suivant une loi normale de moyenne \( p \) et d’écart-type \( \sigma \) donnés par :
\[ \sigma = \sqrt{\frac{p(1 – p)}{n}} \]
où \( n \) est la taille de l’échantillon.
Pour \( n = 50 \) :
\[ \sigma = \sqrt{\frac{0.59 \times 0.41}{50}} \approx 0.069 \]
On calcule le score \( Z \) :
\[ Z = \frac{p_{\text{observé}} – p}{\sigma} = \frac{0.67 – 0.59}{0.069} \approx 1.159 \]
Pour une loi normale centrée réduite, un score \( Z \) de \( 1.159 \) correspond à une probabilité de :
\[ P(Z > 1.159) \approx 0.123 \]
Cette probabilité n’est pas en dessous du seuil de significativité typique de \( 0.05 \). On ne peut donc pas conclure que la proportion de visiteurs français a significativement changé avec un échantillon de 50 visiteurs.
### b) Pour un échantillon de 500 visiteurs :
Pour \( n = 500 \) :
\[ \sigma = \sqrt{\frac{0.59 \times 0.41}{500}} \approx 0.022 \]
On calcule le score \( Z \) :
\[ Z = \frac{p_{\text{observé}} – p}{\sigma} = \frac{0.67 – 0.59}{0.022} \approx 3.636 \]
Pour une loi normale centrée réduite, un score \( Z \) de \( 3.636 \) correspond à une probabilité de :
\[ P(Z > 3.636) \approx 0.00014 \]
Cette probabilité est bien inférieure au seuil de significativité typique de \( 0.05 \). On peut donc conclure que la proportion de visiteurs français a significativement changé pour un échantillon de 500 visiteurs.
### Conclusion :
– Pour un échantillon de 50 visiteurs, il n’y a pas de preuve suffisante pour affirmer que la proportion de visiteurs français a changé significativement.
– Pour un échantillon de 500 visiteurs, il y a une preuve significative que la proportion de visiteurs français a augmenté.
Exercice 17 : association des consommateurs et intervalle de fluctuation
Pour vérifier cette annonce, nous allons utiliser l’intervalle de fluctuation au seuil de 95 % de la proportion \( p \) des acheteurs satisfaits d’un produit.
Notations:
– \( p = 0,97 \)
L’intervalle de fluctuation au niveau de confiance de 95 % est donné par la formule:
\[
I = [ p – 1,96 \times \sqrt{\frac{p(1-p)}{n}}, \; p + 1,96 \times \sqrt{\frac{p(1-p)}{n}} ]
\]
Pour la question (a), n=400:
\[
I = [ 0,97 – 1,96 \times \sqrt{\frac{0,97 \times (1 – 0,97)}{400}}, \; 0,97 + 1,96 \times \sqrt{\frac{0,97 \times (1 – 0,97)}{400}} ]
\]
Calculons les bornes de l’intervalle:
\[
\sqrt{\frac{0,97 \times 0,03}{400}} = \sqrt{\frac{0,0291}{400}} = \sqrt{0,00007275} \approx 0,00853
\]
\[
1,96 \times 0,00853 \approx 0,01672
\]
Ainsi,
\[
I = [ 0,97 – 0,01672, \; 0,97 + 0,01672 ] = [ 0,95328, \; 0,98672 ]
\]
Donc, la longueur de l’intervalle \( I \) est:
\[
0,98672 – 0,95328 = 0,03344
\]
Pour la question (b):
Pour que la longueur de l’intervalle \( I \) soit inférieure à 0,06:
\[
2 \times 1,96 \times \sqrt{\frac{0,97 \times 0,03}{n}} < 0,06
\]
\[
3,92 \times \sqrt{\frac{0,0291}{n}} < 0,06
\]
Divisons par 3,92 les deux côtés:
\[
\sqrt{\frac{0,0291}{n}} < \frac{0,06}{3,92} \approx 0,01531
\]
Élevons au carré les deux côtés:
\[
\frac{0,0291}{n} < 0,000234
\]
\[
n > \frac{0,0291}{0,000234} \approx 124.36
\]
Pour que la longueur de l’intervalle \( I \) soit inférieure à 0,03:
\[
2 \times 1,96 \times \sqrt{\frac{0,97 \times 0,03}{n}} < 0,03
\]
\[
3,92 \times \sqrt{\frac{0,0291}{n}} < 0,03
\]
Divisons par 3,92 les deux côtés:
\[
\sqrt{\frac{0,0291}{n}} < \frac{0,03}{3,92} \approx 0,00765
\]
Élevons au carré les deux côtés:
\[
\frac{0,0291}{n} < 0,00005852
\]
\[
n > \frac{0,0291}{0,00005852} \approx 497.75
\]
Conclusion:
a) La longueur de l’intervalle \( I \) pour \( n = 400 \) est \( 0,03344 \).
b) Pour que la longueur de l’intervalle \( I \) soit inférieure à \( 0,06 \), il faut \( n > 125 \), et pour qu’elle soit inférieure à \( 0,03 \), il faut \( n > 498 \).
Exercice 18 : responsable d’une plateforme de VTC et fluctuation
On cherche la taille de l’échantillon \( n \) afin que l’intervalle de fluctuation au seuil de 95% ait une longueur inférieure à 0,06.
La proportion de la population qui utilise le service de VTC est \( p = 0,35 \).
L’intervalle de fluctuation au seuil de 95% pour une proportion est donné par :
\[
[ p – 1,96 \sqrt{\dfrac{p(1-p)}{n}},\ p + 1,96 \sqrt{\dfrac{p(1-p)}{n}} ]
\]
La longueur de cet intervalle est donnée par :
\[
2 \cdot 1,96 \sqrt{\dfrac{p(1-p)}{n}}
\]
On veut que cette longueur soit inférieure à 0,06 :
\[
2 \cdot 1,96 \sqrt{\dfrac{0,35 \cdot 0,65}{n}} < 0,06
\]
D’où :
\[
1,96 \sqrt{\dfrac{0,35 \cdot 0,65}{n}} < 0,03
\]
En élevant les deux côtés de l’inégalité au carré, on obtient :
\[
1,96^2 \cdot \dfrac{0,35 \cdot 0,65}{n} < 0,03^2
\]
\[
(1,96^2 \cdot \dfrac{0,35 \cdot 0,65}{0,03^2}) < n
\]
Calculons les valeurs numériques :
\[
1,96^2 = 3,8416,
\]
\[
0,35 \cdot 0,65 = 0,2275,
\]
\[
0,03^2 = 0,0009.
\]
Donc :
\[
n > \dfrac{3,8416 \cdot 0,2275}{0,0009}
\]
En effectuant le calcul :
\[
n > \dfrac{0,874004}{0,0009}
\]
\[
n > 971,115
\]
Par conséquent, pour que l’intervalle de fluctuation ait une longueur inférieure à 0,06, la taille de l’échantillon doit être au moins de 972 (en arrondissant au nombre entier supérieur le plus proche).
Ainsi, \( n \geq\, 972 \).
Exercice 19 : algorithme et programmation
\[\]a) Appliquer cet algorithme à l’entrée \( L = 0,06 \)\[\]
1. Initialisation : \( n arrow 1 \)
2. Calcul : \( M arrow \frac{2}{\sqrt{n}} = \frac{2}{\sqrt{1}} = 2 \)
3. Condition : \( M > L \)
– \( 2 > 0,06 \) (vrai)
4. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 2 \)
– Calcul : \( M arrow \frac{2}{\sqrt{2}} = \frac{2}{\sqrt{2}} = \sqrt{2} \approx 1,41 \)
– Condition : \( M > L \)
– \( 1,41 > 0,06 \) (vrai)
5. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 3 \)
– Calcul : \( M arrow \frac{2}{\sqrt{3}} \approx 1,15 \)
– Condition : \( M > L \)
– \( 1,15 > 0,06 \) (vrai)
6. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 4 \)
– Calcul : \( M arrow \frac{2}{\sqrt{4}} = 1 \)
– Condition : \( M > L \)
– \( 1 > 0,06 \) (vrai)
7. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 5 \)
– Calcul : \( M arrow \frac{2}{\sqrt{5}} \approx 0,89 \)
– Condition : \( M > L \)
– \( 0,89 > 0,06 \) (vrai)
8. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 6 \)
– Calcul : \( M arrow \frac{2}{\sqrt{6}} \approx 0,82 \)
– Condition : \( M > L \)
– \( 0,82 > 0,06 \) (vrai)
9. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 7 \)
– Calcul : \( M arrow \frac{2}{\sqrt{7}} \approx 0,76 \)
– Condition : \( M > L \)
– \( 0,76 > 0,06 \) (vrai)
10. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 8 \)
– Calcul : \( M arrow \frac{2}{\sqrt{8}} = \frac{2}{2\sqrt{2}} \approx 0,71 \)
– Condition : \( M > L \)
– \( 0,71 > 0,06 \) (vrai)
11. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 9 \)
– Calcul : \( M arrow \frac{2}{\sqrt{9}} = \frac{2}{3} \approx 0,67 \)
– Condition : \( M > L \)
– \( 0,67 > 0,06 \) (vrai)
12. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 10 \)
– Calcul : \( M arrow \frac{2}{\sqrt{10}} \approx 0,63 \)
– Condition : \( M > L \)
– \( 0,63 > 0,06 \) (vrai)
13. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 11 \)
– Calcul : \( M arrow \frac{2}{\sqrt{11}} \approx 0,60 \)
– Condition : \( M > L \)
– \( 0,60 > 0,06 \) (vrai)
14. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 12 \)
– Calcul : \( M arrow \frac{2}{\sqrt{12}} \approx 0,58 \)
– Condition : \( M > L \)
– \( 0,58 > 0,06 \) (vrai)
15. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 13 \)
– Calcul : \( M arrow \frac{2}{\sqrt{13}} \approx 0,55 \)
– Condition : \( M > L \)
– \( 0,55 > 0,06 \) (vrai)
16. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 14 \)
– Calcul : \( M arrow \frac{2}{\sqrt{14}} \approx 0,53 \)
– Condition : \( M > L \)
– \( 0,53 > 0,06 \) (vrai)
17. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 15 \)
– Calcul : \( M arrow \frac{2}{\sqrt{15}} \approx 0,52 \)
– Condition : \( M > L \)
– \( 0,52 > 0,06 \) (vrai)
18. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 16 \)
– Calcul : \( M arrow \frac{2}{\sqrt{16}} = 0,5 \)
– Condition : \( M > L \)
– \( 0,5 > 0,06 \) (vrai)
19. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 17 \)
– Calcul : \( M arrow \frac{2}{\sqrt{17}} \approx 0,49 \)
– Condition : \( M > L \)
– \( 0,49 > 0,06 \) (vrai)
20. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 18 \)
– Calcul : \( M arrow \frac{2}{\sqrt{18}} \approx 0,47 \)
– Condition : \( M > L \)
– \( 0,47 > 0,06 \) (vrai)
21. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 19 \)
– Calcul : \( M arrow \frac{2}{\sqrt{19}} \approx 0,46 \)
– Condition : \( M > L \)
– \( 0,46 > 0,06 \) (vrai)
22. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 20 \)
– Calcul : \( M arrow \frac{2}{\sqrt{20}} \approx 0,45 \)
– Condition : \( M > L \)
– \( 0,45 > 0,06 \) (vrai)
23. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 21 \)
– Calcul : \( M arrow \frac{2}{\sqrt{21}} \approx 0,44 \)
– Condition : \( M > L \)
– \( 0,44 > 0,06 \) (vrai)
24. Boucle Tant que \( M > L \) :
– \( n arrow n + 1 \)
– \( n = 22 \)
– Calcul : \( M arrow \frac{2}{\sqrt{22}} \approx 0,43 \)
– Condition :
Exercice 20 : décision d’une aide d’un intervalle de fluctuation
Ce raisonnement repose sur une comparaison statistique qui peut s’apparenter à la prise de décision avec l’aide d’un intervalle de fluctuation.
1. \[\]Hypothèses:\[\]
– \[H_0\]: La poignée de haricots provient du sac de haricots blancs.
– \[H_1\]: La poignée de haricots ne provient pas du sac de haricots blancs.
2. \[\]Observation:\[\]
On observe que dans la poignée de haricots, il y a quelques haricots blancs.
3. \[\]Fréquence attendue:\[\]
Si la poignée provient du sac, on s’attend à ce qu’une proportion significative de haricots soit blanche, car « la plupart des haricots dans ce sac sont blancs ».
4. \[\]Calcul d’un intervalle de fluctuation:\[\]
On peut dire qu’on calcule la proportion de haricots blancs dans la poignée observée. Supposons que la proportion de haricots blancs dans le sac est \( p \) et que la taille de la poignée est \( n \).
– La proportion observée \( \hat{p} \) de haricots blancs dans la poignée peut être approximée par une distribution normale, s’il y a suffisamment d’éléments :
\[
\hat{p} \sim \mathcal{N}(p, \frac{p(1-p)}{n})
\]
– On peut calculer un intervalle de confiance pour \( \hat{p} \) :
\[
IC = [ \hat{p} – z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p} + z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} ]
\]
où \( z_{\alpha/2} \) est la valeur critique pour un niveau de confiance donné.
5. \[\]Interprétation:\[\]
– Si la proportion observée de haricots blancs dans la poignée \( \hat{p} \) sort de l’intervalle de fluctuation calculé pour \( p \) avec un niveau de confiance donné, on peut rejeter l’hypothèse \( H_0 \) et conclure que la poignée ne provient probablement pas du sac de haricots blancs.
– Si \( \hat{p} \) se situe dans l’intervalle de fluctuation, alors il n’y a pas suffisamment de preuve pour rejeter \( H_0 \), et on ne peut pas infirmer que la poignée provient du sac de haricots blancs.
Le raisonnement de Peirce peut ainsi être vu comme une application intuitive des concepts de statistique inférentielle utilisés dans la prise de décision basée sur des intervalles de fluctuation.
Exercice 21 : simuler le lancer d’une pièce avec Python
*Partie a.*
« `python
import random
def lancer():
if random.random() < 0.5:
return « pile »
else:
return « face »
« `
*Partie b.*
« `python
def frequence(n):
nbr_pile = 0
for _ in range(n):
if lancer() == « pile »:
nbr_pile += 1
return nbr_pile / n
« `
Exercice 22 : fréquence d’une expérience et Python
Correction de l’exercice :
a. Déterminer la probabilité du succès dans cette expérience.
La fonction `frequence(n)` simule une série d’expériences aléatoires où chaque expérience a une probabilité de succès de 0.34. Cela est déduit de la condition `if random() <= 0.34:`, où `random()` génère un nombre flottant aléatoire entre 0 et 1. Par conséquent, la probabilité \( p \) de succès dans cette expérience est :
\[ p = 0.34 \]
b. En exécutant cette fonction, on obtient les affichages ci-dessous. Interpréter ces résultats.
Lorsque nous exécutons la fonction `frequence` avec \( n = 1000 \), nous obtenons les résultats suivants :
\[ \text{frequence(1000)} = 0.348 \]
\[ \text{frequence(1000)} = 0.361 \]
Ces valeurs représentent la fréquence observée de réussites sur 1000 essais. La fréquence est proche de la probabilité théorique de 0.34, ce qui confirme la loi des grands nombres, qui stipule que plus le nombre d’essais est grand, plus la fréquence observée des succès se rapprochera de la probabilité théorique.
Concrètement :
Pour la première exécution :
\[ \frac{\text{nombre de succès observé}}{1000} = 0.348 \]
Pour la deuxième exécution :
\[ \frac{\text{nombre de succès observé}}{1000} = 0.361 \]
Ces variations autour de la valeur théorique de 0.34 sont dues à l’aléatoire des essais. Avec un nombre plus grand d’essais, ces valeurs devraient se stabiliser autour de 0.34.
Exercice 23 : lancer d’un dé cubique équilibré
1. La formule à saisir dans la cellule A1 pour simuler le lancer d’un dé est : `=ENT(ALEA()*6)+1`.
2.
a. Pour réaliser un échantillon de taille 100 dans la colonne A, saisir la formule précédente dans les 100 premières cellules de la colonne A (de A1 à A100).
b. Pour déterminer la fréquence d’apparition de la face 3 dans cet échantillon, utiliser la formule :
\[ \text{fréquence\_3} = \frac{\text{NOMBRE.SI(A1:A100, 3)}}{100} \]
3. Reprendre les questions précédentes pour les tailles d’échantillons données.
– Dans la colonne B, saisir le même genre de formule pour 200 lancers.
– Dans la colonne C, saisir le même genre de formule pour 400 lancers.
– Dans la colonne D, saisir le même genre de formule pour 600 lancers.
– Dans la colonne E, saisir le même genre de formule pour 800 lancers.
– Dans la colonne F, saisir le même genre de formule pour 1000 lancers.
Pour la fréquence, utiliser :
\[ \text{fréquence\_3} = \frac{\text{NOMBRE.SI(A1:An, 3)}}{n} \]
Complétons le tableau (supposons les résultats issus des simulations) :
\[
\begin{array}{|c|c|}
\hline
\text{Taille n} \text{Fréquence observée } f_n \\
\hline
100 0.20 \\
200 0.175 \\
400 0.1975 \\
600 0.18 \\
800 0.1875 \\
1000 0.193 \\
\hline
\end{array}
\]
4. \[\]Observations :\[\]
– On remarque que la fréquence observée tend à se stabiliser autour de la valeur théorique de \( \frac{1}{6} \approx 0.1667 \) à mesure que la taille de l’échantillon augmente.
– Oui, cela était prévisible. En effet, selon la loi des grands nombres, plus la taille de l’échantillon augmente, plus la fréquence observée se rapproche de la probabilité théorique.
Exercice 24 : rédiger une fonction en langage Python
« `python
import random
def frequence_face_six(n):
count_six = 0
for _ in range(n):
if random.randint(1, 6) == 6:
count_six += 1
return count_six / n
# Exécution de la fonction et remplissage du tableau
tailles = [100, 200, 400, 600, 800, 1000]
frequences = [frequence_face_six(taille) for taille in tailles]
for taille, frequence in zip(tailles, frequences):
print(f »Taille {taille} : Fréquence observée {frequence:.3f} »)
« `
### Résultat:
Pour compléter le tableau, on obtient des résultats similaires mais aléatoires comme suit :
« `
Taille 100 : Fréquence observée 0.210
Taille 200 : Fréquence observée 0.185
Taille 400 : Fréquence observée 0.157
Taille 600 : Fréquence observée 0.170
Taille 800 : Fréquence observée 0.185
Taille 1000 : Fréquence observée 0.167
« `
Les valeurs exactes peuvent varier car la fonction utilise un générateur de nombres aléatoires.
### c. Remarques:
On peut observer que la fréquence \( f_n \) de la face 6 s’approche de la valeur théorique de \( \frac{1}{6} \approx 0.167 \) lorsque \( n \) augmente. Cela s’explique par la loi des grands nombres, qui stipule que la moyenne des résultats d’un grand nombre de répétitions d’une expérience tend vers l’espérance mathématique. Par conséquent, il est raisonnable de prévoir que les fréquences observées se rapprochent de plus en plus de la probabilité théorique \( \frac{1}{6} \) au fur et à mesure que \( n \) augmente.
Exercice 25 : construction d’un skate-park
a. Calculons la proportion d’habitants favorables à la création d’un skate park pour un échantillon de taille 100. D’après l’étude nationale, 34 % des habitants sont favorables.
Pour un échantillon de taille \( n = 100 \) :
\[
f_{100} = 0,34 \text{ (soit 34 %)}
\]
b. Continuons de la même manière pour les autres tailles d’échantillons : 200, 400, 600, 800 et 1 000.
Pour \( n = 200 \) :
\[
f_{200} = 0,34
\]
Pour \( n = 400 \) :
\[
f_{400} = 0,34
\]
Pour \( n = 600 \) :
\[
f_{600} = 0,34
\]
Pour \( n = 800 \) :
\[
f_{800} = 0,34
\]
Pour \( n = 1\ 000 \) :
\[
f_{1\ 000} = 0,34
\]
Le tableau complété est donc :
\[
\begin{array}{|c|c|}
\hline
\text{Taille } n \text{Fréquence observée } f_n \\
\hline
100 0,34 \\
200 0,34 \\
400 0,34 \\
600 0,34 \\
800 0,34 \\
1\ 000 0,34 \\
\hline
\end{array}
\]
c. Quelle décision doit prendre le maire ?
Étant donné que la proportion d’habitants favorables à la création du skate park reste constante (34 %) quel que soit la taille de l’échantillon, cela suggère une opinion stable parmi la population. Le maire peut donc raisonnablement conclure qu’une proportion significative (34 %) des habitants est favorable à la création d’un skate park, ce qui constitue un soutien suffisant pour justifier la décision de le construire.
Exercice 26 : fabricant de pâte à tartiner
a. Nous observons que les fréquences observées \[f\] des échantillons sont les suivantes : 0,69, 0,87, 0,75, 0,85, 0,78 et 0,82. La proportion nationale estimée, \[p\], est de 0,80.
Pour analyser la proportion de personnes satisfaites, nous comparons chaque fréquence observée \[f\] avec la proportion nationale \[p=0,80\] :
– Échantillon 1 : \[0,69\] est inférieur à \[0,80\]
– Échantillon 2 : \[0,87\] est supérieur à \[0,80\]
– Échantillon 3 : \[0,75\] est inférieur à \[0,80\]
– Échantillon 4 : \[0,85\] est supérieur à \[0,80\]
– Échantillon 5 : \[0,78\] est inférieur à \[0,80\]
– Échantillon 6 : \[0,82\] est supérieur à \[0,80\]
Sur les 6 échantillons, 3 ont une fréquence observée supérieure ou égale à 0,80 et 3 ont une fréquence observée inférieure à 0,80. Cela montre qu’il y a une variabilité dans les fréquences observées, mais globalement, il y a un équilibre avec une moitié supérieure et une moitié inférieure à la proportion nationale estimée.
b. Pour déterminer la proportion des cas où l’écart entre la probabilité \[p\] et la fréquence observée \[f\] est inférieur ou égal à 0,1, nous calculons l’écart pour chaque échantillon:
\[
\begin{align*}
\text{Pour l’échantillon 1:} \quad |0,80 – 0,69| = 0,11 \\
\text{Pour l’échantillon 2:} \quad |0,80 – 0,87| = 0,07 \\
\text{Pour l’échantillon 3:} \quad |0,80 – 0,75| = 0,05 \\
\text{Pour l’échantillon 4:} \quad |0,80 – 0,85| = 0,05 \\
\text{Pour l’échantillon 5:} \quad |0,80 – 0,78| = 0,02 \\
\text{Pour l’échantillon 6:} \quad |0,80 – 0,82| = 0,02 \\
\end{align*}
\]
Les écarts absolus sont de 0,11, 0,07, 0,05, 0,05, 0,02 et 0,02.
Parmi ces écarts, les suivants sont inférieurs ou égaux à 0,1: 0,07, 0,05, 0,05, 0,02, 0,02, soit 5 cas sur 6.
La proportion des cas où l’écart entre \[p\] et \[f\] est inférieur ou égal à 0,1 est donc:
\[
\frac{5}{6} \approx 0,83
\]
Ainsi, dans environ 83% des échantillons, la fréquence observée des personnes satisfaites diffère de moins de 0,1 de la proportion nationale estimée de 0,80.
Exercice 27 : algorithme qui simule n lancers d’une pièce
a. Compléter cet algorithme qui simule \( n \) lancers d’une pièce équilibrée et affiche la fréquence observée de la face Pile :
« `pseudo
Saisir n
compteur_pile ← 0
Pour k allant de 1 à n
lancer ← nombre aléatoire entre 0 et 1
Si lancer = 1
compteur_pile ← compteur_pile + 1
Fin Si
Fin Pour
Affiche compteur_pile / n
« `
b. Modifier cet algorithme afin d’obtenir \( N \) échantillons de tailles \( n \).
« `pseudo
Saisir n
Saisir N
Pour i allant de 1 à N
compteur_pile ← 0
Pour k allant de 1 à n
lancer ← nombre aléatoire entre 0 et 1
Si lancer = 1
compteur_pile ← compteur_pile + 1
Fin Si
Fin Pour
Afficher compteur_pile / n
Fin Pour
« `
c. Modifier à nouveau cet algorithme afin de déterminer la proportion des cas où l’écart entre la probabilité \( p \) et la fréquence observée \( f \) est inférieur ou égal à \( \frac{1}{\sqrt{n}} \).
« `pseudo
Saisir n
Saisir N
compteur_proportion ← 0
p ← 0.5
Pour i allant de 1 à N
compteur_pile ← 0
Pour k allant de 1 à n
lancer ← nombre aléatoire entre 0 et 1
Si lancer = 1
compteur_pile ← compteur_pile + 1
Fin Si
Fin Pour
f ← compteur_pile / n
Si abs(f – p) ≤ 1 / sqrt(n)
compteur_proportion ← compteur_proportion + 1
Fin Si
Fin Pour
Afficher compteur_proportion / N
« `
d. Programmer cet algorithme sur une calculatrice et le tester pour \( N = 30 \) et \( n = 100 \). Interpréter le résultat obtenu.
Supposons que nous avons exécuté l’algorithme et obtenu le résultat suivant: 0.8.
Si le résultat de notre algorithme est \( 0.8 \), cela signifie que dans 80% des échantillons de \( n = 100 \) lancers, la fréquence observée de la face Pile est très proche de la probabilité théorique \( p = 0.5 \) avec une variation inférieure ou égale à \( \frac{1}{\sqrt{n}} = \frac{1}{10} = 0.1 \). Cela confirme la loi des grands nombres, indiquant que la fréquence observée tend à se rapprocher de la probabilité théorique \( p \) quand \( n \) augmente.
Exercice 28 : quel est l’objectif de ce programme ?
a. Le programme fourni permet de simuler le lancer de deux dés à six faces et d’afficher la somme des résultats de ces lancers. La fonction `lancer_dé()` génère un nombre aléatoire entre 1 et 6 inclus, qui représente le résultat d’un lancer de dé. Ensuite, deux lancers de dés sont effectués, les résultats sont additionnés, et la somme est affichée.
b. Pour modifier l’algorithme afin qu’il affiche la fréquence d’apparition du nombre 7 lorsqu’on répète cette expérience aléatoire 50 fois de suite, il faut introduire une boucle pour effectuer les 50 expériences et compter les occurrences de la somme égale à 7. Voici la modification du programme :
« `python
from random import randint
def lancer_dé():
numéro = randint(1, 6)
return numéro
compteur = 0 # Compteur pour le nombre de fois que la somme est 7
N = 50 # Nombre de répétitions de l’expérience
for _ in range(N):
dé1 = lancer_dé()
dé2 = lancer_dé()
somme = dé1 + dé2
if somme == 7:
compteur += 1
frequence = compteur / N
print(f »Fréquence d’apparition du nombre 7: {frequence} »)
« `
En résumé, ce programme a été modifié pour :
1. Répéter l’expérience 50 fois.
2. Compter le nombre d’occurrences de la somme 7.
3. Calculer la fréquence d’apparition de la somme 7.
4. Afficher cette fréquence.
Exercice 29 : que calcule cette fonction réalisée avec Python ?
Soit le programme suivant :
\begin{verbatim}
a = 1
b = 1
b = a + b
a = a – b
print(a)
\end{verbatim}
Analysons ce que ce programme affiche étape par étape :
1. Initialement, nous avons:
\[ a = 1 \]
\[ b = 1 \]
2. Ensuite, on exécute l’instruction :
\[ b = a + b \]
Ceci modifie la valeur de \( b \) :
\[ b = 1 + 1 = 2 \]
3. Puis, on exécute l’instruction :
\[ a = a – b \]
Ceci modifie la valeur de \( a \) :
\[ a = 1 – 2 = -1 \]
4. Enfin, on exécute l’instruction :
\[ \text{print}(a) \]
Par conséquent, le programme affichera la valeur :
\[ -1 \]
Exercice 30 : la cantine d’un établissement
Pour rédiger un algorithme qui simule \( N \) échantillons de taille \( n \) et qui détermine la proportion de personnes satisfaites dans chaque échantillon de taille \( n \), voici une approche en pseudo-code, suivie de son implémentation en Python.
### Pseudo-code
1. Initialiser un tableau `proportions` vide.
2. Pour \( i \) allant de 1 à \( N \):
a. Initialiser une variable `count` à zéro.
b. Pour \( j \) allant de 1 à \( n \):
i. Générer un nombre aléatoire \( x \) entre 0 et 1.
ii. Si \( x \leq\, 0.68 \), incrémenter `count` de 1.
c. Calculer la proportion satisfaisante pour cet échantillon: \( \frac{\text{count}}{n} \).
d. Ajouter cette proportion au tableau `proportions`.
3. Retourner le tableau `proportions`.
#### Implémentation en Python
« `python
import random
def simuler_echantillons(N, n):
proportions = []
for _ in range(N):
count = 0
for _ in range(n):
if random.random() <= 0.68:
count += 1
proportion = count / n
proportions.append(proportion)
return proportions
# Exemple d’utilisation
N = 1000 # Nombre d’échantillons
n = 100 # Taille de chaque échantillon
resultats = simuler_echantillons(N, n)
print(resultats)
« `
### Démonstration de la solution avec LaTeX
« `latex
Soit \( p = 0.68 \) la proportion de personnes satisfaites.
Pour simuler \( N \) échantillons de taille \( n \) et déterminer la proportion de personnes satisfaites dans chaque échantillon, nous proposons l’algorithme suivant :
Initialiser un tableau {proportions} vide.
{Pour} \( i \) allant de 1 à \( N \):
Initialiser une variable {count} à zéro.
{Pour} \( j \) allant de 1 à \( n \):
Générer un nombre aléatoire \( x \) entre 0 et 1.
{Si} \( x \leq\, p \), incrémenter {count} de 1.
Calculer la proportion satisfaisante pour cet échantillon: \(\frac{{count}}{n}\).
Ajouter cette proportion au tableau {proportions}.
Retourner le tableau {proportions}.
« `
Cet algorithme et sa mise en œuvre permettent de simuler les proportions de satisfaction pour plusieurs échantillons indépendants.
Exercice 31 : faut-il développer les voyages intergalactiques ?
Déterminons l’intervalle de confiance au seuil de 95 % pour la proportion des aliens favorables au projet de développement des voyages intergalactiques.
a. Intervalle de confiance au seuil de 95 % :
Soit \(n\) le nombre total d’aliens sondés et \(x\) le nombre d’aliens favorables au projet. La proportion observée est donnée par :
\[ \hat{p} = \frac{x}{n} = \frac{436}{1031} \approx 0.423 \]
Le niveau de confiance de 95 % correspond à un coefficient de significativité \(\alpha = 0.05\), ce qui donne un coefficient critique \(Z_{\alpha/2} \approx 1.96\) pour une loi normale.
L’intervalle de confiance pour la proportion \(p\) est donné par :
\[ \hat{p} \pm Z_{\alpha/2} \times \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} \]
Calculons l’intervalle :
\[ \text{Erreur type} = \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} = \sqrt{\frac{0.423 \times (1 – 0.423)}{1031}} \approx 0.0154 \]
\[ \text{Marge d’erreur} = Z_{\alpha/2} \times \text{Erreur type} = 1.96 \times 0.0154 \approx 0.0302 \]
Ainsi, l’intervalle de confiance est :
\[ 0.423 \pm 0.0302 \]
Ce qui donne :
\[ 0.3928 \leq\, p \leq\, 0.4532 \]
En pourcentage, cela correspond à un intervalle de confiance de 39.28 % à 45.32 %.
b. Décision sur le développement des voyages intergalactiques :
Pour décider si Paul doit développer les voyages intergalactiques, il pourrait se baser sur des critères internes ou des seuils spécifiques. Cependant, à partir de l’intervalle de confiance, on peut dire que la proportion des aliens favorables est comprise entre 39.28 % et 45.32 % avec un niveau de confiance de 95 %.
Cela suggère qu’une majorité relative des aliens n’est peut-être pas favorable (puisque moins de 50 % sont favorables), ce qui pourrait amener Paul à reconsidérer ou approfondir davantage le sondage avant de prendre une décision.
Exercice 32 : des élections et intervalle de confiance
{Correction de l’exercice :}
{a. Déterminer un intervalle de confiance au seuil de 95 \%}
Pour déterminer un intervalle de confiance au seuil de 95 \%, on utilise la formule suivante pour l’estimation d’une proportion :
\[ \hat{p} \pm z \times \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} \]
Où :
– \(\hat{p}\) est la proportion observée dans l’échantillon, ici \( \hat{p} = 0.54 \) (54 \%).
– \(z\) est la valeur critique pour un intervalle de confiance de 95 \%, ici \(z \approx 1.96\).
– \(n\) est la taille de l’échantillon, ici \(n = 350\).
Calculons alors l’intervalle de confiance :
\[ 0.54 \pm 1.96 \times \sqrt{\frac{0.54 \times (1 – 0.54)}{350}} \]
Calcul de l’écart type :
\[ \sqrt{\frac{0.54 \times 0.46}{350}} \approx \sqrt{\frac{0.2484}{350}} \approx \sqrt{0.00071} \approx 0.02665 \]
L’intervalle de confiance est alors :
\[ 0.54 \pm 1.96 \times 0.02665 \]
Calcul de la marge d’erreur :
\[ 1.96 \times 0.02665 \approx 0.05223 \]
L’intervalle de confiance au seuil de 95 \% est donc :
\[ 0.54 \pm 0.05223 \]
\[ [0.4878, 0.5922] \]
Interprétation : on peut être confiant à 95 \% que la proportion réelle d’électeurs en faveur du candidat Electron se situe entre 48.78 \% et 59.22 \%.
{b. Si les élections avaient eu lieu le jour de ce sondage et si les réponses des personnes interrogées étaient sincères, le candidat Electron aurait-il été élu au premier tour ?}
Pour être élu au premier tour, le candidat Electron doit obtenir plus de 50 \% des suffrages.
L’intervalle de confiance calculé est \([0.4878, 0.5922]\). Étant donné que cet intervalle inclut des valeurs au-dessus de 50 \%, cela signifie qu’il est possible que le candidat Electron ait obtenu plus de 50 \% des votes. Rien ne permet de conclure avec certitude qu’il aurait été élu, mais c’est possible.
{c. Déterminer le nombre de personnes qu’il aurait fallu interroger afin d’être certain que le candidat Electron soit élu.}
Pour être certain au seuil de 95 \% que le candidat Electron est élu, l’intervalle de confiance inférieur doit être au moins à 50 \%. Nous avons alors :
\[ \hat{p} – z \times \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} \geq\, 0.50 \]
Sachant que \(\hat{p} = 0.54\) et \(z = 1.96\), nous avons :
\[ 0.54 – 1.96 \times \sqrt{\frac{0.54 \times 0.46}{n}} \geq\, 0.50 \]
Simplifions :
\[ 0.54 – 0.50 \geq\, 1.96 \times \sqrt{\frac{0.54 \times 0.46}{n}} \]
\[ 0.04 \geq\, 1.96 \times \sqrt{\frac{0.2484}{n}} \]
Isolons \(n\) :
\[ \frac{0.04}{1.96} \geq\, \sqrt{\frac{0.2484}{n}} \]
\[ 0.02041 \geq\, \sqrt{\frac{0.2484}{n}} \]
\[ 0.02041^2 \geq\, \frac{0.2484}{n} \]
\[ 0.0004168 \geq\, \frac{0.2484}{n} \]
\[ n \geq\, \frac{0.2484}{0.0004168} \]
\[ n \geq\, 596.02 \]
Il faudrait donc interroger au moins 597 personnes pour être certain au seuil de 95 \% que le candidat Electron soit élu avec plus de 50 \% des suffrages.
Exercice 33 : fabrication de flacons de parfums
a. L’intervalle de fluctuation au seuil de 95% pour une proportion \( p \) dans un échantillon de taille \( n \) est donné par la formule :
\[ \hat{p} \pm 1.96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}} \]
où :
– \(\hat{p}\) est la proportion attendue,
– \( n \) est la taille de l’échantillon.
Ici, \(\hat{p} = 0.20\) et \( n = 150 \).
Calculons les bornes de l’intervalle de fluctuation :
\[ E = 1.96 \sqrt{\frac{0.20 \times (1 – 0.20)}{150}} \]
\[ E = 1.96 \sqrt{\frac{0.20 \times 0.80}{150}} \]
\[ E = 1.96 \sqrt{\frac{0.16}{150}} \]
\[ E = 1.96 \sqrt{0.00106667} \]
\[ E \approx 1.96 \times 0.03268 \]
\[ E \approx 0.064 \]
L’intervalle de fluctuation est donc :
\[ 0.20 \pm 0.064 \]
Soit :
\[ 0.136 \leq\, p \leq\, 0.264 \]
b. Pour déterminer si la chaîne de production doit être révisée, comparons la proportion observée dans l’échantillon avec l’intervalle de fluctuation calculé.
La proportion observée de flacons avec des imperfections dans l’échantillon est :
\[ \hat{p}_{observ\u{e}} = \frac{63}{150} \approx 0.42 \]
Comparons cette proportion à l’intervalle de fluctuation :
\[ 0.136 \leq\, 0.42 \leq\, 0.264 \]
La proportion observée (\(0.42\)) ne se trouve pas dans l’intervalle de fluctuation au seuil de 95%. Cela indique que la proportion observée d’imperfections est significativement plus élevée que ce qui est acceptable selon l’intervalle de fluctuation.
Donc, oui, au vu de cet échantillon, il faut envisager de réviser la chaîne de production.
Réviser les cours et exercices de maths avec nos Q.C.M :
D'autres outils pour progresser en autonomie :
Maths PDF c'est 12 741 137 cours et exercices de maths téléchargés en PDF et 4 250 exercices.