Exercice 1 : bonbons et proportion d’échantillon
Pour analyser ces résultats, nous utilisons le test du Chi-carré d’ajustement pour vérifier si les proportions observées sont conformes aux proportions attendues.
Les proportions attendues sont les suivantes :
– Pour les bonbons jaunes : 20%
– Pour les bonbons rouges : 10%
Rappelons la formule du Chi-carré :
\[
\chi^2 = \sum \frac{(O_i – E_i)^2}{E_i}
\]
où \(O_i\) est l’observation et \(E_i\) est l’espérance.
Calculons tout d’abord le nombre total de bonbons :
\[
N = 152 + 125 = 277
\]
Les espérances (nombres attendus de bonbons) pour chaque couleur sont :
– Bonbons jaunes : \( E_{\text{jaunes}} = 0.20 \times 277 = 55.4 \)
– Bonbons rouges : \( E_{\text{rouges}} = 0.10 \times 277 = 27.7 \)
Maintenant, calculons le \(\chi^2\) pour chaque catégorie :
Pour les bonbons jaunes :
\[
\chi^2_{\text{jaunes}} = \frac{(152 – 55.4)^2}{55.4} = \frac{(96.6)^2}{55.4} = 168.62
\]
Pour les bonbons rouges :
\[
\chi^2_{\text{rouges}} = \frac{(125 – 27.7)^2}{27.7} = \frac{(97.3)^2}{27.7} = 340.18
\]
La valeur totale du \(\chi^2\) est :
\[
\chi^2_{\text{total}} = 168.62 + 340.18 = 508.80
\]
Avec un degré de liberté \( df \) correspondant au nombre de catégories moins un, soit \( df = 2 – 1 = 1 \).
En regardant une table de distribution du Chi-carré (ou en utilisant un logiciel de calcul), on constate que pour un degré de liberté de 1, une valeur de \(\chi^2\) de 508.80 dépasse largement le seuil critique pour toutes significativités usuelles (par exemple 3.84 pour un seuil de 0.05).
Conclusion : Les proportions observées de bonbons jaunes et rouges sont très significativement différentes des proportions annoncées de 20% et 10%. Nous rejetons donc l’hypothèse nulle selon laquelle les proportions observées sont conformes aux proportions annoncées.
Exercice 2 : lois de la transmission des caractères héréditaires de Mendel
Pour déterminer si les résultats obtenus sont cohérents avec la théorie de Mendel, on va utiliser un test statistique, par exemple le test du chi-carré.
Selon la théorie de Mendel, on s’attend à une proportion de 3 pois jaunes pour 1 pois vert. Cela signifie que pour un échantillon de taille \( n \), on s’attend à:
– \( \frac{3}{4} \) de pois jaunes
– \( \frac{1}{4} \) de pois verts
L’échantillon total est de \( 176 + 48 = 224 \) pois.
Les fréquences théoriques pour cet échantillon seraint donc:
– \( 224 \times \frac{3}{4} = 168 \) pois jaunes
– \( 224 \times \frac{1}{4} = 56 \) pois verts
Le test du chi-carré se calcule comme suit:
\[
\chi^2 = \sum \frac{(O_i – E_i)^2}{E_i}
\]
où \( O_i \) est l’observation et \( E_i \) est l’espérance.
Pour les pois jaunes:
\[
(O_{jaunes} – E_{jaunes})^2 = (176 – 168)^2 = 64
\]
\[
\frac{64}{168} \approx 0.381
\]
Pour les pois verts:
\[
(O_{verts} – E_{verts})^2 = (48 – 56)^2 = 64
\]
\[
\frac{64}{56} \approx 1.143
\]
En sommant les deux contributions:
\[
\chi^2 = 0.381 + 1.143 \approx 1.524
\]
Pour déterminer si ce \[\chi^2\] est significatif, on compare cette valeur à une valeur critique de la table du chi-carré pour un degré de liberté (dof = 1) et un niveau de signification \( \alpha = 0.05 \). La valeur critique est environ 3.841.
Puisque \( \chi^2 < 3.841 \), nous ne rejetons pas l’hypothèse nulle.
Les résultats de l’expérience sont donc cohérents avec la théorie de Mendel.
Exercice 3 : déterminer l’intervalle de fluctuation
1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% si \( n = 100 \) et \( p = 0.5 \).
L’intervalle de fluctuation asymptotique au seuil de 95% est donné par :
\[
[ p – u_{1-\alpha/2} \sqrt{\frac{p(1-p)}{n}}, p + u_{1-\alpha/2} \sqrt{\frac{p(1-p)}{n}} ]
\]
Pour un seuil de 95%, \( \alpha = 0.05 \) et \( u_{1-\alpha/2} = u_{0.975} \approx 1.96 \).
Appliquons les valeurs :
\[
p = 0.5, \quad n = 100
\]
L’intervalle est alors :
\[
[ 0.5 – 1.96 \sqrt{\frac{0.5(1-0.5)}{100}}, 0.5 + 1.96 \sqrt{\frac{0.5(1-0.5)}{100}} ]
\]
Calculons les bornes :
\[
\sqrt{\frac{0.5 \cdot 0.5}{100}} = \sqrt{\frac{0.25}{100}} = \sqrt{0.0025} = 0.05
\]
Ainsi, l’intervalle devient :
\[
[ 0.5 – 1.96 \times 0.05, 0.5 + 1.96 \times 0.05 ]
\]
\[
[ 0.5 – 0.098, 0.5 + 0.098 ]
\]
\[
[ 0.402, 0.598 ]
\]
2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 99% si \( n = 10\,000 \) et \( p = 0.2 \).
Pour un seuil de 99%, \( \alpha = 0.01 \) et \( u_{1-\alpha/2} = u_{0.995} \approx 2.58 \).
Appliquons les valeurs :
\[
p = 0.2, \quad n = 10,\!000
\]
L’intervalle est alors :
\[
[ 0.2 – 2.58 \sqrt{\frac{0.2(1-0.2)}{10,\!000}}, 0.2 + 2.58 \sqrt{\frac{0.2(1-0.2)}{10,\!000}} ]
\]
Calculons les bornes :
\[
\sqrt{\frac{0.2 \cdot 0.8}{10,\!000}} = \sqrt{\frac{0.16}{10,\!000}} = \sqrt{0.000016} = 0.004
\]
Ainsi, l’intervalle devient :
\[
[ 0.2 – 2.58 \times 0.004, 0.2 + 2.58 \times 0.004 ]
\]
\[
[ 0.2 – 0.01032, 0.2 + 0.01032 ]
\]
\[
[ 0.18968, 0.21032 ]
\]
Exercice 4 : nombre de spams reçus dans ses emails
\[\]Correction de l’exercice :\[\]
1) \[\]Loi suivie par \( X \) :\[\]
\( X \) suit une loi binomiale de paramètres \( n = 100 \) et \( p = 0.1 \).
\[ X \sim \mathcal{B}(100, 0.1) \]
2) \[\]Calculer de tête :\[\]
L’expression à calculer est :
\[ \sqrt{\frac{0{,}1 \times 0{,}9}{100}} \]
Calculons d’abord le produit à l’intérieur de la racine :
\[ 0{,}1 \times 0{,}9 = 0{,}09 \]
Ensuite, la fraction :
\[ \frac{0{,}09}{100} = 0{,}0009 \]
Puis la racine carrée :
\[ \sqrt{0{,}0009} = 0{,}03 \]
3) \[\]Intervalle de fluctuation asymptotique au seuil de 95% :\[\]
Pour une loi binomiale \(\mathcal{B}(n, p)\) avec \(n\) grand, on peut approcher la proportion par une loi normale \(\mathcal{N}(p, \frac{p(1-p)}{n})\).
\[ p = 0{,}1 \]
\[ n = 100 \]
L’écart-type \(\sigma\) est :
\[ \sigma = \sqrt{\frac{p(1-p)}{n}} = 0{,}03 \]
Pour un intervalle de confiance de 95%, on a :
\[ p \pm 1.96 \times \sigma \]
Les bornes de l’intervalle sont donc :
\[ 0{,}1 – 1.96 \times 0{,}03 \]
\[ 0{,}1 + 1.96 \times 0{,}03 \]
Calculons les valeurs numériques :
\[ 0{,}1 – 1.96 \times 0{,}03 = 0{,}1 – 0{,}0588 \approx 0{,}0412 \]
\[ 0{,}1 + 1.96 \times 0{,}03 = 0{,}1 + 0{,}0588 \approx 0{,}1588 \]
Donc, l’intervalle de fluctuation asymptotique est :
\[ [0{,}041; 0{,}159] \]
4) \[\]Analyse de l’hypothèse de départ :\[\]
Mélanie a compté 6 spams parmi 100 mails, donc \( \hat{p} = \frac{6}{100} = 0{,}06 \).
Cette proportion de 6% (0,06) se situe bien dans l’intervalle de fluctuation asymptotique au seuil de 95% que nous avons trouvé \([0{,}041; 0{,}159]\).
Nous ne rejetons donc pas l’hypothèse selon laquelle la proportion de spams est de 10%. L’échantillon observé est cohérent avec l’hypothèse de départ.
Exercice 5 : une bûcheronne et le nombre de chênes
Afin de déterminer un intervalle de confiance \(IC\) au seuil de 95\% pour la proportion de chênes \(p\) dans ce bois, nous allons utiliser la formule de l’intervalle de confiance pour une proportion.
Soit :
– \( n = 10000 \) le nombre total d’arbres rencontrés,
– \( X = 3320 \) le nombre de chênes comptés.
La proportion estimée des chênes est donnée par :
\[
\hat{p} = \frac{X}{n} = \frac{3320}{10000} = 0.332
\]
À un niveau de confiance de 95\%, le coefficient critique correspondant pour une loi normale (valeurs approximatives) est :
\[
z = 1.96
\]
L’intervalle de confiance pour la proportion est alors calculé par la formule suivante :
\[
IC = [ \hat{p} – z \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p} + z \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} ]
\]
Calculons maintenant les marges d’erreur :
\[
\text{Marge d’erreur} = z \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
\]
\[
= 1.96 \sqrt{\frac{0.332 \times (1 – 0.332)}{10000}}
\]
\[
= 1.96 \sqrt{\frac{0.332 \times 0.668}{10000}}
\]
\[
= 1.96 \sqrt{0.000221776}
\]
\[
= 1.96 \times 0.01489
\]
\[
\approx 0.0292
\]
En conséquence, l’intervalle de confiance à 95\% pour la proportion de chênes est :
\[
IC = [ 0.332 – 0.0292, 0.332 + 0.0292 ]
\]
\[
IC = [ 0.3028, 0.3612 ]
\]
Ainsi, l’intervalle de confiance au seuil de 95\% pour la proportion de chênes dans ce bois est \([0.3028, 0.3612]\).
Exercice 6 : sondage et projet immobilier
La formule utilisée pour déterminer la taille de l’échantillon nécessaire pour une estimation de proportion avec une certaine précision et un certain niveau de confiance est :
\[ n = ( \frac{z_{\alpha/2}^2 \cdot p \cdot (1 – p)}{e^2} ) \]
Où :
– \( n \) est la taille de l’échantillon.
– \( z_{\alpha/2} \) est la valeur critique pour le niveau de confiance souhaité (pour un niveau de confiance de 95%, \( z_{\alpha/2} = 1,96 \)).
– \( p \) est l’estimation de la proportion. Dans le pire des cas (lorsque la proportion n’est pas connue), on utilise \( p = 0,5 \).
– \( e \) est la marge d’erreur tolérée.
1) Pour une estimation à 1% (soit \( e = 0,01 \)) près de la proportion de personnes favorables :
\[ n = ( \frac{1,96^2 \cdot 0,5 \cdot (1 – 0,5)}{0,01^2} ) \]
\[ n = ( \frac{3,8416 \cdot 0,5 \cdot 0,5}{0,0001} ) \]
\[ n = ( \frac{0,9604}{0,0001} ) \]
\[ n = 9604 \]
2) Pour une estimation à 0,1% (soit \( e = 0,001 \)) près de la proportion de personnes favorables :
\[ n = ( \frac{1,96^2 \cdot 0,5 \cdot (1 – 0,5)}{0,001^2} ) \]
\[ n = ( \frac{3,8416 \cdot 0,5 \cdot 0,5}{0,000001} ) \]
\[ n = ( \frac{0,9604}{0,000001} ) \]
\[ n = 960400 \]
Ainsi, le maire doit sonder 9604 personnes pour avoir une estimation à 1% près de la proportion de personnes favorables et 960400 personnes pour avoir une estimation à 0,1% près de la proportion de personnes favorables.
Exercice 7 : intervalle de fluctuation et pièce équilibrée
1) On sait que la proportion de « face » est une variable aléatoire suivant une loi binomiale de paramètre \( p = 0,5 \) et \( n \). On peut approximer la loi binomiale par une loi normale \( \mathcal{N}(0.5, \frac{0.25}{n}) \). À un seuil de confiance de 95%, l’intervalle de fluctuation asymptotique est donné par :
\[ [0.5 – 1.96 \times \sqrt{\frac{0.25}{n}}, 0.5 + 1.96 \times \sqrt{\frac{0.25}{n}}] \]
Pour \( n = 100 \):
\[ [0.5 – 1.96 \times \sqrt{\frac{0.25}{100}}, 0.5 + 1.96 \times \sqrt{\frac{0.25}{100}}] = [0.5 – 1.96 \times 0.05, 0.5 + 1.96 \times 0.05] \]
\[ = [0.5 – 0.098, 0.5 + 0.098] = [0.402, 0.598] \]
2) Pour \( n = 10\,000 \):
\[ [0.5 – 1.96 \times \sqrt{\frac{0.25}{10\,000}}, 0.5 + 1.96 \times \sqrt{\frac{0.25}{10\,000}}] = [0.5 – 1.96 \times 0.005, 0.5 + 1.96 \times 0.005] \]
\[ = [0.5 – 0.0098, 0.5 + 0.0098] = [0.4902, 0.5098] \]
3) Pour que l’intervalle de fluctuation asymptotique ait une amplitude de \( 1.96 \times 10^{-3} \), nous avons l’équation suivante :
\[ 1.96 \times \sqrt{\frac{0.25}{n}} = 0.00196 \]
\[ \sqrt{\frac{0.25}{n}} = \frac{0.00196}{1.96} \]
\[ \sqrt{\frac{0.25}{n}} = 0.001 \]
\[ \frac{0.25}{n} = 0.001^2 \]
\[ \frac{0.25}{n} = 10^{-6} \]
\[ n = \frac{0.25}{10^{-6}} \]
\[ n = 250\,000 \]
Exercice 8 : déterminer l’intervalle de fluctuation asymptotique
Pour déterminer l’intervalle de fluctuation asymptotique au seuil de confiance donné, nous utilisons la formule de l’intervalle de fluctuation asymptotique pour une proportion \( p \) estimée à partir d’un échantillon de taille \( n \):
\[ p \pm z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}} \]
où \( z_{\alpha/2} \) est la valeur critique de la loi normale standard pour le niveau de confiance souhaité. Pour un seuil de 95%, \( z_{\alpha/2} \approx 1{,}96 \), et pour un seuil de 99%, \( z_{\alpha/2} \approx 2{,}576 \).
1. Pour \( n = 100 \) et \( p = 0{,}4 \) au seuil de 95%:
\[ p \pm z_{0{,}025} \sqrt{\frac{p(1-p)}{n}} = 0{,}4 \pm 1{,}96 \sqrt{\frac{0{,}4 \cdot 0{,}6}{100}} \]
\[ = 0{,}4 \pm 1{,}96 \sqrt{0{,}0024} \]
\[ = 0{,}4 \pm 1{,}96 \cdot 0{,}049 \]
\[ = 0{,}4 \pm 0{,}096 \]
\[ = [0{,}304, 0{,}496] \]
2. Pour \( n = 4000 \) et \( p = \frac{1}{3} \) au seuil de 95%:
\[ p \pm z_{0{,}025} \sqrt{\frac{p(1-p)}{n}} = \frac{1}{3} \pm 1{,}96 \sqrt{\frac{(\frac{1}{3})(\frac{2}{3})}{4000}} \]
\[ = \frac{1}{3} \pm 1{,}96 \sqrt{\frac{2}{9 \cdot 4000}} \]
\[ = \frac{1}{3} \pm 1{,}96 \sqrt{\frac{2}{36000}} \]
\[ = \frac{1}{3} \pm 1{,}96 \sqrt{0{,}0000556} \]
\[ = \frac{1}{3} \pm 1{,}96 \cdot 0{,}00746 \]
\[ = \frac{1}{3} \pm 0{,}0146 \]
\[ = [0{,}319, 0{,}348] \]
3. Pour \( n = 77 \) et \( p = 0{,}89 \) au seuil de 99%:
\[ p \pm z_{0{,}005} \sqrt{\frac{p(1-p)}{n}} = 0{,}89 \pm 2{,}576 \sqrt{\frac{0{,}89 \cdot 0{,}11}{77}} \]
\[ = 0{,}89 \pm 2{,}576 \sqrt{\frac{0{,}0979}{77}} \]
\[ = 0{,}89 \pm 2{,}576 \sqrt{0{,}00127} \]
\[ = 0{,}89 \pm 2{,}576 \cdot 0{,}0356 \]
\[ = 0{,}89 \pm 0{,}0917 \]
\[ = [0{,}798, 0{,}982] \]
Exercice 9 : la population française et le port de lunettes
1) La variable \( X \) suit une loi binomiale de paramètres \( n \) et \( p \), soit \( X \sim \mathcal{B}(400, 0.7) \).
2) Nous devons vérifier les conditions d’application de la loi normale :
– \( n > 30 \) : ici, \( n = 400 \), donc \( n > 30 \) est vérifié.
– \( np > 5 \) : ici, \( np = 400 \times 0.7 = 280 \), donc \( np > 5 \) est vérifié.
– \( n(1-p) > 5 \) : ici, \( n(1-p) = 400 \times 0.3 = 120 \), donc \( n(1-p) > 5 \) est vérifié.
Les conditions étant vérifiées, on peut approximer \( X \) par une loi normale \( \mathcal{N}(np, np(1-p)) \).
3) Calcul de l’intervalle de fluctuation asymptotique au seuil de 95% :
– La moyenne \( \mu = np = 280 \)
– La variance \( \sigma^2 = np(1-p) = 280 \times 0.3 = 84 \)
– L’écart-type \( \sigma = \sqrt{84} \approx 9.17 \)
L’intervalle de fluctuation est donné par :
\[
[\mu – 1.96 \sigma, \mu + 1.96 \sigma]
\]
Ici,
\[
\mu – 1.96 \sigma = 280 – 1.96 \times 9.17 \approx 261.05
\]
\[
\mu + 1.96 \sigma = 280 + 1.96 \times 9.17 \approx 298.95
\]
L’intervalle de fluctuation au seuil de 95% est donc [261.05, 298.95].
4) Interprétation concrète :
On peut dire qu’avec un seuil de confiance de 95%, on s’attend à ce que le nombre de personnes portant des lunettes ou des lentilles de contact dans un échantillon de 400 personnes tiré au hasard se situe entre 261 et 299. Cela signifie que si, dans une répétition de plusieurs échantillons de cette taille, environ 95% de ces échantillons contiendront un nombre de personnes portant des lunettes ou des lentilles compris dans cet intervalle.
Exercice 10 : lancers d’une pièce équilibrée
Soit \( p \) la proportion de « pile » qui est de \( \frac{1}{2} \) (car la pièce est équilibrée). La taille de l’échantillon est \( n = 50 \).
L’intervalle de fluctuation asymptotique pour la fréquence de « pile » au seuil de 95% est donné par :
\[
[ p – 1.96 \sqrt{\frac{p(1-p)}{n}}, \; p + 1.96 \sqrt{\frac{p(1-p)}{n}} ]
\]
\[
[ \frac{1}{2} – 1.96 \sqrt{\frac{\frac{1}{2} \cdot \frac{1}{2}}{50}}, \; \frac{1}{2} + 1.96 \sqrt{\frac{\frac{1}{2} \cdot \frac{1}{2}}{50}} ]
\]
\[
[ \frac{1}{2} – 1.96 \sqrt{\frac{0.25}{50}}, \; \frac{1}{2} + 1.96 \sqrt{\frac{0.25}{50}} ]
\]
\[
[ \frac{1}{2} – 1.96 \cdot \sqrt{0.005}, \; \frac{1}{2} + 1.96 \cdot \sqrt{0.005} ]
\]
\[
[ \frac{1}{2} – 1.96 \cdot 0.0707, \; \frac{1}{2} + 1.96 \cdot 0.0707 ]
\]
\[
[ 0.5 – 0.1386, \; 0.5 + 0.1386 ]
\]
\[
[ 0.3614, \; 0.6386 ]
\]
Donc, l’intervalle de fluctuation asymptotique de la fréquence de « pile » au seuil de 95% est \( [0.3614, 0.6386] \).
Pour trouver l’intervalle de fluctuation asymptotique de \( X \) au seuil de 95%, on multiplie les bornes de l’intervalle précédent par \( n \):
\[
[ 50 \times 0.3614, \; 50 \times 0.6386 ]
\]
\[
[ 18.07, \; 31.93 ]
\]
En arrondissant à l’entier proche, nous obtenons l’intervalle \( [18, 32] \).
L’intervalle de fluctuation asymptotique pour \( X \) au seuil de 99% est donné par :
\[
p \pm 2.58 \sqrt{\frac{p(1-p)}{n}}
\]
\[
[ \frac{1}{2} – 2.58 \sqrt{\frac{0.25}{50}}, \; \frac{1}{2} + 2.58 \sqrt{\frac{0.25}{50}} ]
\]
\[
[ \frac{1}{2} – 2.58 \cdot \sqrt{0.005}, \; \frac{1}{2} + 2.58 \cdot \sqrt{0.005} ]
\]
\[
[ \frac{1}{2} – 2.58 \cdot 0.0707, \; \frac{1}{2} + 2.58 \cdot 0.0707 ]
\]
\[
[ 0.5 – 0.1824, \; 0.5 + 0.1824 ]
\]
\[
[ 0.3176, \; 0.6824 ]
\]
Pour obtenir l’intervalle de fluctuation de \( X \) au seuil de 99%, nous multiplions les bornes par \( n \) :
\[
[ 50 \times 0.3176, \; 50 \times 0.6824 ]
\]
\[
[ 15.88, \; 34.12 ]
\]
En arrondissant, on obtient l’intervalle \( [16, 34] \).
Exercice 11 : écrire un algorithme et intervalle de fluctuation asymptotique
L’intervalle de fluctuation asymptotique au seuil de 95% pour une proportion \( p \) dans un échantillon de taille \( n \) peut être calculé à l’aide de la formule :
\[ [ p – 1.96 \sqrt{\frac{p(1 – p)}{n}}, \ p + 1.96 \sqrt{\frac{p(1 – p)}{n}} ] \]
Voici un exemple d’algorithme en pseudo-code pour calculer cet intervalle :
« `algorithm
Fonction IntervalleFluctuation(p, n)
// Calcul de la marge d’erreur
erreur = 1.96 * sqrt(p * (1 – p) / n)
// Calcul des bornes de l’intervalle
borne_inferieure = p – erreur
borne_superieure = p + erreur
// Retourner les bornes
retourner (borne_inferieure, borne_superieure)
Fin Fonction
« `
Pour implémenter cela en Python, par exemple, on pourrait écrire :
« `python
import math
def intervalle_fluctuation(p, n):
# Calcul de la marge d’erreur
erreur = 1.96 * math.sqrt(p * (1 – p) / n)
# Calcul des bornes de l’intervalle
borne_inferieure = p – erreur
borne_superieure = p + erreur
# Retourner les bornes
return borne_inferieure, borne_superieure
# Exemple d’utilisation
p = 0.5 # proportion
n = 100 # taille de l’échantillon
borne_inferieure, borne_superieure = intervalle_fluctuation(p, n)
print(f »Intervalle de fluctuation: [{borne_inferieure}, {borne_superieure}] »)
« `
En utilisant LaTeX pour l’intégration des formules dans le texte, le code ressemblerait à :
« `latex
Écrire un algorithme :
demandant en entrée les valeurs de \( p \) et \( n \) ;
donnant en sortie les bornes de l’intervalle de fluctuation asymptotique au seuil de 95 \%.
L’intervalle de fluctuation asymptotique au seuil de 95\% pour une proportion \( p \) dans un échantillon de taille \( n \) peut être calculé à l’aide de la formule :
\[ [ p – 1.96 \sqrt{\frac{p(1 – p)}{n}}, \ p + 1.96 \sqrt{\frac{p(1 – p)}{n}} ] \]
\begin{verbatim}
Fonction IntervalleFluctuation(p, n)
// Calcul de la marge d’erreur
erreur = 1.96 * sqrt(p * (1 – p) / n)
// Calcul des bornes de l’intervalle
borne_inferieure = p – erreur
borne_superieure = p + erreur
// Retourner les bornes
retourner (borne_inferieure, borne_superieure)
Fin Fonction
\end{verbatim}
« `
Exercice 12 : lancers de dé et intervalle de fluctuation asymptotique
1) Déterminer l’intervalle de fluctuation asymptotique de la fréquence de 6 obtenus au seuil de 95%.
Pour un lancer de dé, on considère que l’événement « obtenir un 6 » est une variable aléatoire suivant une loi binomiale \( B(n, p) \) avec \( n = 100 \) et \( p = \frac{1}{6} \).
L’intervalle de fluctuation asymptotique au seuil de 95% est donné par :
\[
p \pm 1,96 \sqrt{\frac{p(1-p)}{n}}
\]
Avec \( p = \frac{1}{6} \) et \( n = 100 \),
\[
\sqrt{\frac{p(1-p)}{n}} = \sqrt{\frac{\frac{1}{6} ( 1 – \frac{1}{6} )}{100}} = \sqrt{\frac{\frac{1}{6} \cdot \frac{5}{6}}{100}} = \sqrt{\frac{5}{3600}} = \sqrt{\frac{1}{720}} \approx 0,0373
\]
Ainsi, l’intervalle au seuil de 95% est :
\[
\frac{1}{6} \pm 1,96 \times 0,0373 \approx 0,1667 \pm 0,0731
\]
Soit,
\[
[0,0936 ; 0,2398]
\]
Pour le nombre de 6 (multipliant par n = 100),
\[
[9,36 ; 23,98] \approx [9 ; 24]
\]
2) Déterminer l’intervalle de fluctuation asymptotique de la fréquence de 6 obtenus au seuil de 99%.
L’intervalle de fluctuation asymptotique au seuil de 99% est donné par :
\[
p \pm 2,58 \sqrt{\frac{p(1-p)}{n}}
\]
Avec \( p \approx \frac{1}{6} \) et \( n = 100 \),
\[
\sqrt{\frac{p(1-p)}{n}} = \sqrt{\frac{\frac{1}{6} ( 1 – \frac{1}{6} )}{100}} = \sqrt{\frac{\frac{1}{6} \cdot \frac{5}{6}}{100}} = \sqrt{\frac{5}{3600}} = \sqrt{\frac{1}{720}} \approx 0,0373
\]
Ainsi, l’intervalle au seuil de 99% est :
\[
\frac{1}{6} \pm 2,58 \times 0,0373 \approx 0,1667 \pm 0,0962
\]
Soit,
\[
[0,0705 ; 0,2629]
\]
Pour le nombre de 6 (multipliant par n = 100),
\[
[7,05 ; 26,29] \approx [7 ; 26]
\]
3) a) Quel intervalle est inclus dans l’autre ?
L’intervalle au seuil de 95% \([9 ; 24]\) est inclus dans l’intervalle au seuil de 99% \([7 ; 26]\).
b) Pourquoi était-ce prévisible ?
C’était prévisible car un intervalle de confiance à un seuil plus élevé (99%) est plus large afin de garantir une plus grande probabilité de contenir la proportion vraie. En d’autres termes, pour une même proportion, l’intervalle de fluctuation au seuil de 99% inclut plus de valeurs que celui au seuil de 95%.
Exercice 13 : une fabrique de chocolat et une machine à tablettes
1) Déterminer un intervalle de fluctuation de la fréquence de tablettes imparfaites au seuil de 95 %.
Soit \( X \) la variable aléatoire représentant le nombre de tablettes imparfaites. \( X \) suit une loi binomiale \( \mathcal{B}(n, p) \) où \( n = 20000 \) (le nombre de tablettes produites par jour) et \( p = 0,025 \) (la probabilité qu’une tablette soit imparfaite).
Selon l’approximation de la loi binomiale par la loi normale,
\[ X \sim \mathcal{N}(np, np(1-p)) \]
\[ X \sim \mathcal{N}(20000 \times 0,025, 20000 \times 0,025 \times (1 – 0,025)) \]
\[ X \sim \mathcal{N}(500, 487,5) \]
Pour déterminer un intervalle de fluctuation au seuil de 95 %, on utilise les valeurs critiques de la loi normale standard \( \mathcal{N}(0,1) \), ce qui nous donne \( z_{\alpha/2} = 1,96 \).
L’intervalle de fluctuation est donc donné par :
\[ [ \frac{X}{n} – 1,96 \sqrt{\frac{p(1-p)}{n}}, \frac{X}{n} + 1,96 \sqrt{\frac{p(1-p)}{n}} ] \]
\[ [ 0,025 – 1,96 \sqrt{\frac{0,025 \times 0,975}{20000}}, 0,025 + 1,96 \sqrt{\frac{0,025 \times 0,975}{20000}} ] \]
\[ [ 0,025 – 1,96 \sqrt{\frac{0,024375}{20000}}, 0,025 + 1,96 \sqrt{\frac{0,024375}{20000}} ] \]
\[ [ 0,025 – 1,96 \times 0,0011, 0,025 + 1,96 \times 0,0011 ] \]
\[ [ 0,0238, 0,0262 ] \]
L’intervalle de fluctuation de la fréquence des tablettes imparfaites au seuil de 95 % est donc \( [0,0238, 0,0262] \).
2) Déterminer un intervalle de fluctuation du chiffre d’affaires quotidien réalisé au seuil de 95 %.
Le chiffre d’affaires \( CA \) dépend du nombre de tablettes parfaites \( Y \) et du nombre de tablettes imparfaites \( X \).
\[ CA = 2Y + 0.75X \]
Sachant que \( Y = n – X = 20000 – X \) et que \( X \sim \mathcal{N}(500, 487.5) \),
\[ CA = 2(20000 – X) + 0,75X = 40000 – 1,25X \]
Comme précédemment pour \( X \),
\[ X \in [500 – 1,96 \sqrt{487.5}, 500 + 1,96 \sqrt{487.5}] \]
\[ X \in [500 – 1,96 \times 22,06, 500 + 1,96 \times 22,06] \]
\[ X \in [456, 544] \]
Pour \( CA \),
\[ CA = 40000 – 1,25X \]
Lorsque \( X = 456 \):
\[ CA = 40000 – 1,25 \times 456 \]
\[ CA = 40000 – 570 \]
\[ CA = 39430 \]
Quand \( X = 544 \):
\[ CA = 40000 – 1,25 \times 544 \]
\[ CA = 40000 – 680 \]
\[ CA = 39320 \]
L’intervalle de fluctuation du chiffre d’affaires quotidien réalisé au seuil de 95 % est donc \( [39320, 39430] \).
Exercice 14 : des fusées pour un feu d’artifice
Correction de l’exercice :
1) \[\]Quelle loi suit \(X\) ? Préciser ses paramètres.\[\]
La variable aléatoire \(X\) représente le nombre de fusées opérationnelles parmi les \(n\) fusées achetées par Samuel. Chaque fusée a une probabilité \(p = 0.85\) d’être opérationnelle (puisque 15% des mèches s’éteignent). On modélise \(X\) par une loi binomiale.
\[ X \sim \mathcal{B}(n, p) \quad \text{avec} \quad p = 0.85 \]
2) \[\]Déterminer l’intervalle de fluctuation asymptotique de la fréquence de fusées opérationnelles au seuil de 95% en fonction de \(n\).\[\]
Pour une loi binomiale \(\mathcal{B}(n, p)\), selon le théorème central limite, pour \(n\) assez grand, \(X\) peut être approchée par une loi normale \(\mathcal{N}(np, np(1-p))\). La fréquence des fusées opérationnelles est \(f = \frac{X}{n}\).
Le seuil de 95% correspond à un intervalle de confiance de 95% autour de la moyenne \(\mu = p = 0.85\). L’intervalle de confiance au seuil de 95% pour la fréquence \(f\) est donné par :
\[ [\hat{p} – 1.96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}}, \hat{p} + 1.96 \sqrt{\frac{\hat{p}(1 – \hat{p})}{n}}] \]
Avec \(\hat{p} = p = 0.85\), on obtient :
\[ [ 0.85 – 1.96 \sqrt{\frac{0.85 \times 0.15}{n}}, 0.85 + 1.96 \sqrt{\frac{0.85 \times 0.15}{n}} ] \]
3) \[\]En déduire l’intervalle de fluctuation asymptotique du nombre de fusées opérationnelles au seuil de 95% en fonction de \(n\).\[\]
L’intervalle de fluctuation du nombre de fusées opérationnelles \(X\) se déduit de l’intervalle de fluctuation de la fréquence \(f\) en le multipliant par \(n\) :
\[ [n \times (0.85 – 1.96 \sqrt{\frac{0.85 \times 0.15}{n}}), n \times (0.85 + 1.96 \sqrt{\frac{0.85 \times 0.15}{n}}) ] \]
Soit :
\[ [n \times 0.85 – 1.96 \times \sqrt{n \times 0.85 \times 0.15}, n \times 0.85 + 1.96 \times \sqrt{n \times 0.85 \times 0.15} ] \]
4) \[\]Déterminer la quantité de fusées que Samuel doit acheter pour être sûr au seuil de 95% d’avoir au moins 100 fusées opérationnelles.\[\]
Samuel souhaite que le nombre minimum de fusées opérationnelles soit 100 avec une probabilité de 95%. En utilisant l’intervalle de fluctuation asymptotique :
\[ n \times 0.85 – 1.96 \times \sqrt{n \times 0.85 \times 0.15} \geq\, 100 \]
On résout cette inégalité pour \(n\) :
\[ n \times 0.85 – 1.96 \times \sqrt{n \times 0.1275} \geq\, 100 \]
Posons \(k = \sqrt{n}\), ce qui nous donne :
\[ 0.85 k^2 – 1.96 \times \sqrt{0.1275} \times k – 100 \geq\, 0 \]
En résolvant cette équation quadratique :
\[ k \approx \frac{1.96 \times \sqrt{0.1275} + \sqrt{(1.96 \times \sqrt{0.1275})^2 + 4 \times 0.85 \times 100}}{2 \times 0.85} \]
Soit \(k \approx 11.86\), donc \(n \approx (11.86)^2 ≈ 141\).
Samuel doit donc acheter au moins \[\]141 fusées\[\] pour avoir au moins 100 fusées opérationnelles avec une probabilité de 95%.
Exercice 15 : intervalle de fluctuation et équilibre d’un dé
Soit \( n \) le nombre de tirages du dé, \( n = 1000 \).
Soit \( X \) la variable aléatoire représentant le nombre de « 1 » obtenus en 1000 lancers.
On suppose que le dé est équilibré, donc \( X \) suit une loi binomiale \( B(n = 1000, p = 1/6) \).
L’intervalle de fluctuation au seuil de 95 % est donné par \([0,143 ; 0,190]\).
Pour déterminer si le dé est équilibré, on compare la fréquence observée avec cette intervalle de fluctuation :
1) Si on obtient 200 fois le nombre 1 :
\[
\text{Fréquence observée} = \frac{200}{1000} = 0,20
\]
0,20 n’appartient pas à l’intervalle [0,143 ; 0,190]. Donc, on a des raisons de penser que le dé n’est pas équilibré.
2) Si on obtient 150 fois le nombre 1 :
\[
\text{Fréquence observée} = \frac{150}{1000} = 0,15
\]
0,15 appartient à l’intervalle [0,143 ; 0,190]. Donc, on n’a pas de raison de penser que le dé n’est pas équilibré.
En conclusion :
1. Si on obtient 200 fois le nombre 1, on conclut que le dé n’est probablement pas équilibré.
2. Si on obtient 150 fois le nombre 1, on conclut que le dé est probablement équilibré.
Exercice 16 : l’intervalle contenant p avec une probabilité
Pour résoudre cet exercice, nous allons utiliser l’information fournie sur les intervalles et la fréquence \( f \) pour déduire un intervalle contenant \( p \) avec une probabilité d’au moins 0,95.
1. On nous donne que pour \( n \) assez grand, l’intervalle
\[
[p – \frac{1}{\sqrt{n}} ; p + \frac{1}{\sqrt{n}}]
\]
contient la fréquence \( f \) avec une probabilité au moins égale à 0,95.
2. \( F_n = \frac{X_n}{n} \) est une estimation de \( p \) basée sur la variable aléatoire \( X_n \). Si \( F_n \) est une bonne estimation pour \( p \), pour \( n \) assez grand, \( F_n \) devrait être proche de \( p \).
3. Nous savons que \( f \) est une valeur prise par \( F_n \).
Nous devons montrer que l’intervalle
\[
[ f – \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} ]
\]
contient \( p \) avec une probabilité d’au moins 0,95.
Puisque nous savons que \( f \in [p – \frac{1}{\sqrt{n}} ; p + \frac{1}{\sqrt{n}}] \) avec une probabilité de 0,95, nous pouvons réécrire cette contrainte en termes de \( p \).
Cela signifie que :
\[
p – \frac{1}{\sqrt{n}} \leq\, f \leq\, p + \frac{1}{\sqrt{n}}
\]
En ajoutant et en soustrayant \( \frac{1}{\sqrt{n}} \) de chaque côté, nous obtenons :
\[
f – \frac{1}{\sqrt{n}} \leq\, p \leq\, f + \frac{1}{\sqrt{n}}
\]
Ce qui montre que \( p \) est dans l’intervalle
\[
[ f – \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} ]
\]
avec une probabilité d’au moins 0,95.
Ainsi, nous avons démontré ce qui était demandé.
\[
\boxed{[ f – \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} ] \text{ contient } p \text{ avec une probabilité au moins égale à 0,95.}}
\]
Exercice 17 : algorithme et probabilités
Compléter les lignes 11 et 13 de l’algorithme.
Ligne 11: Afficher « On peut rejeter cette hypothèse au seuil de 5%. »
Ligne 13: Afficher « On ne peut pas rejeter cette hypothèse au seuil de 5%. »
Que fait-il ?
Cet algorithme vérifie si une valeur \[f\] se situe en dehors de l’intervalle de confiance \[[a, b]\] calculé pour une proportion \[p\] avec un seuil de 5%. Si \[f\] est en dehors de cet intervalle, il affiche que l’hypothèse peut être rejetée au seuil de 5%, sinon il affiche qu’il ne peut pas être rejetée.
Modifier l’algorithme pour qu’il demande d’abord à l’utilisateur s’il souhaite un seuil de 95 % ou de 99 %.
\begin{small}
\begin{verbatim}
1. Liste des variables utilisées
2. n : entier
3. a, b, f, p : réels
4. seuil : réel
5. Traitement et affichage
6. Demander p
7. Demander n
8. Demander f
9. Demander seuil
10. Si seuil = 95 Alors
11. Donner à a la valeur p – 1,96 * sqrt(p * (1 – p) / n)
12. Donner à b la valeur p + 1,96 * sqrt(p * (1 – p) / n)
13. Sinon Si seuil = 99 Alors
14. Donner à a la valeur p – 2,58 * sqrt(p * (1 – p) / n)
15. Donner à b la valeur p + 2,58 * sqrt(p * (1 – p) / n)
16. Fin Si
17. Si f < a ou f > b Alors
18. Afficher « On peut rejeter cette hypothèse au seuil de » , seuil , « %. »
19. Sinon
20. Afficher « On ne peut pas rejeter cette hypothèse au seuil de » , seuil , « %. »
21. Fin Si
\end{verbatim}
\end{small}
Exercice 18 : une compagnie ferroviaire et fluctuation
1) Déterminer l’intervalle de fluctuation asymptotique au seuil de 95 % de la fréquence des trains arrivés à l’heure d’après la compagnie.
La proportion de trains arrivant à l’heure selon la compagnie est \( p = 0.90 \).
Le nombre de jours observés est \( n = 60 \).
L’intervalle de fluctuation asymptotique au seuil de 95 % est donné par la formule :
\[ I = [ p – 1.96 \sqrt{\frac{p(1-p)}{n}}, p + 1.96 \sqrt{\frac{p(1-p)}{n}} ] \]
Calculons les bornes de cet intervalle :
\[ p(1-p) = 0.90 \times 0.10 = 0.09 \]
\[ \sqrt{\frac{0.09}{60}} = \sqrt{0.0015} \approx 0.0387 \]
\[ 1.96 \times 0.0387 \approx 0.0758 \]
Les bornes de l’intervalle sont donc :
\[ p – 1.96 \sqrt{\frac{p(1-p)}{n}} = 0.90 – 0.0758 = 0.8242 \]
\[ p + 1.96 \sqrt{\frac{p(1-p)}{n}} = 0.90 + 0.0758 = 0.9758 \]
L’intervalle de fluctuation asymptotique au seuil de 95 % est donc :
\[ I = [0.8242, 0.9758] \]
2) Cet usager a relevé que son train avait eu 12 fois du retard.
a) Déterminer la fréquence des trains arrivés à l’heure. Cette fréquence appartient-elle à l’intervalle de fluctuation obtenu à la question 1 ?
Le nombre de trains arrivés à l’heure est \( 60 – 12 = 48 \).
La fréquence des trains arrivés à l’heure est donc :
\[ f = \frac{48}{60} = 0.80 \]
Comparons cette fréquence avec l’intervalle de fluctuation précédent :
\[ 0.80 \notin [0.8242, 0.9758] \]
La fréquence des trains arrivés à l’heure (0.80) n’appartient pas à l’intervalle de fluctuation au seuil de 95 %.
b) Proposer deux hypothèses permettant d’expliquer le résultat de la question précédente.
1. L’hypothèse \( H_0 \) : La compagnie a surestimé la proportion de trains arrivant à l’heure. Dans ce cas, la vraie proportion de trains arrivant à l’heure pourrait être inférieure à 90 %.
2. L’hypothèse \( H_1 \) : Les observations de l’usager sont exceptionnelles et ne reflètent pas la performance typique de la compagnie. Il se pourrait que durant la période d’observation spécifique, il y ait eu des perturbations temporaires affectant la ponctualité des trains.
Exercice 19 : une étude de l’INSEE sur les bébés français hors mariage
1) Déterminons l’intervalle de fluctuation asymptotique au seuil de 95 %.
Soit \( p \) la proportion de naissances hors mariage en 2006. D’après l’étude, \( p = 0.5 \).
La proportion observée en 2010 est \( \hat{p} = \frac{556}{1000} = 0.556 \).
L’intervalle de fluctuation asymptotique au seuil de 95 % est donné par :
\[ \hat{p} \pm z_{\frac{\alpha}{2}} \sqrt{\frac{p(1-p)}{n}} \]
avec \( z_{\frac{\alpha}{2}} \) correspondant à la valeur critique pour \(\alpha = 0.05\), c’est-à-dire \( z_{\frac{0.05}{2}} = 1.96 \).
Calculons donc :
\[ \hat{p} \pm 1.96 \sqrt{\frac{0.5 \times 0.5}{1000}} \]
\[ 0.556 \pm 1.96 \sqrt{\frac{0.25}{1000}} \]
\[ 0.556 \pm 1.96 \sqrt{0.00025} \]
\[ 0.556 \pm 1.96 \times 0.0158 \]
\[ 0.556 \pm 0.030968 \]
L’intervalle de fluctuation asymptotique est donc :
\[ [0.525032, 0.586968] \]
2) Que peut-on en déduire concernant l’hypothèse émise ?
L’hypothèse émise stipule que la proportion de naissances hors mariage en 2010 est la même qu’en 2006, soit \( p = 0.5 \).
Comme \( 0.5 \) appartient à l’intervalle de fluctuation asymptotique \([0.525, 0.587]\), nous ne pouvons pas rejeter l’hypothèse au seuil de 5 %. Par conséquent, les données disponibles ne permettent pas de conclure que la proportion de naissances hors mariage a changé entre 2006 et 2010.
Exercice 20 : un producteur de jus de pomme et sa commercialisation
1) La variable \( X \) représentant le nombre de bouteilles non commercialisables suit une loi binomiale. Sous l’hypothèse où la proportion de bouteilles non commercialisables n’aurait pas évolué d’une année sur l’autre, \( X \) suit la loi binomiale de paramètres \( n = 598 \) et \( p = 0.04 \). Autrement dit, \( X \sim \mathcal{B}(598, 0.04) \).
2) Pour déterminer l’intervalle de fluctuation asymptotique au seuil de 95%, nous utilisons l’approximation normale de la loi binomiale. En effet, si \( n \) est grand (typicalement \( np \geq\, 5 et n(1-p) \geq\, 5 \)), la loi binomiale \( \mathcal{B}(n, p) \) peut être approximée par une loi normale \( \mathcal{N}(np, np(1-p)) \).
Dans notre cas, calculons les paramètres de la loi normale :
\[ \mu = np = 598 \times 0.04 = 23.92 \]
\[ \sigma = \sqrt{np(1-p)} = \sqrt{598 \times 0.04 \times 0.96} \approx 4.74 \]
L’intervalle de fluctuation asymptotique à 95% pour la proportion est alors donné par :
\[ p \pm 1.96 \times \frac{\sigma}{n} \]
En remplaçant les valeurs :
\[ 0.04 \pm 1.96 \times \frac{4.74}{598} \]
\[ 0.04 \pm 0.00015 \]
Pour le nombre de bouteilles non commercialisables, l’intervalle de fluctuation asymptotique à 95% est :
\[ \mu \pm 1.96 \times \sigma \]
\[ 23.92 \pm 1.96 \times 4.74 \]
\[ 23.92 \pm 9.29 \]
\[ [14.63, 33.21] \]
Nous arrondissons aux valeurs entières les plus proches :
\[ [15, 33] \]
3) Le producteur trouve finalement \( 19 \) bouteilles non commercialisables.
L’intervalle de fluctuation asymptotique au seuil de 95% pour \( X \) est \([15, 33]\). Le nombre \( 19 \) se situe à l’intérieur de cet intervalle.
Conclusion :
Le producteur ne peut pas affirmer qu’il a fait mieux que l’an dernier, car le nombre observé de bouteilles non commercialisables (19) se trouve dans l’intervalle de fluctuation au seuil de 95%, ce qui signifie que cette proportion pourrait être conforme à celle de l’année dernière.
Réviser les cours et exercices de maths avec nos Q.C.M :
D'autres outils pour progresser en autonomie :
Maths PDF c'est 12 687 112 cours et exercices de maths téléchargés en PDF et 4 250 exercices.