Définition ensembliste et propriétés des probabilités#

En 1933, Andrey Kolmogorov publie un livre intitulé “Foundations of the Theory of Probability”: en utilisant une algèbre de Boole et quelques axiomes supplémentaires, il introduit une théorie des probabilités que l’on peut qualifier d’ensembliste. Notamment, il donne une correspondance entre des ensembles et les évènements aléatoires, comme nous l’avons fait dans la Section Univers et évènements. Nous allons aborder cela dans cette section.

Plus récemment, la théorie de la mesure (que nous n’aborderons pas dans ce cours) généralise la notion de calcul d’aire et d’intégrale et permet de donner une version plus forte des définitions ci-dessous, notamment des ensembles discontinus comme \(\mathbb{R}-\{0\}\).

Définition ensembliste#

Dans cette approche, pour un évènement \(\mathcal{A}\), l’ensemble des éléments de l’univers pour lesquels \(\mathcal{A}\) est vrai est noté \(A\). \(\overline{A}\) définit donc l’ensemble des éléments de l’univers pour lesquels \(\mathcal{A}\) est faux. Aussi, on peut définir l’évènement \(\mathcal{A}\,ou\,\mathcal{B}\) pour lequel \(\mathcal{A}\) ou \(\mathcal{B}\) est vrai comme l’étant l’ensemble \(A\cup B\) (union de l’ensemble \(A\) et de l’ensemble \(B\)). De façon similaire, l’évènement \(A\,et\,B\) correspond à l’ensemble \(A\cap B\).

On définit la probabilité d’un évènement \(A\) par une mesure sur l’ensemble des évènements \(\mathcal{A}\) de \(A\) telle que:

(1)#\[ 0 \leq P(A) \leq 1, \]

(2)#\[ P(\Omega ) = 1, \]

(3)#\[ P(A\cup B) = P(A)+P(B) \mathrm{\,si\,} A\cap B = \emptyset \]

L’interprétation de ces axiomes en terme de fréquence d’occurence d’évènements est alors triviale. En effet, la propriété (2) signifie qu’un évènement toujours vrai (i.e. l’univers \(\Omega\)) a une probabilité égale à 1. La propriété (3) traduit le fait que l’union d’évènements incompatibles (tels que \(A\cap B = \emptyset\)1) voient leur probabilité s’additionner. On a alors:

\[ P(\mathcal{A}\, ou\, \mathcal{B}) = P(A\cup B) = P(A)+P(B). \]

Propriétés fondamentales#

Énonçons ici quelques conséquences des axiomes définis plus haut.

En effet, on peut en déduire facilement que \(P(\Omega) = 1\). Aussi, si on définit \(\overline{A}\) comme étant le complémentaire de \(A\)2, on a \(A\cup \overline{A} = \Omega\) et \(A\cap \overline{A} = \emptyset\) et on en déduit des équations (2) et (3):

\[ P(\overline{A}) = 1 - P(A). \]

Notamment, on peut étendre la propriété (3) pour des ensembles non disjoints:

\[ P(A\cup B) = P(A) + P(B) - P(A\cap B). \]

../_images/recouvrement.png — Fig. 1 Illustration du recouvrement entre deux évènements \(\mathcal{A}\) et \(\mathcal{B}\).#

La Fig. 1 illustre bien cela: l’aire de l’union entre \(A\) et \(B\) est la somme des surfaces individuelles moins une fois l’aire commune entre \(A\) et \(B\) (puisque celle-ci est comptée deux fois sinon).

On peut alors remarquer que

\[ P(A\cup B) \leq P(A) + P(B). \]

Cette notion d’ensembles disjoints s’étend facilement lorsque l’on considère un nombre \(N\) d’ensembles. Si \(\Omega = \bigcup _{i=1}^N A_i\) avec \(A_i\) disjoints deux à deux, l’ensemble des évènements \(\left\{ \mathcal{A}_i \right\} _{i=1...N}\) est appelé système complet d’évènements. Pour tout ensemble \(B\), on a alors:

(4)#\[ P(B) = P(B\cap \Omega) = P(B\cap \bigcup _{i=1}^N A_i) = \sum _{i=1}^N P(A_i \cap B). \]

Cette dernière formule est utile pour “décomposer” un évènement en terme d’évènements plus élémentaires.

Exercise 1

On considère 4 évènements notés \(\mathcal{A}\), \(\mathcal{B}\), \(\mathcal{C}\) et \(\mathrm{D}\) (associés à des ensembles \(A\), \(B\), \(C\) et \(D\)) dans un univers \(\Omega\) vérifiant:

\[ P(A) = 0.3 \]

\[ P(B\cap C) = 0.2 \]

\[ P(C) = 0.3 \]

\[ P(D) = 0.5 \]

\[ P(B\cap \bar{C}) = 0.3 \]

\[ P(D\cap \bar{C}) = 0.5 \]

\[ P(A~\mathrm{ou}~B) = 0.65 \]

\(\bar{C}\) désigne le complémentaire de \(C\) dans \(\Omega\).

Que vaut \(P(\bar{C})\)?
Que valent \(P(B\vert C)\) et \(P(C\vert B)\)?
Les évènements \(C\) et \(D\) sont-ils incompatibles? Justifier.

Solution to Exercise 1

\(P(\bar{C}) = 1 - P(C) = 1-0.3 = 0.7\)
Il faut d’abord calculer \(P(B)\). Comme \(C+\bar{C} = \Omega\) et donc \(B\cap (C\cup \bar{C}) = B\), \(P(B\cap C) + P(B\cap \bar{C}) = P(B) = 0.2+0.3 = 0.5\). Par définition,

(5)#\[\begin{equation} P(B\vert C) = \frac{P(B\cap C)}{P(C)} = \frac{0.2}{0.3} = \frac{2}{3}. \end{equation}\]

De façon similaire,

(6)#\[\begin{equation} P(C\vert B) = \frac{P(C\cap B)}{P(B)} = \frac{0.2}{0.5} = 0.4. \end{equation}\]
Deux évènements sont incompatibles si l’intersection de leurs ensembles est nulle. Comme \(\mathcal{C}\) et \(\bar{\mathcal{C}}\) sont incompatibles et \(D = D\cap (C\cup \bar{C}) = (D\cap C)\cup (D\cap \bar{C}) \), \(P(D\cap C) = P(D) - P(D\cap \bar{C}) = 0.5 - 0.5 = 0\). \(\mathcal{C}\) et \(\mathcal{D}\) sont donc incompatibles.

Probabilité conditionnelle et théorème de Bayes#

Il est souvent utile de considérer la simultanéité de deux évènements. Par exemple, quelle est la probabilité pour qu’un chien a le pelage marron, sachant que celui d’un de ses parents est aussi marron? Cette probabilité n’est pas le produit entre la probabilité pour qu’un chien soit de couleur marron et celle que ses parents le soient aussi. Il faut plutôt considérer uniquement l’ensemble des chiens dont les parents sont de couleur noir et calculer la proportion de pelage marron: on se restreint donc à un sous-ensemble \(\Omega '\) plutôt que l’univers \(\Omega\).

On définit donc la notion de probabilité conditionnelle \(P(A\vert B)\) comme étant la probabilité de l’évènement \(A\) sachant que l’évènement \(B\) est vrai et on la définit comme:

(7)#\[ P(A\vert B) = \frac{P(A\cap B)}{P(B)}. \]

Remarquons ici que cette probabilité est définie uniquement si \(P(B)\neq 0\); en effet, si \(P(B) = 0\), \(B\) est un évènement (presque) impossible.

On peut vérifier que cette probabilité conditionnelle respecte bien les propriétés (1), (2) et (3) d’une probabilité. Notamment, on peut voir que:

\[ P(\Omega '\vert B) = \frac{P(B)}{P(B)} = 1 \]

\[ P(A_1 \cup A_2 \vert B) = P(A_1 \vert B) + P(A_2 \vert B)\mathrm{\,si\,} A_1\cap A_2 = \emptyset. \]

La probabilité conditionnelle est donc une probabilité définie sur un univers restreint \(\Omega ' = B\). On peut déduire de l’équation (7) que:

(8)#\[ P(A\cap B ) = P(A\vert B)\times P(B). \]

Dans le cas où \(\left\{B_i\right\}_{i=1...N}\) forme un système complet d’évènements, on en déduit grace à l’équation (4) que:

(9)#\[ P(A) = \sum _{i=1}^N P(A \cap B_i) = \sum _{i=1}^N P(A\vert B_i)P(B_i). \]

Puisque \(A\cap B = B\cap A\), on peut déduire de l’équation (8):

\[ P(A\cap B) = P(A\vert B)P(B) = P(B\cap A) = P(B\vert A) P(A). \]

De cette relation, on en déduit le théorème de Bayès:

\[ P(B\vert A) = \frac{P(A\vert B)P(B)}{P(A)}. \]

Cette relation permet de relier les probabilités conditionnelles de deux évènements \(A\) et \(B\). Si on dispose d’un système complet d’évènements \(\left\{B_i\right\}_{i=1...N}\), on peut utiliser la relation (9) pour écrire la probabilité conditionnelle d’un des évènements \(B_i\):

\[ P(B_i\vert A) = \frac{P(A\vert B_i)P(B_i)}{\sum _{i=1}^N P(A\vert B_i)P(B_i)}. \]

Évènements indépendants#

L’indépendance entre deux évènements est définie par:

(10)#\[ P(A\cap B) = P(A)\times P(B). \]

Cela se traduit aussi par le fait que la probabilité de \(A\) est la même quelque soit le résultat de \(B\), soit \(P(A\vert B) = P(A)\).

Lancer de dé Généralement, le résultat de chaque lancer de dé est indépendant. Ainsi, la probabilité d’obtenir un 6 lors d’un lancer \(B\) après avoir déjà obtenu un 6 lors d’un lancer \(A\) vaut \(P(B=6\vert A=6) = P(B = 6) = \frac{1}{6}\). En revanche, la probabilité d’obtenir deux 6 simultanément vaut \(P(A=6\cup B=6) = P(B=6\vert A = 6)\times P(A=6) = P(B=6)\times P(A=6) = \frac{1}{6}\times \frac{1}{6} = \frac{1}{36}\).

Exercise 2

Un tireur de fléchettes touche sa cible 1 fois sur 2. Combien de fois doit-il tirer pour avoir une probabilité minimale de 99~% de toucher la cible au moins une fois?
Vérifier le calcul théorique avec une simulation numérique: on pourra simuler par exemple pleins de lancers successifs de fléchettes avec comme résultat un succès ou un échec et de voir si dans 99~% des cas, il y a un succès parmi des sous-listes avec la taille choisie. Justifier le nombre de simulations choisi.

Solution to Exercise 2

La probabilité de ne jamais toucher la cible vaut une fois vaut \(p=0.5\) (une fois sur deux). Si on prend \(n\) le nombre de lancers nécessaires, la probabilité de ne pas toucher la cible après \(n\) lancers vaut \(p^n\); alors la probabilité de toucher une fois la cible après \(n\) lancers vaut \(1-p^n\).

Or on veut que cette probabilité soit plus grande que 0.99, alors

\[ 1-p^n > 0.99 \]

\[ \Rightarrow p^n < 0.01 \]

\[ \Rightarrow n\log(p) < \log(0.01) = -2 \]

\[ \Rightarrow n > \frac{-2}{\log(0.5)} = 6.64 \]
On crée une fonction touche_cible qui va retourner vrai si la cible est touché au moins une fois pour n lancers; puis l’utiliser pour compter le nombre de succès en 10000 lancers.

import random
def touche_cible(n):
    # n lancers, retourne vrai si touché la cible au moins une fois
    for i in range(n):
        val=random.random()
        if val > 0.5:
            return True
    return False

nombre_succes = 0
nombre_essais = 10000
for i in range(nombre_essais):
    if touche_cible(7):
        # compte le nombre de succès
        nombre_succes = nombre_succes+1
print("Proba: {:.3f}".format(nombre_succes/nombre_essais))
print("Proba theorique: {:.3f}".format(1-(0.5)**7))

Proba: 0.991
Proba theorique: 0.992

1: On dit aussi que \(A\) et \(B\) sont des ensembles disjoints.
2: Pour rappel, \(\overline{A}\) correspond à l’évènement “\(\mathcal{A}\) est faux.”.

Physique Expérimentale 2

Définition ensembliste et propriétés des probabilités

Contents

Définition ensembliste et propriétés des probabilités#

Définition ensembliste#

Propriétés fondamentales#

Probabilité conditionnelle et théorème de Bayes#

Évènements indépendants#