Notion d’erreur sur une mesure#

Comme nous l’avons discuté dans le chapitre précédent, un des objectifs de la physique expérimentale est d’estimer les paramètres physiques des modèles que l’on considère, et ce avec une certaine précision. En effet si on se donne un modèle donnant la distribution de mesures expérimentales en fonction d’un ou plusieurs paramètres, on va vouloir tester la validité de ce modèle en estimant tout d’abord les valeurs des paramètres de ce modèle. Ces estimations sont obtenues à partir d’un échantillon de mesures de certaines quantités issues d’une ou plusieurs expériences. En général, on va associer à chaque estimation une incertitude (aussi appelée erreur) qui caractérise la précision que l’on \textit{pense} avoir sur cette estimation. Cette incertitude permet aussi de comparer deux estimations, ou bien une estimation et une valeur théorique attendue et décider si elles sont en accord.

Notion d’estimateurs#

Un estimateur $\hat{A}$ d’un paramètre physique $A$ est une fonction des mesures expérimentales $\vec{x}$ qui renvoie une valeur approchée de la vraie valeur $A_0$ de $A$. Puisque $\hat{A}$ est une fonction de mesures, c’est une variable aléatoire avec une pdf associée $f_{\hat{A}}$.

Intuitivement, on peut voir que la valeur moyenne de cet estimateur $\int a\times f_{\hat{A}}\mathrm{d}a$ doit être proche (ou égale) de sa valeur vraie et que la pdf de cet estimateur doit être relativement peu étalé afin qu’une réalisation de cet estimateur (avec des mesures expérimentales de $\vec{x}$) ait de grandes chances d’être proche de la valeur vraie.

Un bon estimateur doit donc respecter plusieurs propriétés:

Un estimateur doit converger vers la valeur vraie du paramètre associé. Si on considère un échantillon de mesures $\vec{x}$ de taille infinie, l’estimation de $A$ avec $\hat{A}$ doit être strictement égale à la valeur vraie $A_0$:

(48)#\[\begin{equation} \lim _{n\rightarrow \infty} \hat{A} = A_0. \end{equation}\]

L’estimateur ne doit pas être biaisé, c’est à dire que la moyenne (en probabilité) de $\hat{A}$ (que l’on note $\bar{\hat{A}}$ et calcule avec l’équation (25)) doit être égale à la valeur vraie $A_0$. On définit le biais comme l’écart entre la valeur moyenne et la valeur vraie:

(49)#\[ b(\hat{A}) = \mathbb{E}(\hat{A}) - A_0. \]

Un estimateur peut être non biaisé asymptotiquement, c’est-à-dire non biaisé pour une taille d’échantillon infinie. Cette propriété et la précédente sont reliées: on peut démontrer qu’un estimateur convergent vers la valeur vraie $A_0$ est non biaisé asymptotiquement.

Un estimateur doit être efficace, c’est-à-dire qu’il doit converger le plus rapidement possible vers la vraie valeur du paramètre $A$. Grossièrement, plus un estimateur converge rapidement, plus son étalement diminue rapidement à mesure que la taille de l’échantillon de mesures $\vec{x}$ augmente.

Définition d’un erreur#

Souvent, quand on parle d’estimation d’un paramètre, on sous-entend que l’estimation donne une unique valeur numérique du paramètre estimé. Ce type d’estimation renvoie à l’idée que l’estimateur est la \textit{valeur centrale de la série de mesures}: les estimateurs associés sont appelés estimateurs paramétriques et doivent respecter les propriétés de la section précédente.

Au lieu de donner une valeur unique estimant le paramètre $A$, on pourrait aussi définir un intervalle $[a_1, a_2]$ qui contient vraisemblablement la valeur vraie. La largeur de cet intervalle correspond à la précision de la mesure ou des mesures que l’on a fait. Par exemple, lorsqu’on utilise un pèse-personne pour estimer sa masse, la valeur affichée va être de $71.3 \mathrm{kg}\pm 0.1 \mathrm{kg}$, où le $\pm 0.1 \mathrm{kg}$ est la précision de la balance avancée par le constructeur de la balance: cela définit donc un intervalle $[ 71.2 \mathrm{kg}, 71.4 \mathrm{kg}]$ dans lequel il est vraisemblable que notre vraie masse se trouve réellement. Ce type d’estimation du paramètre se nomme estimation par intervalle.

La définition d’un intervalle contenant vraisemblablement la valeur vraie revient finalement à définir une valeur centrale de l’intervalle comme étant la valeur de l’estimateur $\hat{A}$ et une erreur sur cet estimateur, notée généralement $\sigma _{\hat{A}}$, correspondant à l’étalement des valeurs vraisemblables de $A_0$. Si cet étalement tend vers 0 lorsque la taille de l’échantillon tend vers l’infini ou

(50)#\[\begin{equation} \lim _{n\rightarrow \infty} \sigma _{\hat{A}}^2 = 0, \end{equation}\]

l’estimateur $\hat{A}$ est convergent: dans la limite infinie, on a alors un estimateur dont la moyenne est la valeur vraie $A_0$ et de variance nulle donc cet estimateur donne la vraie valeur de $A$.

Un point important à remarquer est qu’à chaque estimation de l’intervalle est associée notre certitude de la présence de la valeur vraie dans cet intervalle: être sûr et certain n’est bien évidemment pas la même chose qu’en être sur à 50 % ou pas sûr du tout. Aussi, un intervalle correspondant à un niveau de certitude de 95 % relativement large pourrait être équivalent à un niveau de taille plus faible avec une certitude associée plus faible. Généralement, en sciences expérimentales, les intervalles que l’on définit ont une certitude associée de 68 %: ce choix à priori arbitraire est en fait relié aux intervalles pour des pdf gaussiennes. Cependant nous n’aborderons pas en détails cette notion, mais il est important de garder en tête cela lorsque l’on mesure des quantités en physique expérimentale: à quel point est on sûr que l’intervalle que l’on vient de définir contient la valeur vraie du paramètre?

Quelques exemples d’estimateurs empiriques#

Un estimateur très répandu est celui de l’estimateur $\hat{\mu}$ de la moyenne d’un échantillon de valeurs $\left\{x_i\right\}$ non corrélée entre elles. Si chaque valeur $x_i$ est une réalisation d’une même variable $X$, les $x_i$ valent en moyenne $\mathbb{E}(x_i) = \mu$ et ont une variance $var(x_i) = \sigma ^2$. On peut vérifier que cet estimateur, appelé estimateur de la moyenne empirique n’est pas biaisé. En effet, on peut démontrer

(51)#\[ \mathbb{E}(\hat{\mu}) = \mathbb{E}\left( \frac{1}{n}\sum _i x_i \right) = \frac{1}{n}\sum _i \mathbb{E}(x_i) = \frac{1}{n} \sum _i \mu = \mu, \]

ce qui veut dire que le biais de cet estimateur est nul d’après l’équation (49):

(52)#\[\begin{equation} b(\hat{\mu}) = \mathbb{E}(\hat{\mu}) - \mu = 0. \end{equation}\]

On peut étudier la vitesse de convergence de cet estimateur en calculant la variance de cet estimateur [^detail-var]:

(53)#\[\begin{equation} \sigma ^2 _{\hat{\mu}} = var\left( \hat{\mu} \right) = var \left( \frac{1}{n} \sum _i x_i \right) = \frac{1}{n^2} \sum _i var \left( x_i \right) = \frac{1}{n^2} \sum _i \sigma ^2 = \frac{\sigma^2}{n}. \end{equation}\]

On voit donc que pour un échantillon de taille infinie, la variance de cet estimateur vaut zéro, ce qui en fait un estimateur convergent. On peut aussi remarquer la vitesse de convergence de cet estimateur. En effet, l’incertitude notée $\Delta \hat{\mu}$ sur cet estimateur vaut:

(54)#\[ \Delta \hat{\mu} = \frac{\sigma}{\sqrt{n}}, \]

avec $\sigma$ représentant l’erreur sur les valeurs des $x_i$. Cela veut dire que l’incertitude $\Delta \hat{\mu}$ sur une moyenne est toujours plus faible que celle sur les valeurs individuelles et qu’il est toujours possible d’améliorer l’incertitude $\Delta \hat{\mu}$: si on augmente la taille de l’échantillon par un facteur 4, on réduit l’incertitude sur la moyenne par un facteur 2.

Un autre estimateur empirique d’intérêt est celui de la variance:

(55)#\[\begin{equation} \hat{\sigma} ^2 = \frac{1}{n-1} \sum _{i=0} ^n (x_i - \bar{x})^2. \end{equation}\]

De façon similaire à la moyenne, on peut démontrer que cet estimateur est non biaisé avec une moyenne $\mu _{\hat{\sigma}^2} = \sigma ^2$ correspondant à la valeur vraie. On peut remarquer que cet estimateur diffère de la définition statistique de la variance donnée par l’équation (12) par un facteur $\frac{n}{n-1}$: cela semble assez évident puisque si le nombre de mesures vaut $n=1$, on ne peut pas estimer la variance de l’échantillon. Il est important aussi de noter que cet estimateur de la variance ne correspond pas à l’erreur sur la moyenne que nous avons établie avec l’équation (54): en effet, celui-ci ne diminue pas lorsque $n$ augmente, mais correspond véritablement à la variance de la variable aléatoire de mesure.

Classification des erreurs#

L’estimateur de la moyenne (51) est un estimateur qui converge vers la valeur moyenne vraie de la variable aléatoire associée. Si on répète les mesures, les échantillons obtenus vont vraisemblablement se répartir autour de cette valeur vraie: certaines valeurs seront au dessus et certains en dessous.

L’erreur que l’on fait alors sur la moyenne (54) est appelée erreur statistique, puisque due à la statistique de l’échantillon collecté. Ce type d’erreur se distingue des erreurs dites systématiques qui se caractérisent par le fait que des mesures répétées vont donner systématiquement des valeurs supérieures à la valeur vraie ou bien des valeurs inférieures à la valeur vraie. Si l’on faisait la moyenne de mesures entachées par des erreurs systématiques, celle-ci ne va pas tendre vers la valeur vraie de la moyenne, mais vers une valeur systématiquement plus grande ou plus faible que la valeur vraie correspondant à un biais.

Il est souvent difficile de détecter ce type d’erreur puisqu’on ne connait généralement pas la valeur vraie (c’est d’ailleurs pour la déterminer que l’on fait des mesures…). Il est donc nécessaire de réfléchir aux phénomènes physiques qui peuvent causer ce type d’erreurs: il est en effet parfois possible de corriger ces biais. Si cela n’est pas possible ou bien si l’on n’est pas très sur de la correction que l’on fait, on va alors associer à l’estimateur une valeur correspondant à une estimation de notre incertitude sur ce biais: on l’appellera incertitude systématique. Cette valeur s’ajoutera alors à la valeur sur l’incertitude statistique, par exemple celle donnée par l’équation (54) dans le cas de l’estimateur de la moyenne.

Les erreurs systématiques peuvent donc provenir de plusieurs sources:

la résolution du détecteur due à la précision de lecture de l’évaluateur (lecture d’une distance grâce à une règle graduée plus ou moins finement, lecture d’une quantité sur un instrument dont le cadrant affiche des valeurs changeantes);
des facteurs environnementaux causant des effets sur le dispositif de mesure (par exemple, les changements de température de la pièce entre le matin et l’après-midi peuvent causer des variabilités dans la mesure d’une même quantité par un instrument);
la variabilité de la calibration de l’instrument de mesure (en recalibrant l’instrument et mesurant la même quantité, la valeur donnée par l’instrument pourrait changer);
la dérive ou le vieillissement d’un instrument;
les erreurs de l’expérimentateur lors du report des mesures (souvent les plus dures à déceler…).

Propagation des erreurs#

Lorsque des mesures sont faites, les quantités d’intérêt doivent être calculées à l’aide de formules ou de fonctions impliquant ces données. Cependant ces fonctions ont souvent des paramètres qui possèdent des incertitudes qu’il faut prendre en compte ou propager dans le calcul de l’incertitude sur la grandeur d’intérêt. Si, par exemple, la quantité d’intérêt $z$ dépend d’une mesure $x$ par la fonction $f(x)$ avec $y$ est un paramètre de cette fonction, l’incertitude sur $z$ sera $\Delta z = \Delta f(x,\Delta x, y, \Delta y)$.

Une bonne approximation pour le calcul de l’incertitude $\Delta f$ sur la quantité $f$ dépendant de $n$ variables $x_i$ est donnée par

(56)#\[ \Delta f^2 = \sum _{i=1}^n \left(\frac{\partial f}{\partial x_i}\right) ^2 \Delta x_i ^2 + 2 \sum _{i, j<i} cov(x_i, x_j) \frac{\partial f}{\partial x_i} \frac{\partial f}{\partial x_j}. \]

Si les variables $x_i$ ne sont pas corrélées entre elles (i.e. $cov (x_i, x_j)=0$), alors l’expression se simplifie en

(57)#\[ \Delta f^2 = \sum _{i=1}^n \left(\frac{\partial f}{\partial x_i}\right) ^2 \Delta x_i ^2. \]

Exemple

Quelques exemples de formules classiques de propagation d’incertitudes où on néglige les corrélations entre les variables:

pour $f(x,y) = x+y$,

(58)#\[\begin{equation} \Delta f^2 = \Delta x^2 + \Delta y^2; \end{equation}\]
pour $f(x,y) = x-y$,

(59)#\[\begin{equation} \Delta f^2 = \Delta x^2 + \Delta y^2; \end{equation}\]
pour $f(x,y) = x\times y$,

(60)#\[\begin{equation} \frac{\Delta f^2}{f^2} = \frac{\Delta x^2}{x^2} + \frac{\Delta y^2}{y^2}; \end{equation}\]
pour $f(x,y) = \frac{x}{y}$,

(61)#\[\begin{equation} \frac{\Delta f^2}{f^2} = \frac{\Delta x^2}{x^2} + \frac{\Delta y^2}{y^2}; \end{equation}\]
pour $f(x) = x^n$,

(62)#\[\begin{equation} \frac{\Delta f}{f} = n\frac{\Delta x}{x}. \end{equation}\]

Il y a d’autres méthodes pour propager les erreurs sur une quantité; notamment, QExPy propose une méthode par Monte Carlo qui permet d’évaluer cette quantité quelque soit la fonction $f$.

Exercise 7

La police utilise généralement des sortes de pistolets radar pour mesurer la vitesse des voitures et détecter celles avec un excès de vitesse. Ce pistolet envoie des ondes radio de fréquence $f_0$ se déplacant avec une vitesse proche de celle de la lumoière $c$ sur une voiture et mesure la fréquence $f$ de l’onde réfléchie. Celle-ci sera différente à cause de l’effet Döppler selon l’équation:

(63)#\[\begin{equation} f = f_0 \left( 1- \frac{v}{c}\right), \end{equation}\]

avec $v$ la vitesse de la voiture. Quelle doit être l’incertitude relative de ces pistolets sur la mesure de fréquence pour mesurer la vitesse d’une voiture avec une précision de $1~\mathrm{km/h}$?

Solution to Exercise 7

On calcule l’incertitude sur la fréquence à partir de celle sur de la voiture:

\[ \Delta f = \sqrt{\left(\frac{\mathrm{d}f}{\mathrm{d}v}\right)^2\Delta v^2} \]

\[ = \sqrt{\frac{f_0^2}{c^2}}\Delta v \]

\[ \Rightarrow \frac{\Delta f}{f_0} =\frac{\Delta v}{c}. \]

Pour $c = 10^5~\mathrm{km/s}$, il faut donc $\frac{\Delta f}{f_0} \approx 3\times 10^{-6}$.

Exercise 8

Le coefficient d’asymétrie dans les désintégrations nucléaires $\beta$ a été réalisée par Bopp et collaborateurs en 1986 [BDH+86]. A l’aide d’un faisceau de neutrons polarisés, ils ont pu mesurer

(64)#\[ A=\frac{2 \lambda(1-\lambda)}{1+3 \lambda^{2}}=-0.1146 \pm 0.0019. \]

Cette mesure très précise permet d’en déduire la valeur de $\lambda$ qui est une quantité essentielle dans les modèles de physique des particules 1.

Il est possible de mesurer $\lambda$ d’une façon assez différente: il suffit de mesurer la durée de vie du neutron libre $\tau _n$ et d’utiliser la relation:

(65)#\[ \tau=\frac{5163.7 \mathrm{sec}}{1+3 \lambda^{2}}. \]

Cependant les différentes mesures de durée de vie obtenues par les différents groupes ne sont pas consistentes les unes avec les autres. Ci-dessous sont résumées les mesures les plus récentes:

$\tau _n = 918\pm 14~\mathrm{s}$ obtenue par [CNB+72],
$\tau _n = 881\pm 8~\mathrm{s}$ obtenue par [BKP+78],
$\tau _n = 937\pm 18~\mathrm{s}$ obtenue par [BMS+80],
$\tau _n = 887.6\pm 3.0~\mathrm{s}$ obtenue par [MAB+89].

À partir de la relation (65), trouver une relation donnant $\lambda$. Avec une méthode de propagation des erreurs, trouver une relation permettant d’en déduire l’erreur sur $\lambda$.
A partir de cette relation, quelles mesures de $\tau_n$ sont alors compatibles avec la mesure de $A$?
Faire un graphique représentant ces différentes mesures et vérifier la compatibilité entre ces résultats.

Solution to Exercise 8

A partir de l’équation \eqref{eq:def-tau_n}, on trouve:

(66)#\[\begin{equation} \lambda = \sqrt{\frac{1}{3}\left(\frac{5163.7~\mathrm{s}}{\tau}-1\right)}. \end{equation}\]

On peut alors faire une propagation d’erreur pour trouver l’erreur sur $\lambda$:

\[ \Delta \lambda = \sqrt{\left(\frac{\mathrm{d}\lambda}{\mathrm{d}\tau}\right) ^2 \Delta \tau ^2} \]

\[ = \Delta \tau \sqrt{\left(\frac{1}{3}\frac{5163.7~\mathrm{s}}{-\tau ^2 }\right)^2} \]

\[ = \frac{5163.7}{3}\frac{\Delta \tau}{\tau ^2}. \]

On calcule toutes les valeurs de $\lambda$ associées aux mesures de $\tau_n$.

from math import sqrt
def compute_lambda(tau):
    return sqrt((5163.7/tau-1)/3.)
def compute_errlambda(tau, errtau):
    return errtau/(tau**2)*5163.7/3
tau_1972 = 918 # s
tau_1978 = 881 # s
tau_1980 = 937 # s
tau_1989 = 887.6 # s
errtau_1972 = 14 # s
errtau_1978 = 8 # s
errtau_1980 = 18 # s
errtau_1989 = 3.0 # s

lambda_1972 = compute_lambda(tau_1972)
errlambda_1972 = compute_errlambda(tau_1972, errtau_1972)
lambda_1978 = compute_lambda(tau_1978)
errlambda_1978 = compute_errlambda(tau_1978, errtau_1978)
lambda_1980 = compute_lambda(tau_1980)
errlambda_1980 = compute_errlambda(tau_1980, errtau_1980)
lambda_1989 = compute_lambda(tau_1989)
errlambda_1989 = compute_errlambda(tau_1989, errtau_1989)

print("lambda(1972)={:.2f}+-{:.2f}".format(lambda_1972, errlambda_1972))
print("lambda(1978)={:.2f}+-{:.2f}".format(lambda_1978, errlambda_1978))
print("lambda(1980)={:.2f}+-{:.2f}".format(lambda_1980, errlambda_1980))
print("lambda(1989)={:.2f}+-{:.2f}".format(lambda_1989, errlambda_1989))

On va calculer la valeur de $A$ pour chaque valeur de $\lambda$ en utilisant l’équation (64). Avec une propagation des erreurs sur $A$, on en déduit que:

\[ \Delta A = \sqrt{ \Delta\lambda^2 \left( \frac{2(1-2\lambda)}{1+3\lambda ^2} - \frac{6\lambda\times 2\lambda\times(1-\lambda)}{(1+3\lambda^2)^2} \right)^2} \]

\[ = \left\vert \frac{2-4\lambda-6\lambda^2}{1+3\lambda^2}\right\vert\Delta\lambda. \]

def compute_A(l):
    return (2*l*(1-l)/(1+3*l**2))
def compute_errA(l, errl):
    return sqrt(((2-4*l-6*l**2)/((1+3*l**2)**2))**2)*errl

A_1972 = compute_A(lambda_1972)
errA_1972 = compute_errA(lambda_1972, errlambda_1972)
A_1978 = compute_A(lambda_1978)
errA_1978 = compute_errA(lambda_1978, errlambda_1978)
A_1980 = compute_A(lambda_1980)
errA_1980 = compute_errA(lambda_1980, errlambda_1980)
A_1989 = compute_A(lambda_1989)
errA_1989 = compute_errA(lambda_1989, errlambda_1989)

print("A(1972)={:.2f}+-{:.2f}".format(A_1972, errA_1972))
print("A(1978)={:.2f}+-{:.2f}".format(A_1978, errA_1978))
print("A(1980)={:.2f}+-{:.2f}".format(A_1980, errA_1980))
print("A(1989)={:.3f}+-{:.3f}".format(A_1989, errA_1989))

Toutes les valeurs semblent plus ou moins consistantes avec la théorie. Cependant certaines valeurs notamment celle de 1989 et 1980 semblent peu consistentes (vu la faible barre d’erreur sur la mesure de 1989).

import matplotlib.pyplot as plt
list_annees = [1972,1978, 1980, 1989]
list_A = [A_1972, A_1978, A_1980, A_1989]
list_errA = [errA_1972, errA_1978, errA_1980, errA_1989]

fig, axs = plt.subplots(sharey=True, tight_layout=True)
axs.errorbar(list_annees, list_A, yerr=list_errA, fmt = 'o')
axs.set_xlabel("Année")
axs.set_ylabel("A")
axs.axhline(y=-0.1146, color='r', linestyle='-')

lambda(1972)=1.24+-0.03
lambda(1978)=1.27+-0.02
lambda(1980)=1.23+-0.04
lambda(1989)=1.27+-0.01
A(1972)=-0.11+-0.01
A(1978)=-0.12+-0.01
A(1980)=-0.10+-0.01
A(1989)=-0.116+-0.002

<matplotlib.lines.Line2D at 0x7f0c51cdfdc0>

BKP+78: L. N. Bondarenko, V. V Kurguzov, Yu. A. Prokofev, E. V. Rogov, and P. E. Spivak. Measurement of the Neutron Half Time. Pisma Zh. Eksp. Teor. Fiz., 28:328–333, 1978.
BDH+86: P. Bopp, D. Dubbers, L. Hornig, E. Klemt, J. Last, H. Schütze, S. J. Freedman, and O. Schärpf. Beta-decay asymmetry of the neutron and $\frac g_Ag_V$. Phys. Rev. Lett., 56:919–922, Mar 1986. doi:10.1103/PhysRevLett.56.919.
BMS+80: J. Byrne, J. Morse, K.F. Smith, F. Shaikh, K. Green, and G.L. Greene. A new measurement of the neutron lifetime. Physics Letters B, 92(3):274–278, 1980. doi:10.1016/0370-2693(80)90262-2.
CNB+72: C. J. Christensen, A. Nielsen, A. Bahnsen, W. K. Brown, and B. M. Rustad. Free-neutron beta-decay half-life. Phys. Rev. D, 5:1628–1640, Apr 1972. doi:10.1103/PhysRevD.5.1628.
MAB+89: W. Mampe, P. Ageron, C. Bates, J. M. Pendlebury, and A. Steyerl. Neutron lifetime measured with stored ultracold neutrons. Phys. Rev. Lett., 63:593–596, Aug 1989. doi:10.1103/PhysRevLett.63.593.

1: Cette quantité $\lambda$ correspond au rapport entre les couplages axiaux et vectoriels pour l’interaction faible.

Physique Expérimentale 2

Notion d’erreur sur une mesure

Contents