{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Histogrammes, étude statistique et incertitude-type de répétabilité\n", "\n", "**Comment tracer un histogramme, réaliser une étude statistique et calculer une incertitude-type de répétabilité (type A) sous Python?**\n", "\n", "code sous licence creative commun CC BY-NC-SA BY Gaëlle Rebolini" ] }, { "cell_type": "raw", "metadata": { "raw_mimetype": "text/restructuredtext" }, "source": [ ":download:`Télécharger le pdf <./13-histogramme.pdf>`\n", "\n", ":download:`Télécharger le notebook <./13-histogramme.ipynb>`\n", "\n", ":download:`Lancer le notebook sur binder (lent) `" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Ceci est un petit tutoriel permettant de tracer des histogrammes, de déterminer une valeur moyenne, un écart-type et une incertitude-type de répétabilité (type A) à partir d'un échantillon de valeurs. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Voici un programme exploitant des mesures de volume réalisées à l'éprouvette graduée. On mesure le plus précisément possible 50 mL d'eau à l'aide d'une éprouvette graduée. Puis, on pèse cette eau et on en déduit par un simple calcul faisant intervenir la masse volumique, le volume d'eau correspondant avec une meilleure précision. On réalise la manipulation un grand nombre de fois, ce qui nous permet d'obtenir un échantillon de valeurs.\n", "\n", "Dans un premier temps, vous est présenté le programme complet. Les lignes de code seront explicitées dans un second temps." ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "Le volume moyen : 49.506249999999994 mL\n", "L'écart-type vaut : 0.8814042418209694 mL\n", "Le nombre de mesures vaut : 16\n", "L'incertitude-type de répétabilité de deltat vaut : 0.22035106045524236 mL\n" ] } ], "source": [ "import numpy as np \n", "import matplotlib.pyplot as plt\n", "%matplotlib inline\n", "Veprouvette =[49.61,49.55,50.91,50.87,48.03,50.29,48.58,48.06,50.06,50.72,48.95,49.4,49.21,49.31,49.78,48.77]\n", "plt.figure(figsize=(12,10))\n", "plt.hist(Veprouvette,bins=20,range=(45,55),align=\"mid\",rwidth=0.9,color=\"b\",edgecolor=\"red\",label=\"éprouvette\")\n", "plt.title(\"Volume d'eau contenu par une éprouvette graduée pour 50mL mesuré\")\n", "plt.xlabel(\"Volume (mL)\")\n", "plt.ylabel(\"Fréquence\")\n", "plt.legend()\n", "plt.show()\n", "\n", "\n", "Vmoy=np.mean(Veprouvette)\n", "ecarttype=np.std(Veprouvette)\n", "effectif=len(Veprouvette)\n", "incertitudetype=ecarttype/np.sqrt(effectif)\n", "print(\"{0:55}\".format(\"Le volume moyen :\"),Vmoy,\"mL\")\n", "print(\"{0:55}\".format(\"L'écart-type vaut :\"),ecarttype,\"mL\")\n", "print(\"{0:55}\".format(\"Le nombre de mesures vaut :\"),effectif)\n", "print(\"{0:55}\".format(\"L'incertitude-type de répétabilité de deltat vaut :\"),incertitudetype,\"mL\")\n", " " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## EXPLICATIONS DU PROGRAMME" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Attention à bien exécuter les cellules de code suivantes les unes après les autres. Il est normal que rien ne s'affiche lors de l'exécution de certaines cellules. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Import des bibliothèques utiles" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "import matplotlib.pyplot as plt # bibliothèque obligatoire pour créer des graphiques\n", "import numpy as np # bibliothèque utile pour déterminer la valeur moyenne, l'écart-type \n", " # et l'incertitude-type de répétabilité" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Création de la liste contenant les valeurs de l'échantillon" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Pour créer un histogramme puis réaliser l'étude statistique sous Python, il faut tout d'abord créer une liste contenant les valeurs de l'échantillon. \n", "\n", "On peut aussi créer un tableau numpy grâce à la fonction np.array() de la bibliothèque numpy as np." ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [], "source": [ "Veprouvette =[49.61,49.55,50.91,50.87,48.03,50.29,48.58,48.06,50.06,50.72,48.95,49.4,49.21,49.31,49.78,48.77] " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Comment créer et paramétrer un histogramme\n", "\n", "On commence par créer une fenêtre graphique aux dimensions souhaitées grâce à la méthode **plt.figure(num, figsize, dpi)** de la bibliothèque **matplotlib.pyplot** as **plt**. Pour plus d'informations, se référer au notebook graphiques_partie_1.\n", "\n", "Puis on crée l'histogramme à l'aide de la méthode **plt.hist(x,bins,range,align,orientation,rwidth,log,color,edgecolor,label)** de la bibliothèque **matplotlib.pyplot** as **plt**\n", "\n", "Voici les principaux paramètres de cette méthode, sachant qu'il n'est pas obligatoire de tous les spécifier. Dans ce cas, ils prendront leur valeur par défaut. \n", "D'autres paramètres existent, pour plus d'informations : \n", "https://matplotlib.org/api/_as_gen/matplotlib.pyplot.hist.html?highlight=hist#matplotlib.pyplot.hist\n", "\n", "- **x** : tableau contenant les valeurs de l'échantillon\n", "- **bins** : le nombre d'intervalles donc de barres ; optionnel, la valeur par défaut est 10.\n", "- **range** : donne les valeurs limites de l'axe des abscisses (xmin,xmax) ; optionnel\n", "- **align** : {'left', 'mid', 'right'}; optionnel, La valeur par défaut est 'mid'\n", "\n", " 'left': la barre est centrée sur le côté gauche de l'intervalle\n", " 'mid': la barre est centrée sur le centre de l'intervalle\n", " 'right': la barre est centrée sur le côté droit de l'intervalle\n", " \n", "- **orientation** : {'horizontal', 'vertical'}; optionnel, la valeur par défaut est 'vertical'\n", "- **rwidth** : largeur des barres sous la forme d'une fraction de l'intervalle ; optionnel, la valeur par défaut est 1.\n", "- **log** : booléen, permet d'afficher une échelle logarithmique pour l'axe des abscisses si log=True ; optionnel, valeur par défaut :False \n", "- **color** : couleur des barres ; optionnel\n", "- **edgecolor** : couleur du contour des barres ; optionnel\n", "- **label** : permet de légender l'histogramme ; optionnel. Attention, son utilisation nécessite l'appel de la méthode **plt.legend()** dans la suite du programme\n", "\n", "On peut ensuite afficher un titre, légender les axes de l'histogramme tout comme on le ferait sur un graphique grâce aux méthodes **plt.title(), plt.xlabel(), plt.ylabel()...** \n", "Enfin, on affiche l'histogramme grâce à la méthode **plt.show()**.\n", "\n", "Pour plus d'informations concernant ces dernières méthodes, se référer au notebook graphiques_partie_1." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Premier exemple : Utilisation de la méthode plt.hist() sans passage de paramètre" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.figure(figsize=(12,10))\n", "plt.hist(Veprouvette)\n", "plt.title(\"Volume d'eau contenu par une éprouvette graduée pour 50mL mesuré\")\n", "plt.xlabel(\"Volume (mL)\")\n", "plt.ylabel(\"Fréquence\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Deuxième exemple : Utilisation de la méthode plt.hist() avec passage de paramètres" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.figure(figsize=(12,10))\n", "plt.hist(Veprouvette,bins=20,range=(45,55),align=\"mid\",rwidth=0.9,color=\"y\",edgecolor=\"r\",label=\"éprouvette\")\n", "plt.title(\"Volume d'eau contenu par une éprouvette graduée pour 50mL mesuré\")\n", "plt.xlabel(\"Volume (mL)\")\n", "plt.ylabel(\"Fréquence\")\n", "plt.legend()\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Et si l'on veut afficher plusieurs histogrammes dans la même fenêtre graphique?\n", "\n", "Il suffit d'appeler la méthode **plt.hist()** autant de fois que nécessaire. Les paramètres sont alors très utiles!\n" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "Vbecher=[50.65,48.26,47.83,47.76,50.26,47.23,43.88,43.92,48.69,48.66,43.67,47.53,49.55,50.64,43.8,48.53]\n", "Veprouvette =[49.61,49.55,50.91,50.87,48.03,50.29,48.58,48.06,50.06,50.72,48.95,49.4,49.21,49.31,49.78,48.77]\n", "Vfiole=[49.74,49.77,49.71,49.75,49.52,49.8,49.61,49.56,49.65,49.65,49.52,49.64,49.74,49.81,49.5,49.59]\n", "plt.figure(figsize=(12,10))\n", "plt.hist(Vbecher,bins=32,range=(43,51),align=\"left\",rwidth=0.3,color=\"r\",label=\"becher\")\n", "plt.hist(Veprouvette,bins=32,range=(43,51),align=\"mid\",rwidth=0.3,color=\"b\",label=\"éprouvette\")\n", "plt.hist(Vfiole,bins=32,range=(43,51),align=\"right\",rwidth=0.3,color=\"g\",label=\"fiole jaugée\")\n", "plt.title(\"Volume d'eau contenu par un bécher, une éprouvette graduée ou une fiole jaugée pour 50mL mesuré\")\n", "plt.xlabel(\"Volume (mL)\")\n", "plt.ylabel(\"Fréquence\")\n", "plt.legend()\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Détermination de la moyenne, de l'écart-type, de l'effectif et de l'incertitude-type de répétabilité (ou incertitude de type A)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "On utilise les fonctions de la bibliothèque **numpy** as **np**:\n", "\n", "- la fonction **np.mean(x)** permet de calculer la valeur moyenne de l'échantillon x\n", "- la fonction **np.std(x)** permet de calculer l'écart-type de l'échantillon x\n", "- la fonction **np.sqrt(a)** permet de calculer la racine carrée du nombre a et sera utile lors du calcul de l'incertitude-type de répétabilité.\n", "\n", "La fonction **len(x)** permet de calculer l'effectif (nombre de valeurs) de l'échantillon x.\n", "\n", "Pour ces trois fonctions, x peut être un tableau, un p-uplet (tuple en anglais), un tableau numpy. Pour plus de renseignements sur les listes, tuples ou les tableaux numpy, se référer aux **notebooks Listes** et **Tableaux numpy**.\n", "\n", "L'incertitude-type de répétabilité a pour formule $U(x)=\\frac{écart-type(x)}{\\sqrt{effectif(x)}}$\n", "\n", "Attention, ce programme n'arrondit pas les valeurs et n'exprime pas avec le bon nombre de chiffres significatifs la valeur moyenne et l'incertitude-type. " ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Le volume moyen : 49.506249999999994 mL\n", "L'écart-type vaut : 0.8814042418209694 mL\n", "Le nombre de mesures vaut : 16\n", "L'incertitude-type de répétabilité de deltat vaut : 0.22035106045524236 mL\n" ] } ], "source": [ "Vmoy=np.mean(Veprouvette)\n", "ecarttype=np.std(Veprouvette)\n", "effectif=len(Veprouvette)\n", "incertitudetype=ecarttype/np.sqrt(effectif)\n", "\n", "print(\"{0:55}\".format(\"Le volume moyen :\"),Vmoy,\"mL\")\n", "print(\"{0:55}\".format(\"L'écart-type vaut :\"),ecarttype,\"mL\")\n", "print(\"{0:55}\".format(\"Le nombre de mesures vaut :\"),effectif)\n", "print(\"{0:55}\".format(\"L'incertitude-type de répétabilité de deltat vaut :\"),incertitudetype,\"mL\")" ] } ], "metadata": { "celltoolbar": "Format de la Cellule Texte Brut", "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.9" } }, "nbformat": 4, "nbformat_minor": 4 }