La statistique appliquée à l'hydrologie

Contexte

Dans le domaine de la recherche scientifique l'inquiétude est commune pour essayer d'exprimer l'évolution d'un phénomène déterminé au moyen d'une série de mesures, qui la traduisent en langage des nombres.

Dans le domaine de la recherche scientifique l'inquiétude est commune pour essayer d'exprimer l'évolution d'un phénomène déterminé au moyen d'une série de mesures, qui la traduisent en langage des nombres.

La statistique constitue alors un outil indispensable pour effectuer ce traitement, afin de tirer profit au mieux de toutes ces informations (principalement des mesures des débits et des précipitations en ce qui nous concerne).

On peut distinguer deux branches de la statistique :

  • La statistique descriptive : essaie de décrire, c'est à dire de résumer ou de représenter, par des statistiques, les données disponibles quand elles sont nombreuses.

  • La statistique mathématique essaie d'aller plus loin en se basant sur des comparaisons entre les modèles probabilistes théoriques et les données recueillies expérimentalement. Elle permet donc d'obtenir des renseignements, que l'on aurait pas obtenus par la simple observation des données. Sur cette base, une théorie mathématique s'est développée, basée sur la théorie de probabilités, dont la statistique mathématique peut se considérer comme une application pratique.

Les données hydrologiques, ainsi que leur organisation statistique, peuvent permettre, entre autres applications pratiques, le dimensionnement de constructions étant en relation avec des ressources hydriques (réservoirs, barrages, captages, œuvres de conduite, centrales hydroélectriques...). Elles peuvent également être utiliser pour prévoir le régime d'exploitation afin d'optimiser l'utilité de ces installations.

En effet, on suppose que le futur régime hydrologique d'une rivière, aura certaines relations avec le régime hydrologique passé de cette même rivière. Ainsi, grâce à l'étude statistique des données, on pourra prévoir le régime futur, avec certaine marge d'erreur.

Les objectif principaux sont donc d'une part, d'identifier les crues extrêmes mais aussi, d'obtenir une évaluation statistique, c'est-à-dire une caractérisation sous forme de pourcentage des données disponibles (journalières, mensuelles et annuelles). On pourra ainsi améliorer notre compréhension et nos connaissances sur le fleuve Congo.


Haut de page

Fonction fréquentielles et probabilité


Nous pourrons obtenir un "histogramme de fréquence", en suivant les trois étapes suivantes

  1. diviser en intervalles discrets les valeurs des données

  2. le nombre d'observations correspond au nombre de données dans chaque intervalle

  3. la forme de presentation sera un hitogramme

 

La largeur Δx de l'intervalle utilisé pour construire l'histogramme de fréquence est choisi de manière à ce qu'un nombre suffisant d'observations se retrouve à l'intérieur de chacun des intervalles de telle manière que les variations de l'histogramme soient suffisamment douces.

 

 

 

 

 

 

 

 

 

 

 

Figure - Années - Quantité de données

 

Si le nombre d'observations "ni" est compris dans l'intervalle "i" des données [xi − Δx , xi ] , et si le nombre total d'observations est "n", alors la Fonction de Fréquence Relative s'écrit :

 

La somme des valeurs des fréquences relatives jusqu'à un point donné est la Fonction de Fréquence Cumulée:

Cette expression constitue une estimation de P( X<=xi ), ou bien la probabilité cumulée de xi.

 

Si nous réalisons le limite de cette expression, on obtient la Fonction de Répartition (FdR):

Et si nous dérivons la Fonction de Répartition nous obtiendrons la Fonction Densité de Probabilité


Haut de page

Concepts generaux de la statistique

  • La moyenne

La moyenne arithmétique d'une quantité finie de nombres, est égal à la somme de tous ces nombres divisée par le nombre de termes.

 

 

  • Espérance

L'espérance mathématique d'une variable aléatoire est l'équivalent en probabilité à la moyenne d'une série statistique en statistiques. Elle se note E(X) et se lit espérance de X. Si X prend un nombre fini n de valeurs réelles: x1, x2, ..., xn avec les probabilités p1, p2, ..., pn alors:

 

 

  • Variance

Dans la théorie des probabilités et statistiques, la variance est une mesure de la dispersion d'une variable aléatoire X par rapport a son espérance. Elle s'exprime donc de la façon suivante:

 

 

  • Écart type

En statistique et en probabilité, l'écart type mesure la dispersion d'une série de valeurs autour de leur moyenne. Si la variable X prend un nombre fini de valeurs réelles x1, x2, ..., xn , avec des probabilités respectives p1, ..., pn, l'écart type est donné par:

 

 

Il existe une relation entre la variance et l'écart type:

 


Haut de page

Models fréquentiels plus utilisés

La validité des résultats d'une analyse fréquentielle dépend du choix du modèle fréquentiel et plus particulièrement de son type. Diverses pistes peuvent contribuer à faciliter ce choix, mais il n'existe malheureusement pas de méthode universelle et infaillible.

  • Loi normale ou Gaussienne

La loi normale se justifie théoriquement par le théorème central-limite, comme la loi d'une variable aléatoire formée de la somme d'un grand nombre de variables aléatoires. En hydrologie fréquentielle des valeurs extrêmes, les distributions ne sont cependant pas symétriques, ce qui constitue un obstacle à son utilisation. De plus cette loi s'applique généralement bien à l'étude des modules annuels des variables hydro-météorologiques en climat tempéré.

 


  • Loi Gamma

 

Cette loi est une distribution à deux paramètres : un facteur de forme β et un facteur d'échelle λ. Elle a une forme qui varie doucement et elle s'utilise pour des variables hydrologiques asymétriques.

  • Loi de Gumbel

 

E.-J. Gumbel postule que la loi double exponentielle, ou loi de Gumbel, est la forme limite de la distribution de la valeur maximale d'un échantillon de n valeurs. Le maximum annuel d'une variable étant considéré comme le maximum de 365 valeurs journalières, cette loi doit ainsi être capable de décrire les séries de maxima annuels.

Il est à remarquer que plus le nombre de paramètres d'une loi est grand, plus l'incertitude dans l'estimation est importante.Il est par conséquent préférable d'éviter l'utilisation de lois à trois paramètres ou plus.


Haut de page