Caractérisation statistique du régime du fleuve

Accédez directement aux sous-parties :
  1. Les données analysées
  2. Les programmes

Les données analysées

Les données analysées sont celles qui ont été présentées précédemment : les hauteurs d'eau journalières (1970-2006) et les débits mensuels (1902-2006). Nous les avons ensuite réorganisé pour calculer les quantiles comme présenté ci-dessous :

  1. Débits

    1. Quantiles annuels (105 débits annuels classé par année)

       

    2. Quantiles mensuels (12 débits mensuels des 105 années disponibles classé par mois)

       

    3. Quantiles journaliers (358 débits journaliers des 35 années disponibles obtenus à partir de la courbe de tarage et classé par jour)


  1. Hauteurs d'eau

    1. Quantiles journaliers (358 débits journaliers des 35 années disponibles)


Haut de page

Les programmes

Le programme de la loi Gamma

 

Le programme "Gamma" est un programme Matlab permettant de réaliser un ajustement statistique des paramètres de la loi Gamma par la méthode des moments sur les données fournisses directement à ce programme.

 

La méthode des moments

La méthode des moments consiste à égaler les moments échantillonnage et les moments théoriques de la loi choisie. Soit l'échantillon de données à disposition. Posons

 

Les deux premiers moments théoriques de la loi de Gumbel s'expriment à partir des paramètres de position et d'échelle de la manière suivante :

 

Le programme permet également de faire les tests suivants et de récupérer les résultats :

Le test chi-carré de Person

Ce test est appliqué dans une situation où l'on observe la répartition de n objets dans I classes. Il est utilisé pour tester l'hypothèse que la répartition des données s'effectue selon une distribution théorique. On se pose donc la question de l'adéquation d'une distribution théorique à des données.

Pour tester l'adéquation d'une répartition théorique, on dispose de deux éléments. D'une part,n observations réparties dans I cellules. Cela se résume par :

(n1, n2 ....ni ) ou ni c'est le nombre d'observations dans la ieme cellule

(p1, p2 ....pi ) une distribution théorique qui fixe la probabilité de chaque cellule.

(n1 p1,n2 p2 ....ni pi ) appelé le Test du score de Person qui mesure de la distance entre la répartition empirique et la loi théorique.


Ensuite on calcule:

L'hypothèse nulle que l'on teste avec le test de Pearson est Ho : " La distribution théorique est la vraie distribution sous-jacente aux données ". On peut démontrer que : la distribution de la statistique de Pearson sous l'hypothèse est bien approchée par une loi χ2I-1 (chi-carré avec I-1 degrés de liberté, si le nombre espéré ni pi est suffisamment grand (>=5).

On rejette donc l'hypothèse nulle si

Pearsonobs >qχ2I-1(95%) où qχ2I-1(95%) est le 95%-quantile d'une loi χ2I-1.

La figure ci-dessous illustre le principe de ce test.

 

Le test de Kolmogorov-Smirnov

Le test de Kolmogorov-Smirnov consiste à mesurer, pour une variable aléatoire continue, la plus grande distance entre la distribution théorique Fo(x) et la distribution expérimentale F(x). Nous avons donc H0: F(x) = Fo(x) et H1: F(x) Fo(x) pour au moins une valeur de x. La distribution empirique, ou observée, se calcule, dans la théorie de Kolmogorov-Smirnov, par la relation classique, et aussi nous definions le statisque d:

Ce programme permet donc de générer un fichier de données ("table.donnees") regroupant tous les résultats issus de l'analyse statistique.

Les résultats obtenus pour chaque groupe de données analysés sont :

[n N med mean sigma cv rho lambda DXbin PROB PROBKS]

n = le numéro de l'échantillon (par exemple, pour une étude mensuel il y aura 12 échantillons, un pour chaque moi de l'année)

N = nombre de données appartenant à l'échantillon

med = Mediane, est la valeur de la variable qui laisse le même nombre de données d'avance et après qu'il, une fois ordonnés ceux-ci. Conformément à cette définition l'ensemble de données les moindres ou égales que la médiane 50 % des données représenteront, et ceux qui sont plus grands que la médiane représenteront l'autre 50 % du total des données de l'échantillon.

mean = moyenne

sigma = écart type

rho et lambda sont les praramètres d'ajustement de la loi Gamma que nous allons par la suite utiliser pour générer les quantiles.


Haut de page

Le programme des quantiles

Les quantiles sont des points essentiels pris à des intervalles réguliers verticaux d'une fonction de distribution cumulative d'une variable aléatoire. Donc nos quantiles représentent à la probabilté de non-dépassement pour un pourcentage donné. Par exemple, le quantile 1 % (en bleu foncé) signifie que seulement le 1% de nos données seront inférieur à cette valeur, ou inversement, 99% de nos donnes seront supérieur à cette valeur.

Les quantiles sont des mesures utiles parce qu'elles sont moins sensibles aux distributions allongées et aux valeurs aberrantes et permettent de récupérere plus d'information que la moyenne.

Grâce aux paramètres de la loi gamma, rho et lambda, obtenus précédemment, nous allons calculer les différents quantiles 1%,5%,30%,50%,70%,95% et 99% pour les chroniques de débits et de hauteurs d'eau disponibles.


Haut de page