Méthodes statistiques

Méthodes statistiques

Après le bilan hydrologique, utiliser une modélisation fréquentielle statistique nous semblait la plus pertinente pour comprendre le fonctionnement du sous bassin versant ainsi que pour estimer des débit de références et ce, afin d'étudier l'innondabilité de la STEP.

Le problème vient du fait que nous ne disposons que des données de débit du Sègre. Nous allons donc effectuer notre approche fréquentielle sur les débits du Sègre, puis, nous chercherons dans une deuxième partie à estimer les débits pour l'Angoust, Estahuja et pour le bassin versant global.

Approche fréquentielle pour le Sègre.

Approche fréquentielle pour le Sègre      

 

Cette approche fréquentielle vient à la suite d'un long travail de collecte de données et de reconstitution de données manquantes (voir traitement des données), afin de pouvoir élaborer une densité de probabilité avec les débits collectés. Nous présentons ci dessous la densité de probabilité obtenue:

Comme nous pouvons le remarquer sur la figure ci-dessus, notre bassin versant semble avoir deux comportements différents, un pour des débit assez faibles, autour de 0,5 m3/s et un autre autour de 1,4 m3/s. En effet, nous avons pu constater ces changements de comportement durant notre période de collecte des données: les débits changeaient d'amplitude entre le mois de mars et le mois de juin, ceci est principalement du à la fonte de neige. La fonte de neige va ajouter une quantité d'eau en plus de la quantité présente, nous pouvons déjà sentir la difficulté de modéliser correctement le comportement de notre bassin versant. Nous avons donc un comportement bimodal. C'est pour cela que l'ajustement avec une seule loi de probabilité ne semble pas la meilleure solution. Nous avons alors essayé de filtrer ces modes en prenant les échantillons de débits seulement entre le mois de mars et de juin puis en essayant de les ajuster avec la loi log-normale, la loi de Gumbel et la loi normale, sachant que notre échantillon n'est pas trop asymétrique et que ces lois ont été préconisées pour les études hydrologiques. Voici donc ce que nous obtenons avec la figure au dessous:

Nous remarquons sur ce graphe de densité que nous n'avons pas vraiment filtré le bruit provenant du premier mode. Nous avons donc décidé d'enlever les débits du mois de mars et de ne prendre que les mois d'avril, mai et juin de chaque année. Cela afin de voir si nous arrivons à enlever le bruit dû au premier mode, nous obtenons le graphe suivant:

Comme nous le voyons sur le graphe, il est très difficile de dire quelle est la loi qui représente le mieux ce mode, il aurait été souhaitable de faire un filtrage plus fin que celui effectué mais faute de temps, cela n'a pas été étudié. Nous avons choisi de prendre la loi de Gumbel comme celle s'approchant le plus entre la loi normale et la loi log-normale, qui sont toutes deux dissymétriques par rapport au spectre. Nous allons donc décrire le spectre représentant le moment de la fonte des neiges, et qui est à l'origine de ce petit mode, par une fonction de Gumbel ajustée par les moments soit:

$$f_1(x)=exp(-exp(-{{x-\mu }\over \sigma}))$$.

Pour l'autre mode, nous avons effectué le même traitement probabiliste que précédemment avec les autres mois de l'année. Nous obtenons le graphe suivant:

 

Dans ce cas et visiblement mieux que pour le cas précédent, nous remarquons que la loi log-normale représente bien le mode, en tout cas mieux que les deux autres lois. C'est pour cela que nous garderons cette loi pour la représentation de ce mode soit:

$$f_2(x)={1 \over x \sigma {\sqrt 2 \pi}}{exp -{ (ln(x) - \mu)^2 \over 2 \sigma^2} }$$

Pour envelopper tout le spectre durant l'année, nous avons créé une nouvelle fonction pour représenter la densité de probabilité:

$$f(x)= a_1 f_1(x)+a_2 f_2(x) \ avec\  a_1+a_2=1$$.

Nous avons testé plusieurs valeurs pour a1 et a2. Nous avons vu que pour a1= 0,15 et a2 = 0,85, les valeurs correspondaient le mieux à notre densité de probabilité. Nous obtenons alors le graphe suivant:

Nous remarquons que par rapport aux simples lois de probabilités, la loi ajustée avec la loi log normale et la loi de Gumbel (courbe en rouge) représente mieux la densité de probabilité. Il est vrai que la manière dont cette fonction a été choisie est très simpliste. Le mieux aurait été de multiplier les fonction par un dirac, mais la construction étant compliquée, nous avons choisi de garder ce mode de représentation. Pour déterminer des débits de référence, nous avons tracé la fonction de répartition représentée ici: 

Nous résumons sur ce petit tableau les résultats obtenus grâce à cette étude statistique, les débits de référence du Sègre:

Débits de référence du Sègre

Débits Décennal Cinquantennal  Centennal  Millénal
Valeurs(m3/s) 0,78 1,03 1,58 2,44

 

Détermination des débits de référence à l'Angoust et Estahuja

Détermination des débits de référence à l'Angoust et Estahuja

 

Comme nous l'avons vu dans la partie précédente, nous avons réussi à déterminer les débits de références pour le Sègre. Par contre, il y aussi une possibilité de plantation de la station d'épuration d'eau sur la rive de l'Angoust, d'Estahuja ainsi que près de la confluence entre l'Angoust et le Sègre. C'est pour cela qu'il est important de déterminer les débit de référence pour ces cours d'eau. Dans notre cas présent, nous ne disposons d'aucunes données ou de mesures sur ces deux rivières, une fois de plus nous allons vous présenter quelques moyens statistiques qui nous permettent d'avoir une estimation des débits sur ces points.

En contactant plusieurs bureaux d'étude dans la région à propos du manque de données, nous avons appris que la méthode utilisée était celle qui consistait à dire que le débit spécifique Qs se conservait. Cette méthode nous semblait critiquable, surtout d'un point de vue hydrologique. Suite à notre travail effectué dans les parties antérieures avec les outils statistiques, nous savons que notre bassin versant a un comportement assez spécial. Nous avons décidé de travailler sur quelques données. Sur les conseils de Monsieur Rachid Ababou, nous avons décidé de changer la forme du débit spécifique et de prendre la forme suivante:

 $Q \over S^\alpha$ = Cste

Avec $\alpha$ variant de 0,4 à 1 selon les bassin hydrologiques. C'est la relation connue sous le nom de la relation de Meyer. Nous avons cherché des valeurs de $\alpha$ dans la littérature et nous avons trouvé que la valeur de 0,8 était la plus adéquate dans notre cas. Puis, dans un second temps, nous avons voulu affiner cette donnée, grâce à des outils statistiques, ainsi qu'en cherchant un comportement similaire à un autre bassin versant de la région. L'idée consistait à dire que le débit ne dépendait pas seulement de la surface ou de la situation géographique du bassin versant mais aussi de la pluviométrie. Nous avons donc créé une interpolation linéaire entre le nouveau débit spécifique et la pluviométrie, nous obtenons le graphe suivant:

         

Nous remarquons que l'interpolation linéaire est mauvaise, surtout quand nous regardons la forme des résidus, qui ne convergent pas vers zéro, voir même qui divergent. De plus, le coefficient directeur de la régression linéaire est trop petit, il est donc très difficile de prendre en compte cette loi. Ce graphe nous a montré non seulement la difficulté de créer un outil statistique pour estimer les débits dans les autres rivières souffrant d'un manque de données mais aussi que le comportement de notre bassin versant était très spécial. C'est pour cela et par manque de temps, que nous avons estimé judicieux de prendre la relation de Meyer comme première approche pour estimer les débit des références dans l'Angoust et Estahuja:

Débit (m3/s) Décennal Cinquantennal Centennal Millénal
Angoust 1.01 1.33 2.05 3.18
Estahuja 0.50 0.66 1.03 1.58

Comme il a été expliqué dans la partie sur GR4J, nous avions à disposition des données de débit pour l'Angoust sur une journée en 2010, grâce aux stations de relevage de la qualité des eaux. Pour cette journée, le débit pour l'Angoust était plus faible que celui du Sègre, ce qui n'est pas le cas avec la formule de Meyer. Avec plus de temps à disposition, il serait donc nécessaire de chercher une autre moyen de modéliser le débit des autres cours d'eau. De plus, nous n'avons le débit que sur une journée en 2010, cela ne signifie pas que le débit de l'Angoust est toujours inférieur à celui du Sègre. Nous garderons la formule de Meyer pour la suite de l'étude, en justifiant du bon ordre de grandeur trouvé.

Comme nous avons pu le voir dans cette partie, il nous semblait primordial de comprendre le comportement du bassin versant, pour pouvoir étudier l'inondabilité de la STEP. C'est pour cela que nous avons essayé de modéliser le bassin versant, hydrologiquement parlant, dans la partie suivante.