Reconstitution des mesures manquantes du pluviomètre de Ligneville

 

     La durée des chroniques des précipitations la plus complète dont nous disposons pour les 3 stations retenues (Neufchâteau, Belmont et Ligneville), comprise du 02/12/2011 à 23h00 au 29/12/2011 à 23h00, est relativement courte (figure 1.8). Seules les mesures enregistrées à la station de Ligneville entre le 23/12 à 18h00 et le 24/12 à 09h00 sont manquantes.

 

Figure 1.8 : Chroniques des précipitations enregistrées à Belmont et Ligneville, du 02 au 29 décembre 2011

 

    Pour reconstituer les mesures manquantes de Ligneville, nous pouvons utiliser une méthode de régression linéaire de la variable aléatoire de Ligneville (que nous noterons Y) par rapport à celle d'une série complète d’une autre station (variable aléatoire notée X), et qui présente une bonne corrélation avec les mesures de Ligneville.

    A ce titre, nous aurions pu utiliser les mesures de la station de St-Ouen, celle-ci étant la mieux corrélée avec Ligneville (ρ=0,9), ou bien celle de Mirecourt (ρ=0,847), mais ces valeurs de corrélation restent très relatives étant donné que les chroniques de mesures dont nous disposons pour ces deux stations sont, elles aussi, incomplètes. 

    Aussi, nous choisirons la station de Belmont-Sur-Vair, celle-ci étant complète et bien corrélée avec la station de Ligneville (ρ=0,856). De plus, sa proximité avec Ligneville limitera les écarts liés aux variations locales des précipitations.

    L’ensemble des mesures Yi de Ligneville pourront ainsi être approchées par un estimateur optimal sans biais que nous noterons y* et qui représente les valeurs les plus probables de Y (en particulier les valeurs manquantes), étant donné que nous connaissons celles, réelles, de Belmont-Sur-Vair (variable aléatoire X).

Cet estimation peut s’écrire :

Yi= y* + ε    où  ε  représente l’erreur d’estimation commise sur les valeurs réelles de Y (en supposant toutefois que les variables aléatoires X et Y présentent une densité de probabilité de type « gaussienne »)

Cet estimateur « idéal »,qui décrit en fait l’équation d'une droite de régression (voir figure 1.9), est défini par  :   

y* = a.X + b   avec les coefficients   a = ρXYYX    et    b = mY–a.mX

 

            

Figure 1.9 : Régression linéaire de la série de mesures des précipitations de Ligneville par celle de Belmont

 

    Pour évaluer la précision de l’approximation des données de Y par rapport à X, il peut-être utile de définir une « bande de confiance » autour de l’estimateur y* à l’intérieur de laquelle on considère que les données de Y par rapport à X seront estimées avec une certaine probabilité.

     Ici, nous représentons la bande de confiance à 80% délimitée respectivement par deux droites : celle de l’indice de confiance à -80% (limite inférieure) et celle de l’indice de confiance à + 80% (limite supérieure).

Rappelons la formule permettant de calculer ces indices de confiance :

IC(±80%) (Y/X) = [y*± 1,28.σε] = [ ax + b.1,28.σε]

où ±1,28 représente la valeur des abcisses correspondant à l’intervalle qui délimiterait une surface de 80% de l’aire définie par la densité de probabilité d’une Loi Normale centrée réduite (évolution de forme Gaussienne selon notre hypothèse précédente).

    L'écart-type RMS (Root Mean Square), qui représente le carré des écarts par rapport à la moyenne (ici la droite de l’estimateur y*), est donné par :   σε²=σy²(1-ρxy²)

    Parmi l’ensemble des 674 points (X ;Y), 21 d’entre eux sont situés au dessus de la bande de confiance à 80% et 15 en-dessous, ce qui représente un taux d’erreur global de 5,3 % seulement. Aussi, la formule de l’estimateur y* nous permet de réaliser une estimation relativement correcte des données manquantes de la série d’enregistrements de Ligneville (figure 1.10 ci-dessous).

 

                   

Figure 1.10 : Mesures des précipitations reconstituées de Ligneville

 

    Les mesures de précipitations reconstituées de Ligneville, ainsi que celles, déjà complètes, de Neufchâteau et de Belmont-Sur-Vair, seront donc utilisées avec leurs coefficients de pondération respectifs comme base de référence (« Time-séries Data : Precipitation gages »)  dans le système HEC-HMS.