Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR APPROXIMATING METEOROLOGICAL VARIABLES
Document Type and Number:
WIPO Patent Application WO/2011/018578
Kind Code:
A1
Abstract:
The invention relates to a method for approximating a meteorological variable, such as the temperature at any point of a region in the world, from a small number of indicators obtained in said region, said method including analyzing (12) main components of meteorological data recovered in a significant number of stations in the region, defining (18) indices which are weighted averages of data in a small number of stations and which show a strong correlation to the time series of the first main components, the correlations between the indices being small and the vectors formed with the weight for calculating the indices being orthogonal or nearly orthogonal, and approximating (20) the values of the meteorological variable by means of a weighted linear combination of said indices.

Inventors:
FISCHER MARTIN (FR)
Application Number:
PCT/FR2010/051686
Publication Date:
February 17, 2011
Filing Date:
August 10, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
METNEXT (FR)
FISCHER MARTIN (FR)
International Classes:
G01K7/42; G01W1/00
Foreign References:
JP2008058109A2008-03-13
US7069258B12006-06-27
US6424917B12002-07-23
US7249007B12007-07-24
Other References:
None
Attorney, Agent or Firm:
GUTMANN, Ernest et al. (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Procédé d'approximation d'une variable météorologique telle que par exemple la température dans une région du monde, par exemple en Europe, caractérisé en ce qu'il consiste :

à relever et à enregistrer des valeurs de cette variable et/ou des anomalies de cette variable sur une ou sur des périodes données en un certain nombre d'emplacements de cette région et à effectuer une analyse en composantes principales des valeurs enregistrées de cette variable et/ou des anomalies de cette variable ;

à identifier à partir des résultats de cette analyse des groupes d'emplacements dans lesquels les variations des valeurs de la variable ont un comportement similaire, et à choisir un emplacement dans chaque groupe de façon que les valeurs de la variable à cet emplacement représentent une approximation des composantes principales de l'analyse précitée en un nombre minimal d'emplacements ; et

- à approximer une valeur de la variable ou une anomalie de la variable en un point quelconque de la région considérée par une combinaison linéaire pondérée d'indices, ces indices étant des moyennes pondérées des valeurs de la variable aux emplacements choisis de sorte que les indices montrent une bonne corrélation avec les séries temporelles de l'analyse en composantes principales, que les corrélations entre les indices sont faibles et que les vecteurs formés par les poids utilisés pour chaque indice sont orthogonaux ou presque orthogonaux.

2. Procédé selon la revendication 1 , caractérisé en ce que les groupes d'emplacements correspondent aux zones géographiques ayant les amplitudes les plus élevées dans les premières composantes principales de l'analyse précitée.

3. Procédé selon la revendication 1 ou 2, caractérisé en ce que la première composante principale comprend un pôle unique.

4. Procédé selon l'une des revendications précédentes, caractérisé en ce que les deuxième et troisième composantes principales sont des dipôles.

5. Procédé selon l'une des revendications 1 à 4, caractérisé en ce que pour les anomalies de température en Europe, les emplacements choisis sont au nombre de cinq et sont situés à Nuremberg (Europe centrale), Vigo (Sud-Ouest de l'Europe et Ouest méditerranéen), Pescara (bassin méditerranéen), Leba (Europe de l'Est) et Amsterdam (Nord-Ouest de l'Europe).

6. Procédé selon la revendication 5, caractérisé en ce que les indices de température en Europe pour les emplacements choisis sont des moyennes pondérées des anomalies de température selon la formule

(ind1, ind2, ind3) = (tanoi, .... tano5)*A

A étant une matrice dont les composantes sont, pour des anomalies normalisées de température journalières:

[,l] [,2] [,3]

[1,] -0.12025594 0.10184922 0.01330028

[2,] -0.02738203 0.11979894 0.18362434

[3,] -0.05001196 0.12851656 -0.29182618

[4,] -0.08329636 -0.33201439 -0.02303887

[5,] -0.09309122 0.06122933 0.10620130 et sont, pour des anomalies de température mensuelles :

[,l] [,2] [,3]

[1,] -0.19551935 0.2798633 -0.10141862

[2,] -0.04701654 0.4602554 -0.29874588

[3,] -0.11156334 0.2875479 0.61925407

[4,] -0.18758694 -0.6903224 -0.02383865

[5,] -0.15033798 0.1400668 -0.20446550 7. Procédé selon l'une des revendications précédentes, caractérisé en ce que les coefficients de pondération des indices utilisés pour déterminer une valeur de la variable ou une anomalie de la variable en u n point q uelconq ue de l 'Europe sont calculés par régression multivahée.

8. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'analyse en composantes principales est effectuée sur des données journalières et sur des données mensuelles des anomalies de la variable.

9. Indices de température, déterminés par exécution du procédé selon l'une des revendications précédentes et destinés à une estimation de la température ou d'une anomalie de température en un point quelconque de l'Europe, caractérisés en ce qu'ils sont au nombre de trois et comprennent des moyennes pondérées des anomalies de température avec des poids positifs et/ou négatifs de sorte que les indices obtenus montrent une forte corrélation avec les séries temporelles de l'analyse en composantes principales, que les corrélations entre les indices sont faibles et que les vecteurs formés par les poids sont orthogonaux ou presque orthogonaux.

Description:
Procédé d'approximation de variables météorologiques

L'invention concerne un procédé d'approximation d'une variable météorologique telle par exemple que la température en tout point d'une région du monde, telle que l'Europe par exemple, à partir d'un petit nombre d'indicateurs obtenus dans cette région.

Lorsqu'il faut traiter un grand nombre de variables aléatoires, il est connu d'utiliser une méthode mathématique d'analyse en composantes principales (ou empiήcal orthogonal functions EOF en anglais), cette méthode consistant à rechercher dans un espace multidimensionnel des directions qui représentent au mieux des covahances entre les variables.

Si l'on applique cette méthode au traitement de données telles que des variables météorologiques (température, vitesse du vent, précipitations, ...) relevées en un grand nombre de points dans une région donnée, par exemple dans plusieurs dizaines de stations météorologiques installées en Europe, sur une période de temps comprenant un grand nombre de mesures, par exemple de plusieurs dizaines à plusieurs centaines, on obtient des composantes principales dont la première explique la plus grande partie de la vahance de l'ensemble des données qu'on peut exprimer par une seule combinaison linéaire des données. La deuxième composante principale explique la deuxième plus grande partie de la variance des don nées, et ainsi de su ite . Les N prem ières composantes principales expliquent donc la plus grande partie de la variance de l'ensemble des données que l'on peut exprimer par N combinaisons linéaires des données.

Dans le cas des données météorologiques, on constate souvent que les trois ou quatre premières composantes principales expliquent un pourcentage important, par exemple 80%, de la variance totale des données. Le choix optimal pour définir des indices linéaires les mieux adaptés pour mesurer l'évolution de l'ensemble des données serait donc d'utiliser les N premières composantes principales. Il serait toutefois en pratique trop compliqué d'utiliser ces composantes principales comme indices pour approximer une température ou une autre variable météorologique en un point quelconque d'une région. Cette approche nécessiterait l'utilisation des données d'un grand nombre, par exemple de plusieurs dizaines ou centaines, de stations météorologiques de cette région.

L'invention a notamment pour but d'apporter une solution simple et efficace à ce problème.

Elle propose à cet effet un procédé d'approximation d'une variable météorologique, telle par exemple que la température, dans une région du monde, par exemple en Europe, caractérisé en ce qu'il consiste :

à relever et à enregistrer des valeurs de cette variable et/ou des anomalies de cette variable sur une ou sur des périodes données en un certain nombre d'emplacements de cette région et à effectuer une analyse en composantes principales des valeurs enregistrées de cette variable et/ou des anomalies de cette variable ;

à identifier à partir des résultats de cette analyse des groupes d'emplacements dans lesquels les variations des valeurs de la variable ont un comportement similaire, et à choisir un emplacement dans chaque groupe de façon que les valeurs de la variable à cet emplacement représentent une approximation des composantes principales de l'analyse précitée en un nombre minimal d'emplacements ; et

- à approximer une valeur de la variable ou une anomalie de la variable en un point quelconque de la région considérée par une combinaison linéaire pondérée d'indices, ces indices étant des moyennes pondérées des valeurs de la variable aux emplacements choisis de sorte que les indices montrent une bonne corrélation avec les séries temporelles de l'analyse en composantes principales, que les corrélations entre les indices sont faibles et que les vecteurs formés par les poids utilisés pour chaque indice sont orthogonaux ou presque orthogonaux. Ces critères garantissent que les indices représentent une bonne approximation des premières composantes principales, l'invention permettant ainsi :

- d'approximer la valeur de la variable météorologique et/ou une anomalie de cette variable en un point quelconque de la région au moyen d'une combinaison linéaire pondérée d'indices,

- de déterminer ou d'estimer très rapidement avec une bonne précision une valeur ou une anomalie d'une variable météorologique en un point quelconque d'une région considérée à partir d'un nombre minimal d'indices pondérés (ce nombre étant de 3 pour toute l'Europe si l'invention est appliquée aux anomalies de température),

- de surveiller ou quantifier les variations de cette variable dans une région du monde, par exemple l'Europe, en mesurant uniquement un très petit nombre d'indices.

Par définition, une anomalie d'une variable est la différence entre une valeur réelle de cette variable et la valeur climatologique (la valeur climatologique étant la valeur normale pour la période considérée, déterminée à partir des relevés des valeurs de la variable précédemment effectués).

Selon une autre caractéristique de l'invention, les groupes d'emplacements correspondent aux zones géographiques ayant les amplitudes les plus élevées dans les premières composantes principales de l'analyse précitée.

Dans le cas des températures, une analyse en composantes principales des anomalies de température journalières et mensuelles en Europe permet d'aboutir à la structure suivante :

- la première composante principale comprend un pôle unique ou monopôle,

- les deuxième et troisième composantes principales sont des dipôles. En Europe, le centre de variabilité de la structure monopole est l'Europe centrale. Les centres du dipôle correspondant à la deuxième composante principale sont l'Europe de l'Est d'une part et l'Europe du Sud- Ouest plus l'Ouest méditerranéen d'autre part, et les centres d'activités correspondant à la troisième composante principale sont le bassin méditerranéen et le Nord-Ouest européen.

Si l'analyse est appliquée aux anomalies des températures en Europe, les emplacements choisis sont les villes de Nuremberg en Allemagne (Europe centrale), Leba en Pologne (Europe de l'Est), Vigo en Espagne (Sud-Ouest de l'Europe et de l'Ouest méditerranéen), Amsterdam aux Pays-Bas (Nord-Ouest de l'Europe) et Pescara en Italie (bassin méditerranéen).

Les indices se calculent de la manière suivante : (ind1 , ind2, ind3) = (tanoi , tano2, ..., tano5) * A

Le vecteur (tanoi , ..., tanoδ) contient les anomalies de température dans les cinq emplacements choisis - Nuremberg, Vigo, Pescara, Leba, Amsterdam (dans cet ordre ), « A » est une matrice de dimensions 5 x 3 qui contient les poids, et le vecteur (ind1 , ind2, ind3) contient les trois indices calculés pour un moment donné. En général, si « n » indices ind1 , ..., indn doivent être calculés à partir de « m » séries temporelles ts1 , ... tsm en « m » emplacements, la formule est : (ind1 , .... indn) = (ts1 , ... tsm) * A

A étant une matrice de dimension m x n. La colonne n de la matrice A contient les poids pour calculer l'indice n à partir des données dans les m emplacements. Les coefficients de pondération des indices qui sont utilisés pour approximer une température ou une anomalie de température en un point quelconque d'une région sont calculés par régression multivahée.

Dans un mode de réalisation particulier de l'invention, l'analyse en composantes principales est effectuée sur des données journalières et sur des données mensuelles d'anomalies de température.

Pour calculer des indices à partir des anomalies des températures journalières, les composantes de la matrice A sont :

[,l] [,2] [,3]

[1,] -0.12025594 0.10184922 0.01330028

[2,] -0.02738203 0.11979894 0.18362434

[3,] -0.05001196 0.12851656 -0.29182618

[4,] -0.08329636 -0.33201439 -0.02303887

[5,] -0.09309122 0.06122933 0.10620130 Pour calculer les indices à partir des données mensuelles normalisées (variance = 1 ), les composantes de la matrice A sont :

Ml [,2] [,3]

[1,] -0.19551935 0.2798633 -0.10141862

[2,] -0.04701654 0.4602554 -0.29874588

[3,] -0.11156334 0.2875479 0.61925407

[4,] -0.18758694 -0.6903224 -0.02383865

[5,] -0.15033798 0.1400668 -0.20446550

L'invention propose également des indices de température qui sont déterminés par exécution du procédé décrit ci-dessus et qui sont destinés à une estimation de la température ou d'une anomalie de température en un point quelconque de l'Europe, ces indices de température étant caractérisés en ce qu'ils sont au nombre de trois et comprennent :

- une moyenne pondérée des anomalies de température selon les coefficients de la première colonne de la matrice A ; une moyenne pondérée des anomalies de température selon les coefficients de la deuxième colonne de la matrice A et

une moyenne pondérée des anomalies de température selon les coefficients de la troisième colonne de la matrice A.

L'invention sera mieux comprise et d'autres caractéristiques, détails et avantages de celle-ci apparaîtront plus clairement à la lecture de la description qui suit, faite à titre d'exemple en référence au dessin annexé, qui représente un organigramme des principales étapes du procédé selon l'invention.

L'exemple de réalisation qui va maintenant être décrit concerne l'approximation des températures et des anomalies de température en un point quelconque d'Europe pendant une période donnée, allant par exemple du mois d'octobre au mois d'avril de l'année suivante.

La première étape 10 du procédé selon l'invention consiste à relever les températures et/ou les anomalies de température en différents points de la région considérée. On peut par exemple utiliser pour cela des mesures effectuées de façon régulière dans environ 90 stations météorologiques situées en Europe.

L'étape suivante 12 du précédé selon l'invention consiste en une analyse en composantes principales de l'ensemble des températures et anomalies de température qui ont été relevées à l'étape 10.

Si l'on effectue une analyse en composantes principales des températures sur la période octobre-avril entre janvier 2003 et fin avril 2009, on constate que la première composante principale représente environ 73 % de la vahance totale des températures en Europe, que la deuxième composante principale représente 5,7 % de cette vahance totale, que la troisième composante principale représente 4,7 % de cette variance totale et la quatrième composante principale 3,3 % de cette variance totale, lorsque les analyses portent sur les températures journalières. Si les analyses sont faites sur des températures mensuelles, les valeurs correspondantes pour les quatre premières composantes principales sont respectivement de 89,5 %, 3,7 %, 2,5 % et 1 ,1 %.

On arrive sensiblement aux mêmes structures de schémas dominants pour l'analyse mensuelle et pour l'analyse journalière.

Lorsque l'analyse en composantes principales est faite sur les valeurs enregistrées des anomalies de température sur la période octobre- avril, la première composante principale correspond à 51 ,9 % de la variance totale, la deuxième composante principale à 10,1 % de cette variance totale, la troisième composante principale à 8,8 % et la quatrième composante principale à 4,9 % de la variance totale.

Dans le cas des analyses mensuelles, les valeurs correspondantes sont de 69,4 % pour la première composante principale, 10,7 % pour la deuxième composante principale, 5,8 % pour la troisième composante principale et 4,1 % pour la quatrième composante principale.

Les trois premières composantes principales des anomalies de température mensuelle représentent environ 86 % de la variance totale des températures en Europe.

Ces différentes analyses donnent des résultats tout à fait cohérents : en hiver, la variabilité maximale est dans le sud de l'Allemagne et en Pologne. Les deuxième et troisième composantes principales montrent des structures en dipôles avec un gradient principal orienté du

Sud-Ouest au Nord-Est et du Sud-Est au Nord-Ouest, respectivement.

L'étape suivante 14 du procédé selon l'invention consiste à regrouper les stations météorologiques ayant des comportements similaires en termes de variations de températures ou de variations des anomalies de te m pératu re et à sélectionner dans chaque groupe une station météorologique qui sera la représentante du groupe considéré pour obtenir un nombre minimal de stations caractérisant les modèles de température en Europe. On peut ainsi identifier cinq groupes d'emplacements, qui correspondent globalement aux composantes principales précitées (étape 16) :

- le Sud-Ouest de l'Europe et l'Ouest méditerranéen, comprenant l'Espagne, le Portugal et le Sud-Ouest de la France;

le bassin méditerranéen, comprenant l'Italie et le Sud-Est de la France ;

le Nord-Ouest de l'Europe comprenant l'Angleterre, les Pays-Bas, la Belgique et le Nord de la France ;

- l'Europe centrale, comprenant l'Allemagne et l'Est de la

France ;

l'Europe de l'Est, comprenant la Pologne et l'Est de l'Allemagne.

Les zones géographiques de ces cinq groupes sont celles qui ont les amplitudes les plus élevées des trois premières composantes principales :

le Sud-Ouest de l'Europe et l'Ouest méditerranéen correspondent au maximum de la deuxième composante principale ;

le bassin méditerranéen correspond au maximum de la troisième composante principale ;

le Nord-Ouest de l'Europe correspond au maximum de la troisième composante principale ;

l'Europe centrale correspond au maximum de la première composante principale ;

- l'Europe de l'Est correspond au maximum de la deuxième composante principale.

Ce groupement est cohérent avec le fait que la première composante principale est un monopôle (tous les éléments de la première composante principale ont le même signe) tandis que la deuxième et la troisième composante principale sont des dipôles (chaque dipôle étant défini par deux régions associées, les signes des éléments de chacune de ces composantes principales étant opposés).

L'étape suivante 18 du procédé selon l'invention consiste à définir des indices de température comme des moyennes pondérées des températures ou des anomalies des températures ou des anomalies normalisées des températures aux emplacements choisis qui vont représenter de façon simplifiée des modes de variation de température dans les groupes précités. Les indices simplifiés doivent montrer une haute corrélation avec les séries temporelles de l'analyse en composantes principales, les corrélations entre les indices doivent être faibles et les trois vecteurs formés par les poids de chaque indice doivent être orthogonaux ou presque orthogonaux.

Selon l'invention, ces indices sont les suivants : (ind1 , ind2, ind3) = (tanoi , tano2, ..., tano5) * A

Le vecteur (tanoi , ..., tanoδ) contient les anomalies des températures dans les cinq emplacements choisis, Nuremberg, Vigo,

Pescara, Leba, Amsterdam (dans cet ordre), A est une matrice de dimensions 5 x 3 qui contient les poids, et le vecteur (ind1 , ind2, ind3) contient les trois indices calculés pour un moment donné.

Pour calculer des indices à partir des anomalies de température journalières, les composantes de la matrice A sont : [ , 1] [ , 2] [ , 3]

[1,] -0.12025594 0.10184922 0.01330028

[2,] -0.02738203 0.11979894 0.18362434

[3,] -0.05001196 0.12851656 -0.29182618

[4,] -0.08329636 -0.33201439 -0.02303887

[5,] -0.09309122 0.06122933 0.10620130 Pour calculer les indices à partir des anomalies de température mensuelles, les composantes de la matrice A sont :

Ml [ , 2] [ , 3]

[1,] -0.19551935 0.2798633 -0.10141862

[2,] -0.04701654 0.4602554 -0.29874588

[3,] -0.11156334 0.2875479 0.61925407

[4,] -0.18758694 -0.6903224 -0.02383865

[5,] -0.15033798 0.1400668 -0.20446550

Ces trois indices permettent de mesurer l'importance des modes spatiaux dominants de température en Europe. On peut ainsi couvrir avec ces trois indices de température des anomalies de température en tout point de l'Europe.

L'utilisation des anomalies de température, à la place des températures totales, rend ces indices universels en Europe. Ils sont aussi bien adaptés pour les pays très froids tels que la Pologne par exemple, que pour les pays ayant des hivers relativement doux, tels que l'Espagne ou l'Italie.

L'indice ind1 mesure l'anomalie de température à grande échelle en Europe.

L'indice ind2 mesure le gradient de température Nord- Est/Sud-Ouest et donc l'importance de la seconde composante principale des anomalies de température.

L'indice ind3 mesure l'importance de la troisième composante principale.

Les indices selon l'invention permettent d'estimer des anomalies de température et des températures complètes ou températures totales sur toute l'Europe. Les indices peuvent avoir des valeurs positives ou négatives. Les températures en un point quelconque de l'Europe peuvent être représentées par une combinaison linéaire de ces trois indices, avec une pondération de chaque indice.

Les poids (ou coefficients de pondération) pour chaque indice et pour un emplacement spécifique peuvent être calculés à partir d'une régression multivariée. Ils ont des valeurs constantes dans le temps, qui peuvent être positives ou négatives.