Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD OF IDENTIFYING A DATA STRUCTURE REPRESENTATIVE OF A CONSUMPTION OF FLUID, CORRESPONDING DEVICE AND COMPUTER PROGRAMME
Document Type and Number:
WIPO Patent Application WO/2016/188958
Kind Code:
A1
Abstract:
The invention relates to a method of identifying an item of equipment carrying out a consumption of a fluid, the consumption being characterized by a unitary consumption segment called a lineament comprising a list of contextual and morphological parameters. According to the invention the method comprises: - a plurality of steps of obtaining (10) data representative of a morphological score (SM) of said lineament (LIN) as a function of at least one value of at least one morphological descriptor (D) of the lineament (LIN) and of at least one category of equipment (CE), delivering a list comprising at least one morphological score (LSM); - a plurality of steps of obtaining (20) data representative of a contextual score (SC) of said lineament (LIN) as a function of at least one value of a contextual descriptor (C) of the lineament (LIN) and of a mean quantity of fluid consumed (QFMC) over at least one time period, delivering a list comprising at least one contextual score (LSC); - a step of identifying (30) an equipment category (C) and/or an item of equipment giving rise to said lineament (LIN) as a function of the scores of said list of morphological scores (LSM) and of said list of contextual scores (LSC).

Inventors:
HOCHEDEZ JEAN-FRANÇOIS (FR)
LEFEBVRE-NARE FRÉDÉRIC (FR)
BENASSI ROMAIN (FR)
Application Number:
PCT/EP2016/061586
Publication Date:
December 01, 2016
Filing Date:
May 23, 2016
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
WATTGO (FR)
International Classes:
G06K9/62; G01D4/00; G06Q50/06
Domestic Patent References:
WO2012106709A22012-08-09
WO2011002735A12011-01-06
Foreign References:
EP2290328A12011-03-02
US20130289788A12013-10-31
Other References:
LINDA FARINACCIO ET AL: "Using a pattern recognition approach to disaggregate the total electricity consumption in a house into the major end-uses", ENERGY AND BUILDINGS, vol. 30, no. 3, 1 August 1999 (1999-08-01), pages 245 - 259, XP055119182, ISSN: 0378-7788, DOI: 10.1016/S0378-7788(99)00007-9
MICHAEL ZEIFMAN: "Disaggregation of home energy display data using probabilistic approach", IEEE TRANSACTIONS ON CONSUMER ELECTRONICS, IEEE SERVICE CENTER, NEW YORK, NY, US, vol. 58, no. 1, 1 February 2012 (2012-02-01), pages 23 - 31, XP011434208, ISSN: 0098-3063, DOI: 10.1109/TCE.2012.6170051
Attorney, Agent or Firm:
LE SAUX, Gaël (Technopole Atalante16B, rue de Jouane, Bretagne Rennes Cedex 7, FR)
Download PDF:
Claims:
REVENDICATIONS

Procédé d'identification, mis en œuvre par un dispositif électronique, d'un équipement, appartenant à un local raccordé à un réseau de distribution de fluide, ledit équipement réalisant une consommation dudit fluide, la consommation dudit fluide par ledit équipement étant représentée par un segment de consommation unitaire, dit linéament (LIN), ledit linéament comprenant une liste de paramètres, ladite liste de paramètres comprenant au moins un descripteur contextuel ou morphologique, un descripteur contextuel étant représentatif d'une circonstance liée à la consommation dudit fluide et un descripteur morphologique étant représentatif d'un profil de consommation dudit fluide par un équipement ou par une catégorie d'équipement,

ledit procédé comprenant :

une pluralité d'étapes d'obtention (10) de données représentatives d'un score morphologique (SM) dudit linéament (LIN) en fonction d'au moins une valeur d'au moins un descripteur morphologique (D) du linéament (LIN) et d'au moins une catégorie d'équipement (CE), délivrant une liste (LSM) comprenant au moins un score morphologique ;

une pluralité d'étapes d'obtention (20) de données représentatives d'un score contextuel (Sc) dudit linéament (LIN) en fonction d'au moins une valeur d'un descripteur contextuel (C) du linéament (LIN) et d'une quantité de fluide moyenne consommée (QFMC) sur au moins une période temporelle, délivrant une liste (LSC) comprenant au moins un score contextuel ;

une étape d'identification (30) d'une catégorie d'équipement (CE) et/ou d'un équipement (E) dont est issu ledit linéament (LIN) en fonction des scores de ladite liste de scores morphologiques (LSM) et de ladite liste de scores contextuels (LSC).

Procédé d'identification selon la revendication 1 comprenant, préalablement à l'étape d'identification, au moins une étape d'obtention d'une liste de scores morphologiques a posteriori en fonction dudit linéament (LIN), de lois a priori pour chaque équipement ou catégorie et en fonction d'au moins une liste de linéaments de référence. 3. Procédé d'identification selon la revendication 2, caractérisée en ce que ladite étape d'identification tient compte de la liste de scores morphologiques a posteriori.

4. Procédé d'identification selon la revendication 1, caractérisé en ce qu'une étape d'obtention d'une donnée représentative d'un score morphologique dudit linéament, dont les paramètres endogènes sont listés dans D, comprend, pour un appareil ak donné, un calcul de :

p(D \ ak) = p (D = p (D |¾), avec ¾ = (A,m)1≤m≤M dans lequel :

p D \ ak) représente la probabilité d'observer les descripteurs morphologiques D sachant que c'est l'équipement ak qui a manifesté une activité ;

p {p\ {pk,m)1<m<M) représente probabilité d'observer les descripteurs morphologiques D sachant qu'ils sont distribués selon des lois paramétrées par des paramètres { k,m)1<m<M> dits « hyper-paramètres » ;

i9fe m représente les M hyper-paramètres des lois décrivant les descripteurs de l'équipement ak.

5. Procédé d'identification selon la revendication 1, caractérisé en ce qu'une étape d'obtention d'une donnée représentative d'un score morphologique dudit linéament comprend, pour une catégorie A comprenant une pluralité d'appareils ak, lorsque aucun linéament de référence n'est disponible, un calcul de :

p D \Ai) = [f pWâ x pifi ù dâi

JJût

dans lequel :

p D représente la probabilité d'observer les descripteurs morphologiques D sachant que c'est un appareil de la catégorie d'équipements A, qui a manifesté une activité ;

p(D |i9j) représente la probabilité d'observer les descripteurs morphologiques D sachant que les hyper-paramètres valent i9j ;

pi 0 (i9j) représente la distribution des hyper-paramètres de la catégorie d'équipements A ;

di9j représente un incrément infinitésimal sur les hyper-paramètres. 6. Procédé d'identification selon la revendication 1, caractérisé en ce qu'une étape d'obtention d'une donnée représentative d'un score morphologique dudit linéament comprend, pour une catégorie A comprenant une pluralité d'appareils ak, lorsqu'un ensemble de linéaments de référence sont disponibles, un calcul de :

p(D \ (L r) A Ai) = [f piDWd pi &d dâi

JJût

dans lequel :

représente la probabilité d'observer les descripteurs morphologiques D sachant que c'est un appareil de la catégorie d'équipements A, qui a manifesté une activité et sachant que les linéaments (Li r) ont été émis par l'appareil A,.

p(D |i9j) représente la probabilité d'observer les descripteurs morphologiques D sachant que les hyper-paramètres valent i9j .

pi r (i9j) représente la distribution a posteriori des hyper-paramètres de la catégorie d'équipements A,.

di9j représente un incrément infinitésimal sur les hyper-paramètres.

7. Procédé d'identification selon la revendication 6, caractérisé en ce qu'une approximation de est calculée par échantillonnage préférentiel :

p{D \ {L r) A Ai) ^ (£> r,fc)

k=l...N

dans lequel les (i9r i k)k correspondent à des particules, dont l'histogramme approxime j r(i9j), construites à l'aide d'une procédure Monte-Carlo séquentielle.

8. Procédé d'identification selon la revendication 1, caractérisé en ce qu'une étape d'obtention d'une donnée représentative d'un score contextuel dudit linéament comprend un calcul de :

p{a j viik(t)

dans lequel :

p( jj | c) représente la probabilité d'observer une activité de l'appareil c¾ de la catégorie A, sachant l'advenue des descripteurs circonstanciels C.

pG4j |C) représente la probabilité d'observer une activité de la catégorie A, sachant l'advenue des descripteurs circonstanciels C.

Ψ(Α) représente la quantité de ressource annuelle moyenne vi,k (t) représente le produit des profils d'utilisation en fonction de l'heure de la journée et/ou du jour de la semaine et/ou du jour de l'année.

9. Produit programme d'ordinateur téléchargeable depuis un réseau de communication et/ou stocké sur un support lisible par ordinateur et/ou exécutable par un microprocesseur, caractérisé en ce qu'il comprend des instructions de code de programme pour l'exécution d'un procédé d'identification selon la revendication 1, lorsqu'il est exécuté par un processeur.

10. Dispositif électronique d'identification d'un équipement, appartenant à un local raccordé à un réseau de distribution de fluide, ledit équipement réalisant une consommation dudit fluide, la consommation dudit fluide par ledit équipement étant représentée par un segment de consommation unitaire, dit linéament, ledit linéament comprenant une liste de paramètres, ladite liste de paramètres comprenant au moins un descripteur contextuel ou morphologique, un descripteur contextuel étant représentatif d'une circonstance liée à la consommation dudit fluide et un descripteur morphologique étant représentatif d'un profil de consommation dudit fluide par un équipement ou par une catégorie d'équipement de consommation dudit fluide,

ledit dispositif comprenant :

des moyens d'obtention de données représentatives d'un score morphologique dudit linéament en fonction d'au moins une valeur d'au moins un descripteur morphologique du linéament et d'au moins une catégorie d'équipement, délivrant une liste comprenant au moins un score morphologique ;

des moyens d'obtention de données représentatives d'un score contextuel dudit linéament en fonction d'au moins une valeur d'un descripteur contextuel du linéament et d'une quantité de fluide moyenne consommée sur une ou plusieurs périodes de temps, délivrant une liste comprenant au moins un score contextuel ;

des moyens d'identification d'une catégorie d'équipement et/ou d'un équipement dont est issu ledit linéament en fonction des scores de ladite liste de scores morphologiques et de ladite liste de scores contextuels.

Description:
Procédé d'identification d'une structure de données représentative d'une consommation de fluide, dispositif et programme d'ordinateur correspondant.

1. Domaine de l'invention

L'invention se rapporte à une technique d'identification de consommation. L'invention se rapporte plus particulièrement à une technique d'identification de consommation d'une ressource, telle qu'un fluide, transportée par un flux présentant des variations, et dont on connaît des mesures répétées. Plus particulièrement l'invention s'inscrit dans une optique de maîtrise des consommations de ressources, comme par exemple les ressources énergétiques (gaz, électricité, pellets de combustibles), mais également des ressources naturelles (eau). La technique proposée est mise en œuvre par un dispositif dédié comprenant des moyens de traitements de grandes quantités de données et des moyens de calcul permettant d'identifier des équipements sources d'une consommation de fluide.

2. Art antérieur

La problématique de la désagrégation de courbe de consommation est relativement récente et les travaux s'y rapportant sont peu identifiables. Parmi les nombreux critères techniques susceptibles d'intervenir dans le principe et dans la performance d'un algorithme de désagrégation, une distinction principale apparaît en fonction de la fréquence à laquelle la puissance consommée est échantillonnée. Entre les gammes 1 hr - 1 min, 1 min - 1 Hz, 1-60 Hz, 60 Hz-2 kHz, 2-40 kHz, et >1 MHz, les problématiques et les possibilités diffèrent grandement.

Dans le cadre de la technique proposée, des méthodes qui reposent sur l'analyse des harmoniques ne sont pas adaptées car elles ne sont pas compatibles avec le parc des compteurs standards, ni même avec la plupart des 'smart meters' existants ou amenés à être installés lors de la future décade. Ceux-ci sont dits intelligents ('smart'), car aptes à transmettre de l'information au gestionnaire de réseau mais cette information reste rudimentaire et basse fréquence (un échantillon toutes les 10 à 30 minutes, typiquement) de façon à préserver la vie privée des usagers. Or dans la présente technique, on s'intéresse à des fréquences d'échantillonnage plus élevées que celle des smart meters, bien qu'inférieures à la dizaine de Hertz, et en pratique, de l'ordre du dixième de Hertz. Bien que non transmise au gestionnaire de réseau, cette information existe à l'intérieur des compteurs. Elle peut en être extraite à l'aide de divers moyens (capteur externe, sortie numérique locale du compteur) et communiquée par les particuliers à un service de type « opt-in », auquel ils auront adhéré volontairement. Pour la même raison de non compatibilité avec les cadences d'échantillonnage disponibles, des méthodes basées sur l'analyse des transitoires sont en bonne partie exclues du champ de l'art antérieur car elles exigent en général la centaine de Hertz environ.

Des méthodes comparables à la présente, en termes de résultats attendus, pourraient être fondées sur une analyse des états quasi-stationnaires : de telles méthodes, cependant, nécessitent des paliers pendant lesquels la consommation de fluide devrait être suffisamment constante. Or il est connu, qu'un profil temporel de consommation peut prendre des formes diverses et manifester des rampes croissantes ou décroissantes. Ceci est en particulier vrai dans le cas de la consommation électrique dans un logement. Ainsi, les résultats qui pourraient être obtenus par de telles méthodes seraient complexes à calculer et ne seraient pas forcément représentatifs de la structure réelle de la consommation.

3. Résumé de l'invention

L'invention ne présente pas ces inconvénients de l'art antérieur. Plus particulièrement, l'invention se rapporte à un procédé d'identification, mis en œuvre par un dispositif électronique, d'un équipement, appartenant à un local raccordé à un réseau de distribution de fluide, ledit équipement réalisant une consommation dudit fluide, la consommation dudit fluide par ledit équipement étant représentée par un segment de consommation unitaire, dit linéament, ledit linéament comprenant une liste de paramètres, ladite liste de paramètres comprenant au moins un descripteur contextuel ou morphologique, un descripteur contextuel étant représentatif d'une circonstance liée à la consommation dudit fluide et un descripteur morphologique étant représentatif d'un profil de consommation dudit fluide par un équipement ou par une catégorie d'équipement. Selon l'invention, un tel procédé comprend :

une pluralité d'étapes d'obtention de données représentatives d'un score morphologique dudit linéament en fonction d'au moins une valeur d'au moins un descripteur morphologique du linéament et d'au moins une catégorie d'équipement, délivrant une liste comprenant au moins un score morphologique ;

une pluralité d'étapes d'obtention de données représentatives d'un score contextuel dudit linéament en fonction d'au moins une valeur d'un descripteur contextuel du linéament et d'une quantité de fluide moyenne consommée sur au moins une période temporelle, délivrant une liste comprenant au moins un score contextuel ;

- une étape d'identification d'une catégorie d'équipement et/ou d'un équipement dont est issu ledit linéament en fonction des scores de ladite liste de scores morphologiques et de ladite liste de scores contextuels. Une période temporelle peut par exemple être la minute, l'heure, le jour, le mois ou l'année.

Selon une caractéristique particulière, préalablement à l'étape d'identification, au moins une étape d'obtention d'une liste de scores morphologiques a posteriori en fonction dudit linéament , de lois a priori pour chaque équipement ou catégorie et en fonction d'au moins une liste de linéaments de référence.

Selon une caractéristique particulière, ladite étape d'identification tient compte de la liste de scores morphologiques a posteriori.

Selon une caractéristique particulière, une étape d'obtention d'une donnée représentative d'un score morphologique dudit linéament, dont les paramètres endogènes sont listés dans D, comprend, pour un appareil a k donné, un calcul de :

p(D \ a k ) = p (D = p (D |¾), avec ¾ = (A, m ) 1≤m≤M dans lequel :

p D \ a k ) représente la probabilité d'observer les descripteurs morphologiques D sachant que c'est l'équipement a k qui a manifesté une activité.

p {D \ {pk,m) 1<m<M ) représente probabilité d'observer les descripteurs morphologiques D sachant qu'ils sont distribués selon des lois paramétrées par des paramètres (pk,m) 1<m<M > dits « hyper-paramètres ».

i9 fe m représente les M hyper-paramètres des lois décrivant les descripteurs de l'équipement a k .

Selon une caractéristique particulière, une étape d'obtention d'une donnée représentative d'un score morphologique dudit linéament comprend, pour une catégorie A comprenant une pluralité d'appareils a k , lorsque aucun linéament de référence n'est disponible, un calcul de :

dans lequel :

p(Z) représente la probabilité d'observer les descripteurs morphologiques D sachant que c'est un appareil de la catégorie d'équipements A, qui a manifesté une activité.

p(Z) | i9j) représente la probabilité d'observer les descripteurs morphologiques D sachant que les hyper-paramètres valent i9j . p i 0 (i9 j ) représente la distribution des hyper-paramètres de la catégorie d'équipements A,.

di9 j représente un incrément infinitésimal sur les hyper-paramètres

Selon une caractéristique particulière, une étape d'obtention d'une donnée représentative d'un score morphologique dudit linéament comprend, pour une catégorie A comprenant une pluralité d'appareils a k , lorsqu'un ensemble de linéaments de référence sont disponibles, un calcul de :

p(D \ (L r ) A A i ) = (f p tf x pi ù dâi

JJût

dans lequel :

représente la probabilité d'observer les descripteurs morphologiques D sachant que c'est un appareil de la catégorie d'équipements A,- qui a manifesté une activité et sachant que les linéaments (L i r ) ont été émis par l'appareil A,.

p(D |i9 j ) représente la probabilité d'observer les descripteurs morphologiques D sachant que les hyper-paramètres valent i9 j .

p i r (i9 j ) représente la distribution a posteriori des hyper-paramètres de la catégorie d'équipements A.

di9 j représente un incrément infinitésimal sur les hyper-paramètres.

Selon une caractéristique particulière, une approximation de est calculée par échantillonnage préférentiel :

p{D \ {L r ) A A i ) ^ (£> r,fc)

k=l...N

dans lequel les (i9 r i k ) k correspondent à des particules, dont l'histogramme approxime Vi,r( d > construites à l'aide d'une procédure Monte-Carlo séquentielle.

Selon une caractéristique particulière, une étape d'obtention d'une donnée représentative d'un score contextuel dudit linéament comprend un calcul de :

p{a j v iik (t)

dans lequel :

- p( j j | c) représente la probabilité d'observer une activité de l'appareil a lj de la catégorie A,- sachant l'advenue des descripteurs circonstanciels C.

pG4 j |C) représente la probabilité d'observer une activité de la catégorie A, sachant l'advenue des descripteurs circonstanciels C.

Ψ(^ ( ) représente la quantité de ressource annuelle moyenne v i,k( représente le produit des profils d'utilisation en fonction de l'heure de la journée, du jour de la semaine, du jour de l'année, etc. L'intégrale de chacun des profils (indicés par k) est normalisée à l'unité.

Ψ0 ;) est exprimée en Wh [Watt heure] pour le cas de l'électricité.

Dans un autre mode de réalisation, l'invention se rapporte également à un dispositif électronique d'identification d'un équipement, appartenant à un local raccordé à un réseau de distribution de fluide, ledit équipement réalisant une consommation dudit fluide, la consommation dudit fluide par ledit équipement étant représentée par un segment de consommation unitaire, dit linéament, ledit linéament comprenant une liste de paramètres, ladite liste de paramètres comprenant au moins un descripteur contextuel ou morphologique, un descripteur contextuel étant représentatif d'une circonstance liée à la consommation dudit fluide et un descripteur morphologique étant représentatif d'un profil de consommation dudit fluide par un équipement ou par une catégorie d'équipement de consommation dudit fluide.

Un tel dispositif comprend :

- des moyens d'obtention de données représentatives d'un score morphologique dudit linéament en fonction d'au moins une valeur d'au moins un descripteur morphologique du linéament et d'au moins une catégorie d'équipement, délivrant une liste comprenant au moins un score morphologique ;

des moyens d'obtention de données représentatives d'un score contextuel dudit linéament en fonction d'au moins une valeur d'un descripteur contextuel du linéament et d'une quantité de fluide moyenne consommée sur une ou plusieurs périodes de temps, délivrant une liste comprenant au moins un score contextuel.

Selon une implémentation préférée, les différentes étapes des procédés selon l'invention sont mises en œuvre par un ou plusieurs logiciels ou programmes d'ordinateur, comprenant des instructions logicielles destinées à être exécutées par un processeur de données d'un module relais selon l'invention et étant conçu pour commander l'exécution des différentes étapes des procédés.

En conséquence, l'invention vise aussi un programme informatique, susceptible d'être exécuté par un ordinateur ou par un processeur de données, ce programme comportant des instructions pour commander l'exécution des étapes d'un procédé tel que mentionné ci-dessus. Ce programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable.

L'invention vise aussi un support d'informations lisible par un processeur de données, et comportant des instructions d'un programme tel que mentionnées ci-dessus.

Le support d'informations peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une disquette (floppy dise), un disque dur, un SSD Solid State Disc), etc.

D'autre part, le support d'information peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.

Alternativement, le support d'information peut être un circuit intégré (type ASIC ou FPGA) dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.

Selon un mode de réalisation, l'invention est mise en œuvre au moyen de composants logiciels et/ou matériels. Dans cette optique, le terme "module" peut correspondre dans ce document aussi bien à un composant logiciel, qu'à un composant matériel ou à un ensemble de composants matériels et logiciels.

Un composant logiciel correspond à un ou plusieurs programmes d'ordinateur, un ou plusieurs sous-programmes d'un programme, ou de manière plus générale à tout élément d'un programme ou d'un logiciel apte à mettre en œuvre une fonction ou un ensemble de fonctions, selon ce qui est décrit ci-dessus et ci-dessous pour le module concerné. Un tel composant logiciel est exécuté par un processeur de données d'une entité physique (terminal, serveur, passerelle, routeur, etc.) et est susceptible d'accéder aux ressources matérielles de cette entité physique (mémoires, supports d'enregistrement, bus de communication, cartes électroniques d'entrées/sorties, interfaces utilisateur, etc.).

De la même manière, un composant matériel correspond à tout élément d'un ensemble matériel (ou hardware) apte à mettre en œuvre une fonction ou un ensemble de fonctions, selon ce qui est décrit ci-dessus et ci-dessous pour le module concerné. Il peut s'agir d'un composant matériel programmable ou avec processeur intégré pour l'exécution de logiciel, par exemple un circuit intégré, une carte à puce, une carte à mémoire, une carte électronique pour l'exécution d'un micro logiciel (firmware), etc.

4. Figures

D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation préférentiel, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :

la figure 1 présente un synoptique de la technique proposée pour le traitement des données de consommation de fluide ;

- la figure 2 présente un dispositif de mise en œuvre de la méthode proposée.

5. Description

5.1. Rappel du principe

Le principe général de la technique décrite consiste à caractériser des structures de données préalablement extraites d'une courbe de consommation (structures de données appelées arbitrairement linéaments) à l'aide de notations (« scores ») qui peuvent permettre d'identifier un équipement qui a physiquement effectué ladite consommation dans un local donné. À tout le moins, selon la technique décrite, lorsqu'il n'est pas envisageable ou possible d'identifier précisément un équipement physique particulier, la technique décrite permet de ranger par ordre croissant (ou décroissant) de vraisemblance les classes d'équipement auxquelles le linéament peut appartenir et exploiter ultérieurement cette liste ordonnée pour différentes finalités. À titre indicatif, on peut par exemple définir les classes suivantes, lorsque le fluide consommé est un fluide électrique : réfrigérateur, radiateur électrique, four, sèche-linge, etc. Lorsque le fluide est par exemple le gaz, on peut définir les classes : chaudière, chauffe-eau, plaque de cuisson. Lorsque le fluide est l'eau courante, on peut définir les classes : douche, toilettes, baignoire, lave-linge, lave-vaisselle, etc..

On rappelle, à toutes fins utiles, que les structures de données sur la base desquelles la présente technique est mise en œuvre sont des segments distincts de consommation appelés linéaments. Ces segments sont préalablement obtenus par une méthode qui n'est pas l'objet de la présente. Les linéaments sont par exemple obtenus en identifiant et en réunissant au moins deux transitions (à la hausse et à la baisse), issues d'une courbe de consommation initiale : c'est- à-dire des modifications du flux de consommation qui excèdent (en valeur absolue) un paramètre de seuil dont la valeur peut évoluer au long d'un processus de découpage de la courbe de consommation. Un linéament se présente sous la forme d'une structure de données, par exemple enregistrée au sein d'un fichier ou d'une base de données sous la forme d'un enregistrement comprenant plusieurs champs. Dans une mise en œuvre particulière, un linéament comprend des données exogènes, dépendant de variables qui lui sont extérieures, généralement de type circonstanciel et possédant habituellement une dépendance temporelle, et des données endogènes, décrivant le profil temporel de la consommation, généralement de type morphologique, ne possédant habituellement pas de dépendance temporelle. Par exemple un linéament peut comprendre, dans un mode de réalisation spécifique, une douzaine de champs différents, correspondant à autant de dimensions permettant d'identifier ce linéament de manière unique. L'un des objets principaux de la présente technique est d'affecter les linéaments ou tout autre épisode de consommation représentant un événement distinct à des équipements physiques du local où la courbe de consommation initiale (permettant d'en extraire des épisodes) a été générée. Ces équipements sont par exemple une chaudière, un chauffe-eau, un réfrigérateur, une machine à laver le linge, une cafetière, un téléviseur, une plaque de cuisson (gaz ou électrique), etc. Cette affectation poursuit plusieurs objectifs : (1) pouvoir déterminer des profils et des typologies de consommations, (2) pouvoir détecter des dysfonctionnements dans les équipements utilisés, (3) pouvoir conseiller ou renseigner des acteurs --humains ou non-- sur des mesures à prendre afin d'optimiser la consommation de fluide, etc. La technique proposée possède donc des applications tout à fait concrètes et utiles.

De manière plus précise, un linéament est une suite finie ([/?„, T n ]) de couples de scalaires, peu apte, dans cet état « brut », à être traitée en vue d'en réaliser une classification. Ainsi, afin d'accomplir cette classification, un linéament est subséquemment caractérisé à l'aide de descripteurs standardisés. Ces descripteurs constituent deux vecteurs (viz. deux listes ordonnées de scalaires) qui caractérisent, d'une part la morphologie endogène de la signature (de manière imagée, la forme du linéament), et d'autre part les circonstances exogènes sous lesquelles il est advenu (dans quelles conditions cette forme est apparue). Nous dirons aussi son contexte.

Les descripteurs morphologiques sont notés D = [D k ] 1≤k≤0 et les descripteurs contextuels C=[C k ] 1≤k≤c . La dimension D du vecteur D peut être de l'ordre de quelques unités mais elle peut atteindre la douzaine ou plus. La consommation intégrée de L, sa consommation maximale, sa variation totale (TV), ou encore sa pente globale représentent quelques exemples de paramètres susceptibles d'appartenir à D. L'horodatage et ses valeurs dérivées (tranche horaire, jour de la semaine, jour ouvré/férié), les températures intérieures et extérieures sont pour leur part renseignées, lorsqu'elles sont voulues et disponibles, dans C.

Dans la suite, on considère qu'un linéament L étant advenu, il se trouve complètement caractérisé par le couple [D, C].

L = [D, C]

On décrit, en relation avec la figure 1, la technique proposée, mise en œuvre par un dispositif électronique. Cette technique identifie un équipement, appartenant à un local raccordé à un réseau de distribution de fluide, ledit équipement réalisant une consommation dudit fluide, la consommation dudit fluide par ledit équipement étant représentée par un segment de consommation unitaire, dit linéament (LI N), ledit linéament comprenant une liste de paramètres, ladite liste de paramètres comprenant au moins un descripteur contextuel ou morphologique, un descripteur contextuel étant représentatif d'une circonstance liée à la consommation dudit fluide et un descripteur morphologique étant représentatif d'un équipement ou d'une catégorie d'équipement de consommation dudit fluide. De manière générale, pour ce linéament (LI N) donné, on met en œuvre :

une pluralité d'étapes d'obtention (10) de données représentatives d'un score morphologique (S M ) du linéament en fonction des valeurs des descripteurs morphologiques D du linéament et d'au moins une catégorie d'équipement (C E ), délivrant une liste (LS M ) comprenant au moins un score morphologique (S M ) ;

une pluralité d'étapes d'obtention (20) de données représentatives d'un score contextuel (S c ) du linéament en fonction des valeurs des descripteurs contextuels (C) du linéament et d'au moins une quantité (QF MC ) de fluide consommée en moyenne sur une ou plusieurs durée caractéristiques (par exemple : heure, jour, semaine, mois, année), délivrant une liste (LS C ) comprenant au moins un score contextuel (S c ) ;

une étape d'identification (30) d'une catégorie d'équipement (Ca) et/ou d'un équipement (E) dont est issu ledit linéament (LI N) en fonction des scores de ladite liste de scores morphologiques (LS M ) et de ladite liste de scores contextuels (LS C ). Alternativement, ou complémentairement, les catégories peuvent par exemple être classées dans l'ordre des scores.

Cette méthode est mise en œuvre pour une partie au moins des linéaments d'une courbe de charge, par exemple pour les linéaments jugés significatifs (pour les linéaments représentatifs d'une consommation assez élevée par exemple). Plus particulièrement, l'un des objectifs principaux de la technique proposée est de savoir si un linéament donné L = D A C (forme D émise dans un contexte C) correspond à la consommation de fluide d'un appareil a k donné. Pour obtenir cette information, il est par exemple possible de calculer une probabilité qu'un linéament L provienne de l'utilisation de l'appareil a k .

D'un point de vue théorique, d'après le théorème de Bayes, cette probabilité s'écrit :

Pk = p .a k \L) = p{a k \D A C) = p(D \ C) dans laquelle :

p k représente la probabilité que le linéament L soit issu de l'appareil a k ,

correspondant à la probabilité de a k sachant D et C;

C représente les différentes valeurs des paramètres exogènes ;

D représente les différentes valeurs des paramètres endogènes ;

p(D \a k A C) représente la probabilité d'émettre les descripteurs morphologiques D sachant que c'est l'appareil a k qui témoigne d'une activité et que les circonstances sont celles décrites par les descripteurs C.

p a k \C) représente la probabilité que l'appareil a k témoigne d'une activité sachant que les circonstances sont celles décrites par les descripteurs C.

p D \ C) représente la probabilité d'émettre les descripteurs morphologiques D sachant que les circonstances sont celles décrites par les descripteurs C. Dans une démarche d'affectation du linéament L à un appareil a k , par exemple par un estimateur du maximum a posteriori (MAP), on recherche la probabilité p k la plus élevée (parmi les probabilités p k calculées pour différents appareils a k ), D et C étant fixés. Il n'est cependant pas nécessaire de calculer l'ensemble des termes mentionnés ci-dessus donnant l'expression de cette probabilité. En effet, comme explicité plus haut, le fait de séparer en deux les composantes du linéament (morphologie versus contexte), met en exergue la valeur de p(D \ C) au dénominateur de l'expression. Or, les inventeurs ont estimé que la morphologie D des linéaments(c'est-à-dire la forme d'un linéament) pouvait, la plupart du temps, être considérée comme indépendante du contexte C dans lequel l'épisode de consommation apparaît : la morphologie de la consommation d'un appareil (par exemple un lave-linge ou une chasse d'eau), ne varie pas en fonction par exemple de l'heure d'activation de l'appareil : la consommation d'eau d'une chasse d'eau ou la consommation électrique d'un lave-linge est en pratique identique, quelle que soit, par exemple, l'heure de la journée ou la température extérieure.

Ainsi, on définit une note ou score S répondant aux spécifications énoncées (i.e. présentant une valeur relative, viz. apte à la comparaison entre appareils) en ne conservant de l'expression de la probabilité p k que les termes suivants :

S L fc = S ak (D, C) = p(D \a k ) x p(a k \C) = S x S

On obtient ainsi le score des descripteurs morphologiques D émis dans le contexte C.

Comme D et C sont fixés, le score S k est proportionnel à la probabilité que le couple (D,C) soit issu de l'appareil a k . Le score apparaît comme étant le produit de la probabilité d'émission des descripteurs morphologiques du linéament (ou score morphologique S M ) et de la probabilité a priori de l'appareil dans le contexte (ou score contextuel S c ).

Le score est ainsi défini comme le produit de deux facteurs. Dans une autre implémentation, il pourrait être une fonction plus sophistiquée de ces deux facteurs. Le premier facteur rend compte de l'adéquation des descripteurs morphologiques du linéament à la signature générique de l'appareil a k . C'est la probabilité d'émission ou score morphologique S M . Le second estime la probabilité qu'une activité de l'appareil a k advienne dans les circonstances considérées. C'est le score contextuel S c .

Ces deux scores sont calculés indépendamment l'un de l'autre, pour un appareil a k donné. Ils sont par exemple enregistrés dans une liste (ou un tableau ou une table) dans laquelle on associe le linéament L à l'appareil a k et comprenant les deux scores préalablement calculés.

Lorsque les scores du linéament L sont calculés pour tous les appareils a on peut effectuer la sélection du score le plus élevé (i.e. le score Si le plus élevé) dans la liste des scores s et sélectionner le linéament L comme étant issu de l'appareil associé au plus haut score. Alternativement, la liste de scores peut être utilisée par un module aval qui procède à l'affectation en utilisant cette liste en même temps que d'autres informations, dans un cadre par exemple de logique floue.

Ces étapes sont mises en œuvre par l'intermédiaire de modules et/ou de dispositifs électroniques permettant de réaliser un calcul, par exemple un calcul réparti.

On décrit, dans le mode de réalisation suivant, une mise en œuvre de la technique proposée pour réaliser une affectation de linéaments issus de courbes de consommations électriques. Ce mode de réalisation est accompagné des explications théoriques permettant de valider l'approche de la technique proposée.

Il est bien entendu que l'objet de la présente n'est pas de protéger une approche théorique de résolution du problème, mais bien une technique de calcul. Plus particulièrement, comme cela est explicité plus haut, un point intéressant de la technique décrite consiste à réaliser indépendamment d'une part un calcul morphologique et d'autre part un calcul contextuel, ces deux calculs pouvant être menés en parallèle afin d'accélérer la vitesse de traitement. Par ailleurs, un objet de la présente technique est de proposer un double niveau de calcul. Ainsi, un score morphologique (élémentaire lorsque le calcul est effectué pour un appareil, ou catégoriel lorsque le calcul est effectué pour une catégorie d'appareils) peut être calculé localement (c'est-à-dire pour un local ou une habitation particulière) et « remonté » au sein d'une base de donnée globale, afin d'affiner des résultats de calculs sur d'autres locaux ou habitation (réutilisation locale ultérieure). Plus particulièrement, lorsqu'un taux de reconnaissance acceptable est atteint pour un local ou une habitation, on dispose d'un mécanisme de remontée de cette information au sein d'une base de données dite « globale ». Cette remontée d'information est réalisée par l'intermédiaire de linéaments dits « de référence ». Un linéament de référence est un linéament affectable de manière assurée à une catégorie d'équipement grâce à ses caractéristiques morphologiques et circonstancielles qui vont pouvoir dès lors être associées à ladite catégorie. Les linéaments de référence peuvent être utilisés pour construire les densités de probabilités qui seront par la suite utilisées pour (1) affiner l'affectation en local, mais aussi pour (2) évaluer la consommation de nouveaux logement ou habitation (i.e. nouveau en ce qu'ils n'ont pas encore fait l'objet d'une analyse). On a donc un cercle vertueux dans lequel l'identification des linéaments d'une courbe de charge d'un logement utilise les résultats consolidés obtenus précédemment dans ce même logement, et aussi les résultats consolidés obtenus dans d'autres logements. Les nouveaux résultats obtenus étant par ailleurs utilisés pour mettre à jour les anciens. On entretient donc ainsi une base globale perpétuellement mise à jour.

En pratique, les bases de données locales et la base de données globale ne sont pas nécessairement séparées, une base de données locale pouvant être un extrait de la base de données globale.

Ainsi, d'une manière générale, la méthode objet de la présente technique comprend : des notations initiales, a priori, des linéaments, à un appareil ou une catégorie donnée ; des notations consolidées, a posteriori, de ces affectations, comprenant notamment l'utilisation de linéaments de référence ;

des mises à jour des linéaments de référence localement et globalement.

5.2. Description d'un mode de réalisation

Ce mode de réalisation est présenté pour l'affectation d'un seul linéament L à une catégorie A. Il est bien entendu cependant que l'affectation de multiples linéaments est effectuée d'une manière sensiblement identique à une affectation unitaire : il suffit de réitérer les calculs pour déterminer l'affectation d'autres linéaments.

Dans ce mode de réalisation de la technique proposée, on souhaite également, en sus, calculer un score par catégorie A, et non seulement par appareil. Dans ce cas, un tel calcul débute par l'utilisation du théorème de Bayes, comme pour celui réalisé pour un unique appareil, et se traduit mathématiquement par l'expression suivante :

Vt = vi t \D A C) = —

Dans laquelle p;est la probabilité qu'un linéament L (résumé par les descripteurs D émis dans un contexte C) soit issue de la catégorie d'appareils A,. De la même manière que pour la définition « élémentaire » (viz. par appareil) précédemment posée ci-dessus, le score catégoriel est défini par :

S Al (D, C) = S[ = P (D\A X p(Ai \C) = S M l x S c l

Le score catégoriel est une grandeur proportionnelle à la probabilité qu'un vecteur de descripteurs D émis dans un contexte C soit issu de la catégorie d'appareils A, (D et C étant fixés). Comme pour le score élémentaire, le score catégoriel est une fonction de deux facteurs (par exemple leur produit) : le score morphologique (de catégorie) etle score contextuel.

5.2.1. Calcul de la probabilité d'émission des descripteurs d'un linéament (score morphologique) Le premier facteur S M apparaissant dans la formulation du score, p(Lla k ) ou p(LlA ; ), représente la probabilité d'émission des descripteurs du linéament L (par l'appareil a k ou par la catégorie A .

Les inventeurs ont noté que --pour un appareil a k donné- sa probabilité d'émission suivait ordinairement une loi paramétrique entièrement déterminée par M paramètres (i qui sont appelés dans la suite du texte les « hyper-paramètres de a k ». M est habituellement égal à 2. C'est le cas pour une loi normale où les hyper-paramètres codent sa moyenne et son écart-type, ou encore, par exemple, pour les lois gamma et inverse gamma. Mais M peut ne valoir que 1 comme dans le cas d'une loi exponentielle, ou plus de 2 (e.g. pour la loi normale asymétrique ou pour la loi normale généralisée).

Par souci de simplification, dans une implémentation particulière, les inventeurs considèrent que tous les descripteurs de tous les appareils peuvent être décrits par des lois paramétriques, et que ces lois sont de même nature (e.g. normale, exponentielle, etc. ) au sein de chaque catégorie A, d'appareils. Il en résulte que, au niveau d'un appareil individuel :

V(P = p (D |¾), avec ¾ = ( ,m) 1≤m≤M

Ceci représente l'expression de la probabilité d'émission du linéament de forme D en fonction des hyper-paramètres de l'appareil a k pour lequel on souhaite calculer un score.

Pour

Ce développement représente l'expression de la probabilité d'émission du linéament de forme D par la catégorie A, pour laquelle on souhaite un score. En passant à la limite pour un grand nombre d'éléments a u de A h représentatifs par exemple d'un ensemble national d'équipements d'une catégorie :

Ceci est donc l'expression de la probabilité d'émission du linéament de paramètres endogènes D en fonction des hyper-paramètres de la catégorie A,. C'est cette expression qui est utilisée pour réaliser les calculs par catégorie.

De manière complémentaire, on constate, dans cette expression, que l'on retrouve la probabilité d'émission des appareils individuels p(Z) | i9j) -qui suivent des lois paramétriques, comme indiqué plus haut-, mais celles-ci sont maintenant pondérées par < , ο (¾ qui doit être interprété comme la densité de probabilité a priori des hyper-paramètres puisqu'elle procède du cumul des probabilités d'apparition des différents appareils a u relativement à l'ensemble de la catégorie A, à laquelle ils appartiennent.

Ainsi, pour évaluer la probabilité d'émission de D vis-à-vis d'une catégorie fixée on effectue un calcul de l'expression (J) \A ) via une estimation de l'intégrale ci-dessus. Malgré le caractère paramétrique des probabilités d'émission élémentaires p (Z) |i9j), le calcul ne peut pas être mené analytiquement car le produit d'une probabilité d'émission élémentaire avec Γ a priori ρι 0 (βι) n'admet pas ordinairement de forme analytique, d'autant plus que Ρι ι0 {ϋ ) peut prendre la forme de créneaux, de peignes, de lois normales, de lois uniformes bornées, ou d'autres formes non paramétriques. L'a priori ρ ι ο (βι) est codé sous la forme de N particules désignées (i9 j j) eW (i) (NB : deux indices pour les particules mais qu'un seul pour les hyper- paramètres) dont l'histogramme approxime les lois ; 0 (i9 j ). Concrètement, la probabilité d'émission est estimée de la façon suivante :

Généralement, I es p^o fâi) ont une forme suffisamment simple pour que la génération des particules soit triviale à l'aide d'un support informatique (par exemple, si la forme choisie pour P; 0 (ûi) est celle d'une loi normale, n'importe quel générateur aléatoire d'observations issu d'une loi normale peut être utilisé). Néanmoins, si les P; 0 (ûi) ont une forme complexe, les particules peuvent alors être obtenues, par exemple, à partir de plusieurs itérations d'un algorithme de Metropolis- Hastings.

Ces lois sont initialisées « à la main » à partir de bases de données (catalogues des constructeurs par exemple), puis complétées et enrichies par un mécanisme de rétroaction décrit ci-après.

5.2.2. Calcul de la probabilité contextuelle a priori (score contextuel)

Le score « contextuel » la probabilité a priori d'activité d'un appareil a k ou d'une catégorie Ai en fonction du contexte C. Le calcul de ce score est plus simple que celui du score morphologique.

Pour rendre compte de sa dépendance vis-à-vis de l'heure de la journée, du jour de l'année et des cycles temporels en général, on pose :

p{a j oc Ψ(Α x ¾(t)

k

Ψ(Α,) correspond à la quantité de ressource annuelle moyenne (exprimée e.g. en Wh) consommée par l'appareil ou sa catégorie. v ik (t) caractérisent les profils d'utilisation en fonction de l'heure de la journée, du jour de la semaine, du jour de l'année, etc. Leurs intégrales sur la période considérée sont ramenées à l'unité. L'objectif de cette modélisation est de prendre en compte (grâce aux v j k ) le fait que certaines heures de la journée et/ou certains jours de la semaine sont plus probables que d'autres pour l'utilisation d'un appareil donné, mais d'être néanmoins conservateur en énergie au moment de l'attribution grâce à Ψ(Α,). 5.3. Linéaments de référence

Un des objectifs principaux de la technique décrite est de permettre une reconnaissance et une affectation optimisée des linéaments à des appareils ou des catégories d'appareils. Pour ce faire, les inventeurs ont eu l'idée d'introduire la notion de « Linéament de Référence ». De manière simple, un linéament de référence est un linéament que l'on sait être émis par un appareil donné et dont les descripteurs vont pouvoir, à ce titre, être exploités ultérieurement. Lors de l'examen d'un linéament issu de la courbe de consommation, les linéaments de référence sont utilisés pour augmenter le taux de reconnaissance. Ils permettent une adaptation aux spécificités locales (les lois a priori (globales/nationales) peuvent en effet présenter des recouvrements mutuels et donc induire des indéterminations que les appareils du logement ne manifestent pas), augmentant le taux de reconnaissance lorsque les conditions d'obtention des linéaments sont moins favorables. En second lieu, ils sont exploités pour enrichir une base de données nationale (globale) qui devient progressivement plus diversifiée et plus représentative des équipements réellement possédés par une grande population.

Les densités de probabilité ,- ,0 ί ) sont initialisées à partir de fiches techniques et d'expériences semi-quantitatives. Les linéaments de référence améliorent ces densités de probabilité i0 fi? / J de manière indirecte au niveau global et les supplée localement de manière plus directe.

5.3.1. Initialisation globale des linéaments de référence.

À l'origine du fonctionnement d'un service de désagrégation, aucun linéament n'est disponible. Mais à ce stade, des lois paramétriques simples et tolérantes (par exemple normales ou uniformes et bornées) peuvent d'emblée être introduites dans le système sur la base de notices techniques par exemple, pour que des premiers scores morphologiques et contextuels puissent être calculés.

Dès lors, pour un site local donné w (e.g. un logement), il est possible d'associer des scores aux linéaments (produits par la désagrégation de la courbe de consommation), et ce pour chacun des appareils a k (relevant d'une catégorie A .

À tout instant, et pour chaque catégorie A„ on considère l'ensemble £^(t) de cardinal i.(t) de tous les couples de type [linéament ; son score pour la catégorie A , et le sous-ensemble ^i ^i ) de cardinal r,(t) pour lequel les scores dépassent un seuil fixé empiriquement.

£Γ( = { u ] I Z e N L - (t) ] L'ensemble £ (t) est l'ensemble de tous les linéaments extraits d'une courbe de charge locale associés à leur score pour une catégorie A,- donnée. Le cardinal L w (t) de cet ensemble dépend du site w et du temps, mais pas de la catégorie A,. C'est une fonction croissante de t.

-rf (t) représente l'ensemble des couples de type [linéaments ;; scores locaux], pour lesquels le score dépasse un seuil empirique permettant d'affecter ces linéaments à leur catégorie de manière univoque. Le cardinal r, w (t) de cet ensemble dépend du site w, de la catégorie A h du seuil et du temps. C'est une fonction croissante de t.

r j 0 (t) est le nombre de linéaments attendus pour la catégorie A, et pour la durée t. Ce nombre peut être dérivé de la littérature scientifique ou de l'expérience. On définit la liste des linéaments de référence du site local w pour la catégorie A, par :

Xf (t) = {[L^] e rf(t) |Z e N R A V[L m , S i>m ] 6 Am < ¾}

avec/?r( = min(rr( .n,o( )

Il s'agit donc des Rl"(t) linéaments de la période considérée présentant les meilleurs scores. Leur nombre ne peut excéder le nombre attendu.

Le seuil est fixé empiriquement. Cela suppose un suivi visuel de l'affectibilité des premiers linéaments, ce qui aide à éviter que le système de scoring ne bifurque vers un état instable. Cette phase humainement supervisée est temporaire et son caractère chronophage reste donc limité. On dispose ainsi, à ce stade, de listes locales de linéaments de référence pour chaque site et chaque catégorie.

5.3.2. Rétroaction des listes locales vers l'a priori global

Lorsqu'une liste de linéaments de référence pour un site w apparaît fiable (de par la performance des résultats ou bien de par une supervision humaine) il est utile de l'exploiter non seulement localement pour le site w, mais aussi globalement. Cette prise en compte au niveau global permet également, au final, d'augmenter la représentativité de Va priori ρ ί 0 (ϋ{).

Cette boucle de rétroaction (calcul initial local, mise à jour globale puis réinjection locale), qui est une caractéristique importante de ce mode de réalisation de la technique proposée, permet de prendre en compte, de manière locale ( ' .e. au sein d'un logement ou d'un local particulier), des regroupements et synthèses globales.

5.3.3. Enrichissement des listes locales et limitation de leur cardinal

Le cardinal de chaque ensemble de linéaments de référence (pour tout site et pour toute catégorie) croit avec le temps. Ce phénomène est d'abord bénéfique puisqu'il enrichit la liste et la rend plus représentative de l'appareil local. Il est cependant nécessaire de fixer des limites pour que le système ne devienne pas trop lourd. Pour cela, le seuil est relevé (très) progressivement et devient donc une fonction du temps : = M fit). Simultanément, Rfit) est borné par une valeur ?, (indépendante du site et du temps), ce qui oblige tout nouveau linéament à prendre la place d'un des linéaments de référence passés. Différentes stratégies sont envisageables mais il peut sembler stabilisant de remplacer aléatoirement les linéaments de référence passés tout en préservant les premiers linéaments à avoir été labellisés comme étant « de référence » (ceux ajoutés au cours de la première semaine par exemple), surtout s'ils ont été validés visuellement par un opérateur humain.

5.3.4. Redéfinition du score au vu des linéaments de référence

On redéfinit alors le score (élémentaire ou catégoriel) de façon à prendre en considération les linéaments de référence de tous les équipements ou de toutes les catégories. En utilisant à nouveau le théorème de Bayes et en remarquant que D, C et (L j r ) j r ne sont pas conditionnés l'un à l'autre, on obtient :

Pi.r = Pi,r ( L ) = PA L r Jr .D, C) = P ( A i \ D > C > ( L ) ) p i r est la probabilité d'émettre les descripteurs morphologiques D dans le contexte C sachant que c'est l'appareil A t qui a témoigné d'une activité et au vu de l'affectation de tous les linéaments de référence Lj tr . En permutant les éléments du dernier terme, en réappliquant

Bayes et en utilisant l'indépendance mutuelle de D et L jjr versus C :

Ρ ί Λ ( ) A C x p ^ A C)

Pi,r =— ΓΎ τ " κ V \ P Λ (L r )) X viAAC),

• les inventeurs ayant en effet constaté que la probabilité p (∑ ) AI A {L j ^ A (où l'indice

']' énumère tous les équipements) ne dépend que des linéaments de référence de l'appareil A it et vaut donc p(Z) A (L i r ) r A C) (où 'i' est fixé),

• l'activité de A, étant supposée indépendante des {L j, r) . r ,

· et la valeur p i) | (L jjr .) Acj étant identique pour tous les l j , il n'est pas nécessaire de calculer cette dernière.

En ne conservant de p i r que son numérateur on peut donc poser :

S i r = S M l r x Sç, en notant :

¾, = le score morphologique,

S c l = p Ai \C), \e score contextuel.

Il s'agit de l'expression du score catégoriel S jjr de L au vu des linéaments de référence L jjr . En réintroduisant les hyper-paramètres, et en reprenant le développement présenté

précédemment (cf. §5.2.1) en l'absence de linéaments de référence, on aboutit à :

Il s'agit de l'expression du score morphologique a posteriori de L, i.e. au vu des linéaments de référence L i r . pour la catégorie A, caractérisée par la fonction p,- 0 de ses hyper-paramètres. Avec la notation P j r (i9 j ) = p(i9 a posteriori de l'ensemble des L i r ,

Il s'agit de l'expression utilisée pour le score morphologique a posteriori. La valeur de ce score morphologique est évaluée via une estimation de l'intégrale ci-dessus. Concrètement, ce score est estimé à partir de N K particules notées (û i r k ) keNK dont l'histogramme approxime les lois a posteriori p i r di) via le calcul suivant :

En pratique, les particules (û r i k ) k sont générées séquentiellement à partir des particules précédentes (ι9 ί 7 -_ ΐ ) - ou bien, si ces dernières ne sont pas définies, à partir des particules (Pi ,] ) ] définies plus haut. Cette génération séquentielle de particules peut s'effectuer à l'aide d'une approche Monte Carlo séquentielle (aussi connue sous le nom de filtrage particulaire). L'utilisation d'une telle approche est rendue possible par le fait que la loi a posteriori Pi r (i9j) peut se calculer à une constante près. En effet, on a avec eurs connues de l'utilisateur.

5.3.5. Amélioration graduelle de la loi a priori (réinjection de la connaissance acquise)

Comme vu en section « Rétroaction des listes locales vers l'a priori global », on souhaite faire remonter l'information locale vers la base de données globale. Pour ce faire, il faut attendre que la loi a posteriori d'un site w soit suffisamment renseignée. Comme p(L |i9 É ) est paramétrique, la loi a posteriori p i r {d) = p(i9j |32f (£)) converge vers une distribution de Dirac δ Θ γ, où 0f peut être estimé par la méthode du MAP.

0 = arg max p iir (ûi)

Ainsi, de manière globale, pour chaque catégorie A, on constitue une collection

{Qf \w e N w ] à partir de laquelle une densité Ρι ι0 ( ί) est construite, soit de manière non- paramétrique (par exemple par des méthodes à noyau), soit de manière paramétrique par régression. Les lois a priori sont donc mises à jour en permanence pour assurer la meilleure représentativité possible. Cette rétroaction augmente la performance de la reconnaissance des linéaments, aussi bien pour les nouveaux sites qui n'ont pas encore de linéaments de référence, que pour les sites dont les linéaments de référence ne sont pas encore très nombreux.

5.4. Dispositif de mise en œuvre

On décrit, en relation avec la figure 2, un dispositif mis en œuvre pour affecter un linéament à un équipement responsable de la consommation ou à une catégorie à laquelle cet équipement appartient, selon le procédé décrit préalablement. Par exemple, le dispositif comprend une mémoire 21 constituée d'une mémoire tampon, une unité de traitement 22, équipée par exemple d'un microprocesseur, et pilotée par le programme d'ordinateur 23, mettant en œuvre un procédé de création de structure de données de consommation.

À l'initialisation, les instructions de code du programme d'ordinateur 23 sont par exemple chargées dans une mémoire avant d'être exécutées par le processeur de l'unité de traitement 22. L'unité de traitement 22 reçoit en entrée des données représentative de consommation, sous la forme de linéaments comprenant des caractéristiques morphologiques et des caractéristiques circonstancielles / contextuelles (ayant une dépendance temporelle). Le microprocesseur de l'unité de traitement 22 met en œuvre les étapes du procédé création selon les instructions du programme d'ordinateur 23 pour associer ces linéaments à des équipements prédéterminés. Pour cela, le dispositif comprend, outre la mémoire tampon 21, des moyens de communications, tels que des modules de communication réseau, des moyens de transmission de donnée et éventuellement un processeur de chiffrement.

Ces moyens peuvent se présenter sous la forme d'un processeur particulier implémenté au sein du dispositif. Selon un mode de réalisation particulier, ce dispositif met en œuvre une application particulière qui est en charge des calculs.

Ces moyens se présentent également comme des interfaces de communications permettant d'échanger des données sur des réseaux de communication, des moyens d'interrogations et de mise à jour de base de données, ...