MARCOTORCHINO, Jean-François (27 Rue Vauvenargues, Paris, Paris, F-75018, FR)
BENHADDA, Hamid (158 Rue Du Lt Colonel De Montbrison, Bat. C1 Appt. 121, Rueil Malmaison, F-92500, FR)
MARCOTORCHINO, Jean-François (27 Rue Vauvenargues, Paris, Paris, F-75018, FR)
REVENDICATIONS
1 - Procédé pour mettre en évidence des pannes susceptibles de déclencher des problèmes dans le fonctionnement d'un système, dans lequel on recueille N pannes Pi représentatives de l'état du système comportant au moins les étapes suivantes :
o on détermine l'influence d'une panne Pi sur une autre panne Pj, grâce à une base de données représentative de l'historique des pannes et d'outils statistiques adaptés à calculer le nombre de fois où une panne donnée a précédé une autre panne,
o on crée une matrice « écrêtée » G ayant comme terme général :
_ |i si n v ≥ n fl
IJ [O dans le cas contraire
o on transforme la matrice « écrêtée » G en une matrice symétrique,
o on détermine grâce à un moteur de classification des classes de pannes qui entretiennent des relations entre elles,
o on crée un graphe orienté, traduisant les relations d'influence existant entre les classes obtenues à l'étape précédente,
o on compare les données représentatives d'un état du système à un instant donné au graphe orienté et aux classes de pannes entretenant des relations entre elles, et on émet un signal au système représenta- tif du résultat de la comparaison.
2 - Procédé selon la revendication 1 , caractérisé en ce que pour obtenir des informations statistiques représentatives du fonctionnement du système, on utilise une base de données dupliquée.
3 - Procédé selon la revendication 1 , caractérisé en ce que le signal trans- mis est un signal d'alerte ou de régulation du système. 4 - Procédé selon l'une des revendications 1 à 3, caractérisé en ce qui comporte au moins les étapes suivantes :
N
• on calcule la matrice T = ∑(N + 1 - k)G k de terme général t υ
Jt=I
« on trie, ensuite, par ordre décroissant des valeurs m u de la diagonale de la matrice T ,
• on retient les premières valeurs triées comme pannes fondamentales.
5 - Procédé selon la revendication 1 , caractérisé en ce que l'étape de trans- formation de la matrice écrêtée consiste à déterminer une matrice de terme général c l} tel que les termes diagonaux sont tous égaux à un, autrement dit c B = 1,Vi = 1,2,..., .V
et pour tous les termes hors diagonale :
C ^ y — 6S y + ' S ό jι — 6 S y X 6£ jι
et ce terme est égal à un dès lors que l'un au moins des termes g υ où g β = 1
6 - Système permettant de mettre en évidence des pannes fondamentales susceptibles de déclencher des problèmes dans le fonctionnement d'un système, comprenant plusieurs capteurs pour recueillire des informations sur l'état du système, une première base de données (2) stockant les différents résultats obtenus caractérisé en ce qu'il comporte au moins une base de données dupliquée (3) et un organe de gestion et de contrôle (5) adapté à exécuter les étapes du procédé selon l'une des revendications 1 à 5 et en ce que ledit organe de gestion et de contrôle (5) reçoit les informations issues de la base de données (2) et en fonction desdites informations et des règles issues des étapes du procédé, émet un signal de commande vers le système contrôlé (1 ). |
PROCEDE DE TRAITEMENT DES DOMINANCES INTER-VARIABLES
POUR METTRE EN EVIDENCE LES FACTEURS FONDAMENTAUX
D'UNE SITUATION DE PANNE MODELISABLE PAR UN GRAPHE
L'invention concerne un procédé pour traiter les dominances intervariables permettant de mettre en évidence les facteurs fondamentaux d'une situation de panne ou de crise modélisable par un graphe.
Elle s'applique, par exemple, dans des contextes industriels où il est indispensable de contrôler des procédés et la régulation de dispositifs.
Elle s'applique, par exemple, pour détecter et gérer les pannes identifiées (ou collectées) par plusieurs capteurs surveillant des événements dans un processus industriel.
L'un des objectifs du procédé est d'identifier les facteurs les plus influents quant à l'avènement des problèmes à résoudre (comme le déclen- chement de crises, l'avènement de certaines pannes dans des usines dans le cadre, par exemple d'une conduite de processus industriel, etc.) afin de prévoir et de prévenir ces problèmes.
Il s'agit donc d'essayer de prévoir l'avènement de certaines pannes dans des usines, par exemple, avant leur réalisation, et d'isoler les pa- ramètres (ou facteurs) générateurs de ces pannes.
La présente invention met en œuvre la théorie des graphes. Cette théorie est illustrée, par exemple, dans les documents suivants :
Le cours de Graphes par Pierre Lopez, LAAS-CNRS, 16 février 2005 accessible par le lien Internet, http://www.laas.fr/~lopez/cours/GRAPHES/graphes.html,
Le livre de M. Horps et B. Roy: «Algèbre moderne et théorie des graphes orientées vers les sciences économiques et sociales, Tome 1 , Dunod 1969.
La plupart des méthodes, comme l'analyse structurelle ou la mé- thode prospective, requièrent un long processus de préparation des conditions d'analyse nécessaires à la résolution du problème considéré. L'un des inconvénients majeurs de ces méthodes, est donc la durée du processus d'analyse. Ceci est dû, en partie, au besoin de réunir des spécialistes autour d'une même table afin de :
• recenser les paramètres jugés influents pour le problème considéré,
• décrire les relations d'implication entre les paramètres retenus, et dès lors l'aspect combinatoire des relevés d'information.
En outre, ces méthodes présentent d'autres inconvénients comme :
1. la non-utilisation de la classification afin d'identifier les classes
(ou groupes) de pannes ou de paramètres qui entretiennent des relations très fortes de dépendance entre eux. Chaque classe de paramètres pouvant être considérée comme «presque» indépendante des autres classes ;
2. la non-existence d'implication entre groupes de paramètres ou de pannes: en effet, au moyen d'un outil statistique, il est possible de connaître les implications paramètre à paramètre ou panne à panne, grâce à la classification et à la définition d'indicateurs mathématiques, il est possible identifier des implications cachées en- tre des groupes de paramètres ou de disfonctionnements ou pannes.
Le procédé selon l'invention résout notamment les problèmes cités ci- dessus.
L'invention concerne un procédé pour mettre en évidence des facteurs fondamentaux susceptibles de déclencher des problèmes dans l'état d'un système, dans lequel des capteurs recueillent pendant un laps de temps suffisamment long (assez important pour avoir suffisamment de données sur lesquelles les statistiques qui seront relevées par la suite soient significatives) N paramètres ou pannes Pi représentatifs de l'état du système ou d'un disfonctionnement du système. Ces informations seront stockées dans une base de données.
Des outils d'analyse de données seront ensuite appliqués sur ces données pour faire des statistiques du type : quel est le nombre de fois n υ où la panne Pi a précédé la panne Pj et le nombre de fois n β où c'est plutôt la panne Pj qui a précédé la panne Pi. Ceci permet de générer une matrice D de dimension NxN de terme général n l} (i,j=l,...,N)
on crée ensuite une matrice « écrêtée » G ayant comme terme général :
g J 1 ή n * ≥ n»
[0 dans le cas contraire
Le procédé comporte ensuite les étapes suivantes :
on transforme la matrice « écrêtée » G en une matrice symétrique en mettant la valeur 1 dans sa diagonale (i.e. g u = 1V7 ) c'est dire que l'on suppose que toute panne est précédée par elle-même,
on détermine des classes de pannes qui entretiennent des relations entre elles,
on crée un graphe orienté, traduisant les relations d'influence existant entre les classes obtenues à l'étape précédente.
Le procédé peut aussi comporter les étapes suivantes :
N • on calcule la matrice T = ∑(N + l- k)G k de terme général t y k=l
• on trie, ensuite, par ordre décroissant des valeurs m u de la diagonale de la matrice T ,
• on retient les premières valeurs triées comme paramètres fondamentaux.
L'invention concerne aussi un système permettant de mettre en évidence des pannes fondamentales susceptibles de déclencher des problèmes dans le fonctionnement d'un système, comprenant plusieurs capteurs pour recueillire des informations sur l'état du système et une base de données stockant les différents résultats obtenus. Ce système comporte au moins une base de données dupliquée et un organe de gestion et de contrôle adapté à exécuter les étapes du procédé selon l'invention décrit ci- dessus et en ce que ledit organe de gestion et de contrôle reçoit les informations issues de la base de données et en fonction desdites informations et des règles issues des étapes du procédé, émet un signal de commande vers le système contrôlé.
L'invention présente notamment les avantages suivants :
• la solution proposée permet de mettre en évidence différents groupes (ou classes) de paramètres ou de pannes entretenant des influences fortes grâce à l'étape de classification 7,
• elle permet aussi de déduire, à partir des influences individuelles d'origine (étape) et de la classification (étape), des influences entre groupes de paramètres ou entre groupes de pannes,
• la dernière étape, permet de mettre en évidence la hiérarchie d'importance à accorder aux différents paramètres ou pannes et sur- tout de mettre en évidence les cercles vicieux d'entretien de la problématique étudiée (crise, risque, etc.) entretien des pannes et de l'enchaînement de différentes pannes dans un processus industriel.
D'autres caractéristiques et avantages de la présente invention apparaîtront mieux à la lecture de la description qui suit d'un exemple de réalisation donné à titre illustratif et nullement limitatif, annexé d'une figure unique qui représente un exemple de système selon l'invention et les étapes du procédé mis en œuvre.
La figure unique décrit un exemple de succession d'étapes mises en œuvre par l'invention et un exemple de système permettant d'exécuter le procédé.
Le procédé selon l'invention comporte notamment les étapes sui- vantes :
1. Recueillir différents éléments clés caractérisant une panne ou un dysfonctionnement d'un système.
Par exemple, dans le cas d'un processus industriel, on dispose différents capteurs d, C 2 , ...CN, dans un processus industriel et on recueille les informations collectées par ces capteurs dans une première base de données. Ceci est effectué à différents moments et pendant un laps de temps suffisamment long. La base de données contient alors un historique assez important des pannes survenues pendant le temps d'observation. Ces données re- présentatives de l'historique seront alors utilisées pour apprendre les interactions qu'entretiennent entre elles toutes pannes, c'est l'étape d'apprentissage.
2. Mettre en œuvre des méthodes statistiques, connues de l'Homme du métier, en travaillant sur une base de données dupli- quées contenant les données retenues dans la première base de données, et déduire une relation existante entre les différentes pannes mesurées dans le système. A la fin de cette étape, le procédé dispose du type de pannes observées pendant le temps d'observation, de leur fréquence d'apparition et du nombre de
fois où une panne Pi a précédé une Panne Pj. Il dispose d'une matrice D de dimension NxN de terme général n i} (i,j=l,...,N)
3. lors de l'étape suivante étape 3), le procédé va créer une matrice «écrêtée» G ,
Cela consiste, par exemple, à comparer les termes n υ et n μ . La matrice G a comme terme général g υ tel que :
g J 1 si n 'j ≥ n j'
[0 dans le cas contraire
ceci donne lieu à un «graphe orienté» représentant les relations d'influences entre les différents paramètres,
4. on transforme ensuite la matrice G en une matrice symétrique C , appelée « Matrice de Condorcet » (Thèse de Hamid Benhadda intitulée « "La similarité régularisée et ses applications en classification automatique" Université Paris Vl, 1998), de terme général c y tel que les termes diagonaux sont tous égaux à un, autrement dit :
c B = 1, Vi = 1,2, ... , #
et pour tous les termes hors diagonale :
i j S ι j S j ι S ι j σ j ι
Ce terme sera égal à un dès lors que l'un, au moins, des termes g v où g }l = 1.
5. on calcule ensuite la partition «la plus proche possible» de la matrice de Condorcet C ou «problème de Zahn».
Ceci permet notamment d'obtenir des classes de paramètres entretenant des relations d'influences fortes entre eux.
6. On associe, étape 6) un indicateur mathématique à une classe de paramètres, et
7. on crée ensuite un graphe orienté étape 7) traduisant les relations d'influence existantes entre les classes obtenues à l'étape précé- dente. Le graphe traduit, non plus les influences des pannes une à une, mais plutôt l'influence d'un groupe de pannes sur un autre.
On associe, par exemple, un indicateur mathématique à chaque classe. Par exemple, il est possible de déterminer le nombre d'arcs sortants d'une classe (ou groupe de paramètres) et de rechercher quel est le groupe qui présente le plus grand nombre d'arcs sortants. C'est cette classe de pannes qui sera considérée comme étant la plus influente, donc qui sera considérée comme la plus importante.
Selon une autre variante de réalisation, il est possible de déterminer ou calculer des chemins en boucles du graphe induit par la matrice G afin de déterminer, individuellement, l'importance des pannes mis en jeu au cours des étapes précédentes.
Pour cela le procédé exécute les étapes suivantes :
N
• on calcule la matrice T = ∑(iV + 1 - k)G k de terme général t y
• on trie, ensuite, par ordre décroissant des valeurs m u de la diagonale de la matrice T . Les pannes correspondantes aux premières valeurs triées sont les pannes fondamentales pour la problématique étudiée,
• on classe les sommets du graphe par nombre de boucles (cercles vicieux) décroissantes, (les pannes clés et fonda- mentaux du dysfonctionnement étant ceux du haut du classement).
La figure unique schématise un exemple de dispositif permettant de mettre en œuvre l'invention, dans le cas d'une surveillance de panne dans un procédé industriel. Le système comprend une base de données principale ayant pour fonction de mémoriser les valeurs mesurées par des capteurs à un instant donné, et aussi sur une période de temps, un processeur (non représenté pour des raisons de simplification) adapté à exécuter les différentes étapes du procédé, étapes qui ont été décrites ci-dessus. Le système dispose de plusieurs capteurs Ci, C 2 , ...C N reliés à un réseau de machines 1. Les capteurs sont reliés à la première base de données 2 qui mémorise les informations et valeurs issues des capteurs. La base de données 2 est dupliquée en une base de données 3, afin de permettre d'élaborer les relations existantes entre les pannes, la fréquence des pannes en mettant en œuvre l'outil statistique précité.
L'outil statistique 4 permet par une méthode d'apprentissage connue de l'Homme du métier de déterminer les statistiques des pannes et leur relation. La matrice D est ainsi générée, en exécutant sur la base de données 3 dupliquée, les étapes précitées, ceci pour plusieurs états du système donné.
Le procédé continue à s'exécuter en générant la matrice écrêtée G, à partir de laquelle on transforme cette matrice G en une matrice symétrique et on détermine les classes de pannes qui entretiennent des relations entre elles, par exemple en utilisant un moteur de classification, puis on associe un indicateur mathématique relié à une classe et on crée un graphe orienté traduisant les relations d'influence existant entre les différentes clas- ses,
En parallèle, on calcul des chemins en boucles du graphe induit par la matrice G et on classe les sommets du graphe par nombre de boucles décroissantes, puis on détermine l'importance d'un ou des paramètres dans le problème posé.
L'étape suivante consiste à transmettre les informations suivantes à un organe de contrôle et de gestion 5 ou processeur : les classes de ressemblance des pannes influant les unes sur les autres, importance des pannes et les données contenues dans la base de données 2 à un instant fixé, afin que l'organe de gestion et de contrôle détermine les pannes probables, élabore des règles de fonctionnement et alerte l'utilisateur afin qu'il interagisse sur le réseau de machines. Cette dernière étape peut être réalisée de façon automatique en utilisant un logiciel approprié qui compare les valeurs mesurées par les capteurs contenues dans une base de données à des seuils fixés et qui va ensuite délivrer différents ordres à des moyens de régulation. L'alerte est, par exemple, effectuée sous la forme d'un signal émis qui permet la régulation d'organes du système ou encore leur arrêt en cas de pannes sévères.
Les capteurs peuvent être des capteurs de mesure de température, de pression, de vitesse ou tout autre type de capteurs habituellement utilisés dans des procédés industriels.
L'utilisation d'une base de données dupliquées permet d'obtenir des informations sur une durée de temps suffisante pour avoir des statistiques significatives. Sur cette base, le procédé exécute différentes statisti- ques ou de l'analyse de données en général afin d'obtenir des règles du type : Telle panne Pi est suivie ou résulte de telle autre panne Pj dans X% des cas, par exemple.
L'invention peut être appliquée dans différents domaines tels que les procédés industriels, les risques en banque et en finance, les risques sa- nitaires et dans le domaine de détection de crises.
Le procédé peut aussi être utilisé de manière plus générale dans un contexte de gestion de dysfonctionnement. Il comprend alors les étapes décrites ci-après.
recueillir différents éléments clés caractérisant un dysfonctionnement d'un système.
Par exemple, on peut recueillir les réponses faites par des personnes qualifiées à la question : «d'après vous quels sont les fac- teurs qui interviennent dans le déclenchement de tel problème ?»,
rechercher l'intersection thématique dans les discours ou dans le tableau élaboré,
Sélectionner N paramètres (ou facteurs) clés décrivant le dys- fonctionnement (une vingtaine de paramètres),
La sélection des paramètres se fait par recoupement des réponses fournies par exemple par les experts ou des résultats stockés dans le tableau élaboré au moyen d'un logiciel adapté,
Questions aux experts :
Une fois les N paramètres clés sélectionnés, on demande, par
exemple, à chaque expert E k de répondre à — - '- questions
du type: « P ι => P J ? », autrement dit «le paramètre P 1 a une influence directe sur le paramètre P 1 ? ».
A chaque question, un expert pourra donner les réponses (-1 ,0,1 , 2) dont les significations sont :
- -1 P 1 <= p c'est P qui a une influence directe sur P 1
0 il n'y a pas d'implication directe entre P 1 et P 1 , ni dans un sens, ni dans l'autre,
1 oui P
- 2 P 1 <=> P j , il y a implication réciproque entre P 1 et P 1
Le choix de ce codage étant motivé par le besoin de diviser par deux le nombre de questions posées aux experts.
A partir des réponses données ci-dessus, le procédé va représen- ter l'opinion de chaque expert E k par une matrice relationnelle
«de dominance» D k
de dimensions iV 2
et de terme général
[o dans le cas contraire l'étape suivante, consiste notamment à agréger des opinions in- dividuelles des M experts. Par exemple, on peut additionner terme à terme les M matrices relationnelles D k en une matrice globale unique «consensus» D de terme général d l} représentant le nombre d'experts ayant jugés que le paramètre P 1 a une influence directe sur le paramètre P 7 ,
lors de l'étape suivante, le procédé va créer une matrice «écrê- tée» G ,
Cela consiste, par exemple, à comparer les termes d υ et d β de la matrice de dominance D . Cette matrice a comme terme général 8 υ tel que :
i J ^ ≥ ^ υ [0 dans le cas contraire
ceci donne lieu à un «graphe orienté» représentant les relations d'influences entre les différents paramètres,
on transforme ensuite la matrice G en une matrice symétrique
C , appelée « Matrice de Condorcet » (Thèse de Hamid Benhad- da intitulée « "La similarité régularisée et ses applications en
classification automatique" Université Paris Vl, 1998), de terme général c l} tel que les termes diagonaux sont tous égaux à un, autrement dit :
C 11 = 1,Vi = 1,2,... ,.V
et pour tous les termes hors diagonale :
C c y — 6 P i j + ^ S P ji — δ P y X ^ &P j i
Ce terme sera égal à un dès lors que l'un, au moins, des termes
Eu Où g β = 1 .
on calcule ensuite la partition «la plus proche possible» de la ma- trice de Condorcet C ou «problème de Zahn».
Ceci permet notamment d'obtenir des classes de paramètres entretenant des relations d'influences fortes entre eux.
On associe, ensuite un indicateur mathématique à une classe de paramètres, et
on crée ensuite un graphe orienté étape traduisant les relations d'influence existantes entre les classes obtenues à l'étape précédente. Le graphe traduit, non plus les influences des paramètres un à un, mais plutôt l'influence d'un groupe de paramètres sur un autre.
