Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR EXCHANGING DATA BETWEEN ENTITIES
Document Type and Number:
WIPO Patent Application WO/2020/127923
Kind Code:
A1
Abstract:
The present invention relates to a method for exchanging data between entities (6, 7, 8), the method comprising the steps of: - receiving a descriptor vector of a first element, - predicting the class of the first element using a prediction model on the basis of the descriptor vector of the first element, - determining the contribution of each variable describing the first element in order to ascertain the class of the first element, - selecting a subset of variables describing the first element, - determining, from at least a second element on the basis of the descriptor vector of the first element, the class predicted for the first element and the selected subset of variables describing the first element, and - sending the descriptor vector of the first element, the class of the first element, the descriptor vector of the second element and the class of the second element.

Inventors:
GRAH SIMON (FR)
THOUVENOT VINCENT (FR)
BOETTO CHRISTOPHE (FR)
Application Number:
PCT/EP2019/086605
Publication Date:
June 25, 2020
Filing Date:
December 20, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
THALES SA (FR)
International Classes:
G08G3/00; G06F16/35; G06F16/45; G06N3/08; G06N5/00; G06N20/00; G16H50/20
Domestic Patent References:
WO2004053814A12004-06-24
Foreign References:
US9569959B12017-02-14
CN107797149A2018-03-13
EP3291206A12018-03-07
US20100052948A12010-03-04
Other References:
PAPERNOT NICOLAS ET AL: "The Limitations of Deep Learning in Adversarial Settings", 2016 IEEE EUROPEAN SYMPOSIUM ON SECURITY AND PRIVACY (EUROS&P), IEEE, 21 March 2016 (2016-03-21), pages 372 - 387, XP032899541, ISBN: 978-1-5090-1751-5, [retrieved on 20160509], DOI: 10.1109/EUROSP.2016.36
BATTISTA BIGGIO ET AL: "Security Evaluation of Pattern Classifiers under Attack", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 2 September 2017 (2017-09-02), XP080817905, DOI: 10.1109/TKDE.2013.57
POTHITOS MICHAIL ET AL: "Multi-sensor image fusion and target classification for improved maritime domain awareness", 2016 19TH INTERNATIONAL CONFERENCE ON INFORMATION FUSION (FUSION), ISIF, 5 July 2016 (2016-07-05), pages 1170 - 1177, XP032935141
Attorney, Agent or Firm:
HABASQUE, Etienne et al. (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Procédé d’échanges de données entre des entités (6, 7, 8), le procédé comprenant les étapes de :

- fourniture d’un modèle de prédiction configuré pour prédire la classe d’un élément parmi un ensemble de classes en fonction d’un vecteur descripteur (x) de l’élément, chaque vecteur descripteur (x) comprenant un ensemble de variables descriptives (x,),

- réception d’un vecteur descripteur (x) d’un premier élément (E1 ), le vecteur descripteur (x) étant en provenance d’une première entité (6), l’étape de réception étant mise en oeuvre par une unité de réception (7A) d’une deuxième entité (7),

- prédiction de la classe du premier élément (E1 ) par le modèle de prédiction en fonction du vecteur descripteur (x) du premier élément (E1 ), l’étape de prédiction étant mise en oeuvre par ordinateur,

- détermination, pour l’obtention de la classe du premier élément (E1 ), de la contribution de chaque variable descriptive (x,) du premier élément (E1 ), l’étape de détermination étant mise en oeuvre par ordinateur,

- sélection d’un sous-ensemble de variables descriptives (x,) du premier élément (E1 ) dont la contribution vérifie un critère de prépondérance relativement aux contributions de l’ensemble des variables descriptives (x,) du premier élément (E1 ), l’étape de sélection étant mise en oeuvre par ordinateur,

- détermination, le cas échéant, d’au moins un deuxième élément (E2) en fonction du vecteur descripteur (x) du premier élément (E1 ), de la classe prédite pour le premier élément (E1 ) et du sous-ensemble sélectionné de variables descriptives (x,) du premier élément (E1 ), l’étape de détermination étant mise en oeuvre par ordinateur, le deuxième élément (E2) vérifiant les conditions suivantes :

- la distance entre le vecteur descripteur (x) du premier élément (E1 ) et le vecteur descripteur (x) du deuxième élément (E2) est inférieure à un seuil prédéterminé,

- au moins une variable descriptive (x,) du deuxième élément (E2) à une valeur différente de la variable descriptive (x,) correspondante du premier élément (E1 ) et appartient au sous-ensemble sélectionné de variables descriptives (x,) du premier élément (E1 ), et - l’image du vecteur descripteur (x) du deuxième élément (E2) par le modèle de prédiction est une classe différente de la classe du premier élément (E1 ),

- envoi, par une unité d’émission (7B) de la deuxième entité (7), à une troisième entité (8), du vecteur descripteur (x) du premier élément (E1 ), de la classe du premier élément (E1 ) et, le cas échéant, du vecteur descripteur (x) du deuxième élément (E2) et de la classe du deuxième élément (E2).

2. Procédé selon la revendication 1 , dans lequel le critère de prépondérance stipule que le sous-ensemble sélectionné de variables descriptives (x,) comprend les N premières variables descriptives (x,) ayant la contribution la plus élevée, N étant un entier naturel prédéterminé.

3. Procédé selon la revendication 1 , dans lequel le critère de prépondérance stipule que le sous-ensemble sélectionné de variables descriptives (x,) comprend :

- la variable descriptive (x,) dont la contribution est la plus élevée parmi l’ensemble des variables descriptives (x,), et

- la ou les variables descriptives (x,) dont la contribution est supérieure au produit de la contribution la plus élevée par un nombre prédéterminé compris entre zéro et un.

4. Procédé selon l’une quelconque des revendications 1 à 3, dans lequel la contribution de chaque variable descriptive (x,) du premier élément (E1 ) est une valeur de Shapley.

5. Procédé selon l’une quelconque des revendications 1 à 4, dans lequel le deuxième élément (E2) est déterminé en fonction d’un modèle de détermination entraîné selon une base d’entraînement, la base d’entraînement comprenant des vecteurs descripteurs d’éléments et des classes, chaque vecteur descripteur (x) étant associé à une classe.

6. Procédé selon l’une quelconque des revendications 1 à 5, dans lequel le deuxième élément (E2) déterminé vérifie, en outre, la condition selon laquelle chaque variable descriptive (x,) du deuxième élément (E2) ayant une valeur différente de la variable descriptive (x,) correspondante du premier élément (E1 ) appartient au sous-ensemble sélectionné de variables descriptives (x,) du premier élément (E1 ).

7. Procédé selon l’une quelconque des revendications 1 à 6, dans lequel le procédé comprend une étape de validation de la classe prédite pour le premier élément (E1 ) lorsqu’aucun deuxième élément (E2) ne vérifie l’ensemble des contraintes.

8. Procédé selon l’une quelconque des revendications 1 à 7, dans lequel au moins une variable descriptive (x,) du vecteur descripteur (x) du premier élément (E1 ) est issue de mesures effectuées par au moins un capteur.

9. Procédé selon l’une quelconque des revendications 1 à 8, dans lequel la première et la troisième entité (6, 8) sont identiques.

10. Produit programme d’ordinateur comportant un support lisible d’informations, sur lequel est mémorisé un programme d’ordinateur comprenant des instructions de programme, le programme d’ordinateur étant chargeable sur une unité de traitement de données et adapté pour entraîner la mise en oeuvre d’un procédé selon l’une quelconque des revendications 1 à 9 lorsque le programme d’ordinateur est mis en oeuvre sur l’unité de traitement des données.

Description:
DESCRIPTION

TITRE : Procédé d’échanges de données entre des entités

La présente invention concerne un procédé d’échanges de données entre des entités. La présente invention se rapporte aussi à un produit programme d’ordinateur associé.

Dans le domaine naval, les échanges de données entre un navire et des opérateurs à distance permettent aux opérateurs de contrôler la cohérence du trajet du navire en fonction de la nature du navire. Pour cela, les opérateurs sont, par exemple, amenés à comparer le trajet du navire avec des trajets déjà effectués par des navires de même nature.

Lorsqu’un opérateur détecte qu’un navire effectue un trajet non-cohérent, il est alors susceptible de mettre en place une surveillance plus approfondie du navire afin de mieux comprendre la cause du trajet inhabituel et, éventuellement, d’identifier des activités illicites.

Néanmoins, la mise en place d’une telle surveillance est chronophage et la fiabilité de ses résultats n’est pas garantie.

Il existe donc un besoin pour un procédé d’échange de données entre des entités qui permettent de mieux évaluer les données échangées entre les entités.

Pour cela, la présente description porte sur un procédé d’échange de données comprenant les étapes de :

- fourniture d’un modèle de prédiction configuré pour prédire la classe d’un élément parmi un ensemble de classes en fonction d’un vecteur descripteur de l’élément, chaque vecteur descripteur comprenant un ensemble de variables descriptives,

- réception d’un vecteur descripteur d’un premier élément, le vecteur descripteur étant en provenance d’une première entité, l’étape de réception étant mise en oeuvre par une unité de réception d’une deuxième entité,

- prédiction de la classe du premier élément par le modèle de prédiction en fonction du vecteur descripteur du premier élément, l’étape de prédiction étant mise en oeuvre par ordinateur,

- détermination, pour l’obtention de la classe du premier élément, de la contribution de chaque variable descriptive du premier élément, l’étape de détermination étant mise en oeuvre par ordinateur, - sélection d’un sous-ensemble de variables descriptives du premier élément dont la contribution vérifie un critère de prépondérance relativement aux contributions de l’ensemble des variables descriptives du premier élément, l’étape de sélection étant mise en oeuvre par ordinateur,

- détermination, le cas échéant, d’au moins un deuxième élément en fonction du vecteur descripteur du premier élément, de la classe prédite pour le premier élément et du sous-ensemble sélectionné de variables descriptives du premier élément, l’étape de détermination étant mise en oeuvre par ordinateur, le deuxième élément vérifiant les conditions suivantes :

- la distance entre le vecteur descripteur du premier élément et le vecteur descripteur du deuxième élément est inférieure à un seuil prédéterminé,

- au moins une variable descriptive du deuxième élément à une valeur différente de la variable descriptive correspondante du premier élément et appartient au sous-ensemble sélectionné de variables descriptives du premier élément, et

- l’image du vecteur descripteur du deuxième élément par le modèle de prédiction est une classe différente de la classe du premier élément,

- envoi, par une unité d’émission de la deuxième entité, à une troisième entité, du vecteur descripteur du premier élément, de la classe du premier élément et, le cas échéant, du vecteur descripteur du deuxième élément et de la classe du deuxième élément.

Suivant des modes de réalisation particuliers, le procédé d’échange comprend une ou plusieurs des caractéristiques suivantes, prise(s) isolément ou suivant toutes les combinaisons techniquement possibles :

- le critère de prépondérance stipule que le sous-ensemble sélectionné de variables descriptives comprend les N premières variables descriptives ayant la contribution la plus élevée, N étant un entier naturel prédéterminé ;

- le critère de prépondérance stipule que le sous-ensemble sélectionné de variables descriptives comprend :

- la variable descriptive dont la contribution est la plus élevée parmi l’ensemble des variables descriptives, et

- la ou les variables descriptives dont la contribution est supérieure au produit de la contribution la plus élevée par un nombre prédéterminé compris entre zéro et un ; - la contribution de chaque variable descriptive du premier élément est une valeur de Shapley ;

- le deuxième élément est déterminé en fonction d’un modèle de détermination entraîné selon une base d’entraînement, la base d’entraînement comprenant des vecteurs descripteurs d’éléments et des classes, chaque vecteur descripteur étant associé à une classe ;

- le deuxième élément déterminé vérifie, en outre, la condition selon laquelle chaque variable descriptive du deuxième élément ayant une valeur différente de la variable descriptive correspondante du premier élément appartient au sous- ensemble sélectionné de variables descriptives du premier élément ;

- le procédé comprend une étape de validation de la classe prédite pour le premier élément lorsqu’aucun deuxième élément ne vérifie l’ensemble des contraintes ;

- au moins une variable descriptive du vecteur descripteur du premier élément est issue de mesures effectuées par au moins un capteur ;

- la première et la troisième entité sont identiques.

La présente description se rapporte également à un produit programme d’ordinateur comportant un support lisible d’informations, sur lequel est mémorisé un programme d’ordinateur comprenant des instructions de programme, le programme d’ordinateur étant chargeable sur une unité de traitement de données et adapté pour entraîner la mise en oeuvre d’un procédé tel que décrit précédemment lorsque le programme d’ordinateur est mis en oeuvre sur l’unité de traitement des données.

La présente description concerne aussi un support lisible d’informations sur lequel est mémorisé un produit programme d’ordinateur tel que décrit précédemment.

D’autres caractéristiques et avantages de l’invention apparaîtront à la lecture de la description qui suit de modes de réalisation de l’invention, donnés à titre d’exemple uniquement et en référence aux dessins qui sont :

[Fig 1] la figure 1 est une représentation schématique d’un exemple de plusieurs entités échangeant des données,

[Fig 2] la figure 2 est une représentation schématique d’un exemple d’un calculateur de l’une des entités de la figure 1 ,

[Fig 3] la figure 3 est un organigramme d’un exemple de mise en oeuvre d’un procédé d’échange de données,

[Fig 4] la figure 4 est une représentation schématique d’un exemple expliquant la contribution de chaque variable descriptive d’un vecteur descripteur à l’obtention d’une classe prédite par un modèle de prédiction, et [Fig 5] la figure 5 est une représentation schématique d’un exemple d’un premier élément et de deuxièmes éléments déterminés au cours de la mise en oeuvre d’un procédé d’échange de données.

Une première entité 6, une deuxième entité 7 et une troisième entité 8 sont illustrés par la figure 1.

La première entité 6 est, typiquement, une entité propre à collecter des données relatives à un premier élément. Les données collectées forment le vecteur descripteur du premier élément. Le vecteur descripteur comprend un ensemble de variables descriptives.

La première entité 6 est, par exemple, un dispositif ou une personne physique.

Par exemple, dans le domaine naval, la première entité 6 est un navire propre à délivrer des messages AIS (de l’anglais Automatic Identification System, traduit en français par Système d’identification automatique) à une fréquence d’émission dépendant de caractéristiques du navire (par exemple un bateau au port émettra un message à une fréquence moins élevé qu’un navire à flot). Le premier élément est alors un message AIS délivré par le navire.

Dans le domaine de la maintenance, la première entité 6 est, par exemple, un calculateur ou un opérateur. Le premier élément est, par exemple, un équipement à surveiller.

Dans le domaine médical, la première entité 6 est, par exemple, une unité de mesure, un calculateur ou une personne physique, tel qu’un médecin. Le premier élément est, par exemple, une tumeur à analyser.

La première entité 6 est propre à fournir le vecteur descripteur du premier élément à la deuxième entité 7, par exemple, via une unité d’émission. La transmission de données entre la première entité 6 et la deuxième entité 7 est effectuée directement ou indirectement par l’intermédiaire d’entités intermédiaires.

La deuxième entité 7 est, typiquement, une entité configurée pour analyser le premier élément en fonction du vecteur descripteur du premier élément. La deuxième entité 7 est, avantageusement, propre à transmettre le résultat de l’analyse du premier élément à la troisième entité 8. La transmission de données entre la deuxième entité 7 et la troisième entité 8 est effectuée directement ou indirectement par l’intermédiaire d’entités intermédiaires.

Comme illustré par la figure 1 , la deuxième entité 7 comprend une unité de réception 7A, une unité d’émission 7B, un calculateur 10 et un produit programme d’ordinateur 12.

L’unité de réception 7A et l’unité d’émission 7B forment, par exemple, un système antennaire. Le calculateur 10 et le produit programme d’ordinateur 12 sont illustrés plus en détails par la figure 2.

Le calculateur 10, est de préférence, un ordinateur.

Plus généralement, le calculateur 10 est un calculateur électronique propre à manipuler et/ou transformer des données représentées comme des quantités électroniques ou physiques dans des registres de calculateur 10 et/ou des mémoires en d’autres données similaires correspondant à des données physiques dans des mémoires, des registres ou d’autres types de dispositifs d’affichage, de transmission ou de mémorisation.

Le calculateur 10 est en interaction avec le produit programme d’ordinateur 12.

Comme illustré par la figure 2, le calculateur 10 comporte un processeur 14 comprenant une unité de traitement de données 16, des mémoires 18 et un lecteur 20 de support d’informations. Dans l’exemple illustré par la figure 2, le calculateur 10 comprend un clavier 22 et une unité d’affichage 24.

Le produit programme d’ordinateur 12 comporte un support d’informations 26.

Le support d’information 26 est un support lisible par le calculateur 10, usuellement par l’unité de traitement de données 16. Le support lisible d’informations 26 est un médium adapté à mémoriser des instructions électroniques et capable d’être couplé à un bus d’un système informatique.

A titre d’exemple, le support d’informations 26 est une disquette ou disque souple (de la dénomination anglaise « Floppy dise »), un disque optique, un CD-ROM, un disque magnéto-optique, une mémoire ROM, une mémoire RAM, une mémoire EPROM, une mémoire EEPROM, une carte magnétique ou une carte optique.

Sur le support d’informations 26 est mémorisé le programme d’ordinateur 12 comprenant des instructions de programme.

Le programme d’ordinateur 12 est chargeable sur l’unité de traitement de données 16 et est adapté pour entraîner la mise en oeuvre d’étapes d’un procédé d’échange de données lorsque le programme d’ordinateur 12 est mis en oeuvre sur l’unité de traitement 16 du calculateur 10.

La troisième entité 8 est, typiquement, une entité propre à recevoir les données envoyées par la deuxième entité 7 et à prendre des décisions relatives au premier élément, en fonction des données reçues.

Par exemple, la troisième entité 8 est une personne physique. En variante, la troisième entité 8 est un calculateur comprenant une mémoire dans lequel les données reçues sont mémorisées. Dans un exemple, la première entité 6 et la troisième entité 8 sont identiques, c’est-à-dire que la première et la troisième entité 8 forme une seule et même entité.

Dans encore un autre exemple, la première entité 6, la deuxième entité 7 et/ou la troisième entité 8 sont identiques.

Un exemple d’un procédé d’échange de données entre des entités va maintenant être décrit en référence à la figure 3.

Le procédé d’échange de données comprend une étape 100 de fourniture d’un modèle de prédiction configuré pour prédire la classe d’un élément parmi un ensemble de classes en fonction d’un vecteur descripteur de l’élément. Chaque vecteur descripteur comprend un ensemble de variables descriptives.

Le modèle de prédiction est, par exemple, obtenu par entraînement d’un réseau de neurones selon une base d’entraînement comprenant des vecteurs descripteurs d’éléments et des classes, chaque vecteur descripteur étant associé à une classe.

De manière générale, le modèle de prédiction est configuré pour déterminer une probabilité et pour retourner en sortie une classe correspondant à un intervalle de probabilité.

Dans le domaine naval, les éléments sont, par exemple, des messages AIS. Le vecteur descripteur de chaque message AIS comprend, par exemple, une ou plusieurs des variables descriptives suivantes :

- la vitesse du navire,

- le cap du navire,

- la latitude du navire,

- la longitude du navire,

- le type du navire (cargo, navire pétrolier, etc),

- le statut de navigation du navire (en marche, amarré, etc),

- les données temporelles du message, telles que la date et l’heure de délivrance du message AIS, et

- des données relatives à la nature du message AIS telles que la destination du message AIS.

Dans l’exemple des messages AIS, le modèle de prédiction est configuré pour classifier chaque élément dans des classes relatives à la nature du navire dont est issu le message AIS. Par exemple, le modèle de prédiction est configuré pour prédire deux classes : la classe « cargo » (le navire émetteur est considéré être un cargo) tant que la probabilité que le navire soit un cargo est supérieure à une valeur prédéterminée et la classe « non-cargo » (le navire émetteur est considéré être un bateau différent d’un cargo) lorsque la probabilité que le navire soit un cargo est inférieure à la valeur prédéterminée. Alternativement, le modèle de prédiction est configuré pour prédire plusieurs classes de navires, par exemple, « cargo », « navire pétrolier », « navire de pêche », etc.

En variante, dans le domaine de la maintenance, les éléments sont, par exemple, des équipements à surveiller. Le vecteur descripteur de chaque équipement comprend, par exemple, une ou plusieurs des variables descriptives suivantes :

- le modèle de l’équipement,

- la date de mise en service de l’équipement,

- des données relatives à l’environnement de l’équipement (température, par exemple), et

- la date du dernier défaut détecté sur un ou chaque composant de l’équipement.

Dans l’exemple des équipements à surveiller, le modèle de prédiction est configuré pour classifier chaque élément dans des classes relatives à l’opportunité d’effectuer une action de maintenance sur l’équipement. Par exemple, le modèle de prédiction est configuré pour prédire deux classes : la classe « action de maintenance requise » et la classe « action de maintenance non requise ».

Encore en variante, dans le domaine médical, les éléments sont, par exemple, des tumeurs à analyser. Le vecteur descripteur de chaque tumeur comprend, par exemple, une ou plusieurs des variables descriptives suivantes :

- le rayon de la tumeur,

- la densité de la tumeur,

- la dureté de la tumeur,

- la circonférence de la tumeur, et

- le périmètre de la tumeur.

Dans l’exemple des tumeurs, le modèle de prédiction est configuré pour classifier chaque élément dans des classes relatives à la probabilité que la tumeur soit cancéreuse ou non. Par exemple, le modèle de prédiction est configuré pour prédire deux classes : la classe « cancéreuse » et la classe « non-cancéreuse ».

Le procédé d’échange de données comprend une étape 1 10 de réception, par l’unité de réception 7A de la deuxième entité 7, d’un vecteur descripteur d’un premier élément. Le vecteur descripteur du premier élément est avantageusement en provenance de la première entité 6.

Avantageusement, au moins une variable descriptive du vecteur descripteur est issue de mesures effectuées par au moins un capteur, que ce soient des mesures de l’environnement du premier élément ou des mesures du premier élément lui-même. Le procédé d’échange de données comprend une étape 120 de prédiction de la classe du premier élément par le modèle de prédiction en fonction du vecteur descripteur du premier élément. L’étape de prédiction 120 est mise en oeuvre par le calculateur 10 en interaction avec le produit programme d’ordinateur 12, c’est-à-dire est mise en oeuvre par ordinateur.

Par exemple, dans le domaine naval, lorsque le premier élément est un message AIS, la classe du premier élément est prédite parmi la classe « cargo » et la classe « non- cargo ».

Par exemple, dans le domaine de la maintenance, lorsque le premier élément est un équipement à surveiller, la classe du premier élément est prédite parmi la classe « action de maintenance requise » et la classe « action de maintenance non requise ».

Par exemple, dans le domaine médical, lorsque le premier élément est une tumeur à analyser, la classe du premier élément est prédite parmi la classe « cancéreuse » et la classe « non-cancéreuse ».

Le procédé d’échange de données comprend une étape 130 de détermination, pour l’obtention de la classe du premier élément, de la contribution de chaque variable descriptive du premier élément. En d’autres termes, l’étape 130 vise à déterminer la contribution de chaque variable descriptive dans la sortie du modèle de prédiction. Avantageusement, la somme des contributions déterminées de chaque variable permet d’expliquer la sortie du modèle de prédiction. L’étape de détermination 130 est mise en oeuvre par le calculateur 10 en interaction avec le produit programme d’ordinateur 12, c’est-à-dire est mise en oeuvre par ordinateur.

Dans l’exemple illustré par la figure 4, le vecteur descripteur est noté « x », le modèle de prédiction est noté « f » et la classe prédite par le modèle de prédiction est notée « f(x) ». Le vecteur descripteur x comprend trois variables descriptives : xn, x,2 et x,3. Une valeur de base correspondant, par exemple, à la sortie moyenne du modèle de prédiction est notée « V 0 » . Dans cet exemple, la première variable descriptive xn et la deuxième variable descriptive x,2 ont contribué à augmenter la valeur de f(x) par rapport à la valeur de base V 0 , alors que la troisième variable descriptive x,3 a contribué à baisser la valeur de f(x) par rapport à la valeur de base V 0 . La contribution des première et deuxième variables descriptives xn, x,2 est donc positive et plus importante pour la deuxième variable descriptive x,2. La contribution de la troisième variable descriptive x,3 est négative.

Lorsque le premier élément est un message AIS, la première variable descriptive xn est, par exemple, la vitesse (1 ,5 noeuds), la deuxième variable descriptive x,2 est, par exemple, le statut de navigation (amarré) et la troisième variable descriptive x,3 est, par exemple, la latitude (45°).

Dans un exemple de réalisation, la contribution de chaque variable descriptive est obtenue sur la base d’une méthode utilisée dans le domaine des jeux coopératifs et consistant à répartir un gain entre des joueurs en fonction de leur contribution vis-à-vis du gain. Dans le cas d’espèce, par analogie, le jeu est la tâche de prédiction d’une classe pour un vecteur descripteur x, le gain est la classe prédite f(x) et les joueurs sont les variables descriptibles x, du vecteur descripteur x. La contribution de chaque variable descriptive du premier élément est alors une valeur de Shapley.

Le procédé d’échange de données comprend une étape 140 de sélection d’un sous-ensemble de variables descriptives du premier élément dont la contribution vérifie un critère de prépondérance relativement aux contributions de l’ensemble des variables descriptives du premier élément. L’étape de sélection 140 est mise en oeuvre par le calculateur 10 en interaction avec le produit programme d’ordinateur 12, c’est-à-dire est mise en oeuvre par ordinateur.

Dans un exemple, le critère de prépondérance stipule que le sous-ensemble sélectionné de variables descriptives comprend les N premières variables descriptives ayant la contribution la plus élevée, N étant un entier naturel prédéterminé.

Dans un autre exemple, le critère de prépondérance stipule que le sous-ensemble sélectionné de variables descriptives comprend :

- la variable descriptive dont la contribution est la plus élevée parmi l’ensemble des variables descriptives, et

- la ou les variables descriptives dont la contribution est supérieure au produit de la contribution la plus élevée par un nombre prédéterminé compris entre zéro et un.

En complément facultatif, des variables descriptives prédéfinies sont fixées et ne peuvent pas être sélectionnées pour faire partie du sous-ensemble de variables descriptives.

Dans l’exemple des messages AIS, les variables descriptives prépondérantes sont, par exemple, la latitude, la vitesse et le statut de navigation.

Dans l’exemple des tumeurs, les variables descriptives prépondérantes sont, par exemple, le rayon et la densité de la tumeur.

Dans l’exemple de la maintenance, une variable descriptive prépondérante est, par exemple, la date du dernier défaut détecté sur un composant de l’équipement.

Le procédé d’échange de données comprend une étape 150 de détermination, le cas échéant, d’au moins un deuxième élément en fonction du vecteur descripteur du premier élément, de la classe prédite pour le premier élément et du sous-ensemble sélectionné de variables descriptives du premier élément. L’étape de détermination est mise en oeuvre par le calculateur 10 en interaction avec le produit programme d’ordinateur 12, c’est-à-dire est mise en oeuvre par ordinateur.

Chaque deuxième élément déterminé forme un exemple contrefactuel. Un exemple contrefactuel est défini comme étant un élément ayant un vecteur descripteur proche du premier élément (exemple de base) mais dont la classe prédite est différente. Un tel exemple contrefactuel permet de mieux comprendre la classe prédite par le modèle de prédiction pour le premier élément. Un exemple contrefactuel est donc un contre- exemple qui a une visée explicative.

Par exemple, dans le cas des messages AIS, pour un premier élément dont la classe prédite est non cargo (prédiction 18%), un exemple contrefactuel pourrait être un deuxième élément avec une seule variable descriptive modifiée par rapport au premier élément (vitesse de 16 noeuds au lieu de 9 noeuds) et dont la classe prédite est cargo (prédiction de 58%).

Dans un autre exemple relatif aux messages AIS, le modèle de prédiction vise à prédire la vitesse d’un navire à un instant donné en fonction des caractéristiques du message AIS. Par exemple, la vitesse prédite est de 12 noeuds. Il est souhaité générer un exemple contrefactuel proche du message AIS initial mais dont la vitesse prédite par le modèle de prédiction est, par exemple, de 21 noeuds. Le deuxième exemple est donc un message AIS présentant des caractéristiques proches du message AIS d’origine mais dont la vitesse prédite par le modèle de prédiction est de 21 noeuds.

Chaque deuxième élément vérifie les conditions suivantes :

- (i) la distance entre le vecteur descripteur du premier élément et le vecteur descripteur du deuxième élément est inférieure à un seuil prédéterminé. Cela permet que le deuxième élément (contre-exemple) soit proche du premier élément (exemple de base).

- (ii) au moins une variable descriptive du deuxième élément à une valeur différente de la variable descriptive correspondante du premier élément et appartient au sous-ensemble sélectionné de variables descriptives du premier élément, et

- (iii) l’image du vecteur descripteur du deuxième élément par le modèle de prédiction est une classe différente de la classe du premier élément.

Avantageusement, chaque deuxième élément vérifie, en outre, au moins l’une des conditions suivantes :

- (iv) chaque variable descriptive du deuxième élément ayant une valeur différente de la variable descriptive correspondante du premier élément appartient au sous- ensemble sélectionné de variables descriptives du premier élément. En d’autres termes, toutes les variables descriptives du deuxième élément qui sont différentes des variables descriptives correspondantes du premier élément sont des variables vérifiant le critère de prépondérance.

- (v) chaque deuxième élément a au plus un nombre M de variables descriptives différentes des variables descriptives correspondantes du premier élément, M étant un entier naturel strictement positif. Cela permet d’obtenir un deuxième élément avec des modifications sur un nombre faible de variables descriptives. En effet, un exemple contrefactuel sera plus facile à interpréter pour un opérateur si les modifications concernent un petit nombre de variables descriptives (même si ces modifications sont importantes), plutôt qu’un grand nombre de variables descriptives avec des modifications faibles.

Avantageusement, le ou les deuxièmes éléments représentant les meilleurs exemples contrefactuels sont les éléments pour lesquels la distance entre le vecteur descripteur du premier élément et le vecteur descripteur du deuxième élément est la plus petite et qui présentent le plus de variables descriptives inchangées par rapport au premier élément.

Avantageusement, le deuxième élément est déterminé en fonction d’un modèle de détermination (tel qu’un réseau de neurones) entraîné selon une base d’entraînement de sorte à respecter toutes ou au moins les contraintes (i), (ii) et (iii) décrites précédemment. La base d’entraînement comprend des vecteurs descripteurs d’éléments et des classes, chaque vecteur descripteur étant associé à une classe. Par exemple, la base d’entraînement est la même base que celle ayant permis d’obtenir le modèle de prédiction. Le fait qu’une base d’entraînement soit utilisée dans la détermination du deuxième exemple permet d’obtenir un deuxième élément réaliste. Dans l’exemple des messages AIS, cela permet d’éviter d’obtenir un deuxième élément ayant une latitude correspondant à un lieu sur terre (ce qui n’est pas réaliste pour un navire) ou dont la vitesse est élevée alors que le navire est amarré.

En variante, le deuxième élément est déterminé sans base d’entraînement. Dans ce cas, les deuxièmes éléments potentiels sont contrôlés par un opérateur ou par des règles, telles que des règles métier, afin d’obtenir un deuxième élément réaliste.

Dans un exemple de mise en oeuvre, la détermination du deuxième élément consiste à minimiser une fonction de coût (1 ) de la forme suivante :

L( z, / 1 | x, ÿ ) = d(x, z) + L. (f(z)— ÿ) 2 (1 ) sous la contrainte (2) suivante : OÙ :

z désigne le vecteur descripteur du deuxième élément (que l’on cherche à déterminer),

x désigne le vecteur descripteur du premier élément,

y désigne une sortie cible du modèle de prédiction, c’est-à-dire une classe ou une probabilité, que l’on souhaite obtenir pour le deuxième élément,

/ désigne la fonction appliquée par le modèle de prédiction,

/(z) désigne l’image du vecteur descripteur z du deuxième élément par le modèle de prédiction,

l désigne un facteur de pénalisation, l est un réel,

e désigne une marge d’approximation, e est un réel, et

d(x, z) désigne la distance entre le vecteur descripteur du premier élément et le vecteur descripteur du deuxième élément.

La distance d est, par exemple, une distance de Manhattan. Une telle distance permet, en effet, de modifier moins de variables descriptives par rapport à une distance euclidienne. Cela permet ainsi de faciliter l’interprétation de l’exemple contrefactuel formé par chaque deuxième élément.

La figure 5 illustre un exemple de deuxièmes éléments E2 déterminés pour un premier élément E1 dans le cas de messages AIS. Dans cet exemple, le premier élément est un message AIS en provenance d’un navire qui a été classifié par le modèle de prédiction comme n’appartenant pas à la classe cargo. Les deuxièmes éléments sont des exemples contrefactuels ayant chacun un vecteur descripteur proche du vecteur descripteur du premier élément mais classifiés par le modèle de prédiction comme appartenant à la classe cargo. Comme illustré par la figure 5, les deuxièmes éléments se trouvant sur un rail, cela permet de comprendre que le premier élément a été classifié comme n’étant pas un cargo car sa route a dévié (latitude notamment).

Le procédé d’échange de données comprend une étape 160 d’envoi, par l’unité d’émission 7B de la deuxième entité 7, à la troisième entité 8, du vecteur descripteur du premier élément, de la classe du premier élément et, le cas échéant, du vecteur descripteur du deuxième élément et de la classe du deuxième élément. Les données sont, par exemple, envoyées à la troisième entité 8 à des fins d’analyse ou de prise de décisions.

Optionnellement, le procédé comprend, en outre, une étape de validation de la classe prédite pour le premier élément lorsqu’aucun deuxième élément ne vérifie l’ensemble des contraintes. La prédiction est donc considérée comme étant fiable. Optionnellement, les vecteurs descripteurs pour lesquels la classe prédite ne correspond pas à la classe réelle de l’élément (par exemple, un vecteur descripteur classé non-cargo alors que correspondant en réalité à un navire cargo) sont mémorisés dans une base d’anomalies. La base d’anomalies est, par exemple, utilisée pour mettre à jour le modèle de prédiction.

Ainsi, le procédé permet, par la détermination de deuxièmes éléments, de générer des exemples contrefactuels permettant de mieux comprendre les sorties d’un modèle de prédiction. En particulier, les deuxièmes éléments permettent de mieux appréhender l’impact de certaines variables descriptives sur les sorties du modèle. Les contraintes imposées pour la détermination des deuxièmes éléments permettent d’obtenir des exemples contrefactuels facilement interprétables par un opérateur. Plus précisément, la sélection effectuée des variables descriptives du premier élément vérifiant un critère de prépondérance permet de faciliter la détermination de deuxièmes éléments facilement interprétables par l’opérateur.

Dans le domaine naval, un tel procédé permet de mieux comprendre pourquoi un message en provenance d’un navire de type cargo est classé comme étant non- cargo. Cela peut être dû, par exemple à un changement de cap, de latitude ou de vitesse du navire.

Dans le domaine médical, un tel procédé permet au médecin d’être plus précis dans son diagnostic. Notamment, lorsque les éléments sont des tumeurs, si un premier élément est classé non-cancéreuse mais qu’un deuxième élément ayant seulement un rayon plus important que le premier élément est classé cancéreuse, le médecin pourra réévaluer le classement non-cancéreuse qui pourrait être dû à une erreur de mesure du rayon du premier élément.

Dans le domaine de la maintenance, un tel procédé permet de mieux appréhender les actions de maintenance à réaliser sur un équipement à surveiller.

Le procédé permet, également, de déterminer les valeurs d’entrée à modifier pour que la sortie d’un modèle de prédiction atteigne une valeur souhaitée.

Ainsi, le procédé selon l’invention permet d’améliorer la fiabilité des données échangées entre des entités.

L’homme du métier comprendra que le présent procédé s’applique à des domaines variés, autres que ceux décrits précédemment, tels que, par exemple, au domaine de l’avionique. Le présent procédé s’applique, également, à des méthodes non supervisées, par exemple, pour la détection d’anomalies. L’homme du métier comprendra que les modes de réalisation précédemment décrits peuvent être combinés pour former de nouveaux modes de réalisation pourvu qu’ils soient compatibles techniquement.