Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
RAILWAY ANALYSIS DEVICE
Document Type and Number:
WIPO Patent Application WO/2023/037073
Kind Code:
A1
Abstract:
The invention relates to a railway analysis device, which comprises a memory (4) arranged to receive measurement data of a railway track, each comprising at least one railway track measurement value and a dated measurement route identifier; an extractor (6) arranged to determine a set of characteristics from the railway track measurement data, said set of characteristics comprising at least two characteristics selected from a group comprising deviation characteristics, level characteristics, distortion characteristics, cant characteristics, rolling stock characteristics, and historical characteristics; and a machine learning unit (8) based on gradient boosting, trained on railway track measurement data associated with railway track defect values, said railway track defect being selected from a group comprising at least one defect among a cant defect, a level defect, and a distortion defect, and arranged to return one or more railway track defect values.

Inventors:
LOYER JEAN-LOUP (FR)
PELLEGRINO JOSEPH (FR)
Application Number:
PCT/FR2022/051686
Publication Date:
March 16, 2023
Filing Date:
September 06, 2022
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
ERAMET (FR)
International Classes:
B61K9/08
Domestic Patent References:
WO2018165753A12018-09-20
Foreign References:
US20190039633A12019-02-07
US20190161919A12019-05-30
CN112330591A2021-02-05
EP2305532A12011-04-06
US20090070064A12009-03-12
US20040204882A12004-10-14
Other References:
IMAN SOLEIMANMEIGOUNI, TRACK GEOMETRY DÉGRADATION AND MAINTENANCE MODELLING: A REVIEW, Retrieved from the Internet
XIE ET AL., SYSTEMATIC LITERATURE REVIEW ON DATA-DRIVEN MODELS FOR PRÉDICTIVE MAINTENANCE OF RAILWAY TRACK: IMPLICATIONS IN GEOTECHNICAL ENGINEERING, Retrieved from the Internet
Attorney, Agent or Firm:
CABINET NETTER (FR)
Download PDF:
Claims:
Revendications

[Revendication 1] Dispositif d’analyse ferroviaire comprenant une mémoire (4) agencée pour recevoir des données de mesure d’un voie ferroviaire comprenant chacune au moins une valeur de mesure de voie ferroviaire et un identifiant de parcours de mesure daté, un extracteur (6) agencé pour déterminer un jeu de caractéristiques à partir des données de mesure de voie ferroviaire, lequel jeu de caractéristiques comprend au moins deux caractéristiques choisies dans un groupe comprenant des caractéristiques d’écart, des caractéristiques de nivellement, des caractéristiques de gauche, des caractéristiques de dévers, des caractéristiques de matériel roulant, et des caractéristiques historiques, et une unité d’apprentissage automatique basé sur renforcement du gradient (8) entraînée sur des données de mesure de voie ferroviaire associées à des valeurs de défaut de voie ferroviaire, lequel défaut de voie ferroviaire est choisi parmi un groupe comprenant au moins un défaut parmi un défaut de dévers, un défaut de nivellement et un défaut de gauche, et agencée pour retourner une ou plusieurs valeurs de défaut de voie ferroviaire.

[Revendication 2] Dispositif d’analyse ferroviaire selon la revendication 1, comprenant en outre un correcteur (10) agencé pour recevoir des données de mesure de voie ferroviaire courantes associées à un même identifiant de parcours de mesure dont les valeurs de mesure indiquent une mesure de dévers, pour analyser ces données de mesure de voie ferroviaire afin d’identifier des débuts et des fins de courbe, et pour modifier les données de mesure de voie ferroviaire courantes par comparaison des débuts et des fins de courbe aux débuts et fins de courbe de données de mesure de chemin référence.

[Revendication 3] Dispositif selon l’une des revendications précédentes, dans lequel l’extracteur (6) détermine un jeu de caractéristiques qui comprend au moins une caractéristique de gauche, au moins une caractéristique d’écart, au moins une caractéristique de nivellement, au moins une caractéristique de dévers, au moins une caractéristique de matériel roulant et au moins une caractéristique historique.

[Revendication 4] Dispositif selon l’une des revendications précédentes, dans lequel les données de mesure d’une voie ferroviaire comprennent en outre un identifiant de tronçon, et dans lesquelles l’extracteur (6) est agencé pour traiter ensemble les données de mesure d’une voie ferroviaire associées à un même identifiant de parcours de mesure daté et à un même tronçon.

[Revendication 5] Dispositif selon la revendication 4, dans lequel l’extracteur (6) est agencé pour déterminer un jeu de caractéristiques comprenant une caractéristique de gauche, une caractéristique d’écart, une caractéristique de nivellement et une caractéristique de dévers du type valeur maximale, valeur minimale, valeur au percentile 90, valeur au percentile 10 dans les données de mesure de voie ferroviaire associées à un même identifiant de parcours de mesure daté antérieur et à un même tronçon.

[Revendication 6] Dispositif selon la revendication 4 ou 5, dans lequel l’extracteur (6) est agencé pour déterminer un jeu de caractéristiques comprenant au moins une caractéristique historique qui est une caractéristique de nivellement, une caractéristique de dévers, ou une caractéristique de matériel roulant déterminée pour les données de mesure d’un voie ferroviaire associées à un même tronçon et à un identifiant de parcours de mesure daté antérieur.

[Revendication 7] Dispositif selon l’une des revendications précédentes, dans lequel l’extracteur (6) est agencé pour déterminer un jeu de caractéristiques comprenant une caractéristique de matériel roulant du type nombre de trains passés dans les 7, 15 ou 30 derniers jours, ou du type tonnage de matériel roulant passé dans les 7, 15 ou 30 derniers jours.

[Revendication 8] Dispositif selon l’une des revendications précédentes, dans lequel l’unité d’apprentissage automatique basé sur renforcement du gradient (8) utilise une classification binaire avec fonction de perte logistique.

[Revendication 9] Procédé de prédiction d’une valeur de défaut de voie ferroviaire, comprenant les opérations suivantes : a) recevoir des données de mesure d’une voie ferroviaire comprenant chacune au moins une valeur de mesure de voie ferroviaire et un identifiant de parcours de mesure daté, b) déterminer un jeu de caractéristiques à partir des données de mesure de voie ferroviaire, lequel jeu de caractéristiques comprend au moins deux caractéristiques choisies dans un groupe comprenant des caractéristiques d’écart, des caractéristiques de nivellement, des caractéristiques de gauche, des caractéristiques de dévers, des caractéristiques de matériel roulant, et des caractéristiques historiques, c) transmettre le jeu de caractéristiques déterminé à l’opération b) à une unité d’apprentissage automatique basé sur renforcement du gradient (8) entraînée sur des données de mesure de voie ferroviaire associées à des valeurs de défaut de voie ferroviaire, lequel défaut de voie ferroviaire est choisi parmi un groupe comprenant au moins un défaut parmi un défaut de dévers, un défaut de nivellement et un défaut de gauche, et agencée pour retourner une ou plusieurs valeurs de défaut de voie ferroviaire, d) retourner la ou les valeurs de défaut de voie ferroviaire déterminées pour le jeu de caractéristiques déterminé à l’opération b).

[Revendication 10] Produit de programme d’ordinateur comprenant des portions de code de programme pour mettre en œuvre le dispositif selon l’une des revendications 1 à 8 ou le procédé selon la revendication 9 lorsque ledit programme est exécuté sur un ordinateur. [Revendication 11] Support de stockage de données sur lequel est enregistré le programme selon la revendication 10.

Description:
Description

Titre : Dispositif d’analyse ferroviaire

L’invention concerne le domaine de l’analyse ferroviaire et en particulier la maintenance prédictive des voies ferroviaires.

Le domaine de la maintenance prédictive des infrastructures ferroviaires fait l’objet d’études depuis plusieurs décennies. En effet, il est critique de maintenir des infrastructures ferroviaires en bon état de fonctionnement afin de garantir la sécurité des usagers et marchandises. Cependant, même les infrastructures les plus simples comprennent rapidement plusieurs centaines de kilomètres de rails, ce qui rend la maintenance manuelle prohibitive en termes de coût.

Afin d’automatiser la collecte de données, des machines, comme la locomotive EM80H fabriquée par l’entreprise Plasser & Theurer (voir par exemple https://www.plassertheurer.com/fr/machines-systemes/voitures -automotrices-de- mesure/em80h) ont été développées.

L’entreprise américaine RailPod (voir https://rail-pod.com/?page_id=2263) propose un appareil autonome de mesure et des algorithmes d’analyse de la géométrie des voies et de leur état (érosion, état de surface, problème structurels internes).

La solution FleetONE du spécialiste Wabtec Controls Systems (http://trackiq.com.au/FleetONE.html) propose un système d’acquisition et gestion des données de maintenance ferroviaire, essentiellement de matériel roulant. Elle offre la possibilité de faire des recherches et de visualiser des données simples. Aucune fonctionnalité de maintenance prédictive du rail ne semble offerte.

Aucune de ces solutions n’offre une possibilité de maintenance prédictive. La maintenance prédictive consiste à essayer de déterminer des portions de voies ferroviaires qui sont les plus critiques à entretenir. Cette détermination est source de nombreux défis.

Il apparaît évident que la maintenance prédictive nécessite de comparer des signaux de mesure acquis successivement afin d’analyser l’évolution de portions de voie. Cela nécessite de synchroniser les signaux de mesure entre différentes acquisitions car ceux- ci varient beaucoup du fait de la manière dont ils sont déterminés (variance sur les engins d’acquisition, détermination des portions par odométrie, par GPS ou par point singulier induisant des ambiguïtés, etc.). De nombreuses demandes de brevets ont été déposées à ce sujet, comme le document EP 2 305 532 qui décrit la détermination d’une corrélation croisée sur des tronçons se chevauchant, le document US 2009/0070064 qui décrit un procédé de détermination de tendance à partir d’écarts de position verticale de la voie, ou le document US 2004/0204882 qui calque des données de mesure de voie (MTD pour « Measured Track Data » en anglais) sur des données géographiques de voie (TGD pour « Track Geographical Data » en anglais). La plupart de ces méthodes sont imprécises et/ou fastidieuses.

Ensuite, une fois les signaux synchronisés, il s’agit de choisir comment identifier les évolutions des portions posant problèmes. Ici encore, aucune offre commerciale n’existe réellement à ce jour, et l’état de l’art repose principalement sur des travaux académiques. L’article d’Iman Soleimanmeigouni « Track geometry degradation and maintenance modelling: A review », https://journals.sagepub.com/doi/10.1177/0954409716657849 passe en revue une centaine d’articles, dont aucun n’apporte réelle satisfaction. Enfin, certains travaux prospectifs ont cherché à proposer d’utiliser l’intelligence artificielle pour réaliser de la maintenance prédictive. En général, à l’image de l’article « Systematic Literature Review on Data-Driven Models for Predictive Maintenance of Railway Track: Implications in Geotechnical Engineering » de Xie et al (https://www.mdpi.com/2076- 3263/10/11/425/pdf) suggère que l’apprentissage profond (deep learning) et non supervisé constitue le domaine le plus prometteur. Mais là encore, aucune méthode ne semble avoir réussi à dépasser le stade académique et être suffisamment fiable d’un point de vue industriel. L’invention vient améliorer la situation. À cet effet, elle propose un dispositif d’analyse ferroviaire comprenant une mémoire agencée pour recevoir des données de mesure d’un voie ferroviaire comprenant chacune au moins une valeur de mesure de voie ferroviaire et un identifiant de parcours de mesure daté, un extracteur agencé pour déterminer un jeu de caractéristiques à partir des données de mesure de voie ferroviaire, lequel jeu de caractéristiques comprend au moins deux caractéristiques choisies dans un groupe comprenant des caractéristiques d’écart, des caractéristiques de nivellement, des caractéristiques de gauche, des caractéristiques de dévers, des caractéristiques de matériel roulant, et des caractéristiques historiques, et une unité d’apprentissage automatique basé sur renforcement du gradient entraînée sur des données de mesure de voie ferroviaire associées à des valeurs de défaut de voie ferroviaire, lequel défaut de voie ferroviaire est choisi parmi un groupe comprenant au moins un défaut parmi un défaut de dévers, un défaut de nivellement et un défaut de gauche, et agencée pour retourner une ou plusieurs valeurs de défaut de voie ferroviaire.

Ce dispositif est particulièrement avantageux car il permet d’offrir une analyse systématique, fiable et automatisée des défauts de voie ferroviaire, ce qui n’était pas possible précédemment.

Selon divers modes de réalisation, l’invention peut présenter une ou plusieurs des caractéristiques suivantes :

- le dispositif comprend en outre un correcteur agencé pour recevoir des données de mesure de voie ferroviaire courantes associées à un même identifiant de parcours de mesure dont les valeurs de mesure indiquent une mesure de dévers, pour analyser ces données de mesure de voie ferroviaire afin d’identifier des débuts et des fins de courbe, et pour modifier les données de mesure de voie ferroviaire courantes par comparaison des débuts et des fins de courbe aux débuts et fins de courbe de données de mesure de chemin référence,

- l’extracteur détermine un jeu de caractéristiques qui comprend au moins une caractéristique de gauche, au moins une caractéristique d’écart, au moins une caractéristique de nivellement, au moins une caractéristique de dévers, au moins une caractéristique de matériel roulant et au moins une caractéristique historique, - les données de mesure d’une voie ferroviaire comprennent en outre un identifiant de tronçon, et l’extracteur est agencé pour traiter ensemble les données de mesure d’une voie ferroviaire associées à un même identifiant de parcours de mesure daté et à un même tronçon,

- l’extracteur est agencé pour déterminer un jeu de caractéristiques comprenant une caractéristique de gauche, une caractéristique d’écart, une caractéristique de nivellement et une caractéristique de dévers du type valeur maximale, valeur minimale, valeur au percentile 90, valeur au percentile 10 dans les données de mesure de voie ferroviaire associées à un même identifiant de parcours de mesure daté antérieur et à un même tronçon,

- l’extracteur est agencé pour déterminer un jeu de caractéristiques comprenant au moins une caractéristique historique qui est une caractéristique de nivellement, une caractéristique de dévers, ou une caractéristique de matériel roulant déterminée pour les données de mesure d’un voie ferroviaire associées à un même tronçon et à un identifiant de parcours de mesure daté antérieur,

- l’extracteur est agencé pour déterminer un jeu de caractéristiques comprenant une caractéristique de matériel roulant du type nombre de trains passés dans les 7, 15 ou 30 derniers jours, ou du type tonnage de matériel roulant passé dans les 7, 15 ou 30 derniers jours, et

- l’unité d’apprentissage automatique basé sur renforcement du gradient utilise une classification binaire avec fonction de perte logistique.

L’invention concerne également un procédé de prédiction d’une valeur de défaut de voie ferroviaire, comprenant les opérations suivantes : a) recevoir des données de mesure d’une voie ferroviaire comprenant chacune au moins une valeur de mesure de voie ferroviaire et un identifiant de parcours de mesure daté, b) déterminer un jeu de caractéristiques à partir des données de mesure de voie ferroviaire, lequel jeu de caractéristiques comprend au moins deux caractéristiques choisies dans un groupe comprenant des caractéristiques d’écart, des caractéristiques de nivellement, des caractéristiques de gauche, des caractéristiques de dévers, des caractéristiques de matériel roulant, et des caractéristiques historiques, c) transmettre le jeu de caractéristiques déterminé à l’opération b) à une unité d’apprentissage automatique basé sur renforcement du gradient entraînée sur des données de mesure de voie ferroviaire associées à des valeurs de défaut de voie ferroviaire, lequel défaut de voie ferroviaire est choisi parmi un groupe comprenant au moins un défaut parmi un défaut de dévers, un défaut de nivellement et un défaut de gauche, et agencée pour retourner une ou plusieurs valeurs de défaut de voie ferroviaire, d) retourner la ou les valeurs de défaut de voie ferroviaire déterminées pour le jeu de caractéristiques déterminé à l’opération b).

L’invention concerne enfin un produit de programme d’ordinateur comprenant des instructions pour mettre en œuvre le procédé lorsqu’il est exécuté sur un ordinateur, et un support de stockage sur lequel le produit de programme d’ordinateur est enregistré.

D’autres caractéristiques et avantages de l’invention apparaîtront mieux à la lecture de la description qui suit, tirée d’exemples donnés à titre illustratif et non limitatif, tirés des dessins sur lesquels :

[Fig.l] La figure 1 représente un diagramme générique d’un dispositif selon l’invention, [Fig.2] La figure 2 représente un exemple d’un défaut de gauche pour une voie ferroviaire, [Fig.3] La figure 3 représente un exemple d’un défaut de dévers pour une voie ferroviaire, [Fig.4] La figure 4 représente un exemple d’un défaut de nivellement pour une voie ferroviaire,

[Fig.5] La figure 5 représente un exemple d’un défaut d’écart pour une voie ferroviaire, [Fig.6] La figure 6 représente en exemple d’un signal dévers reçu en entrée, et

[Fig.7] La figure 7 représente un exemple d’une fonction de synchronisation du signal de la figure 6 avec un signal théorique.

Les dessins et la description ci-après contiennent, pour l'essentiel, des éléments de caractère certain. Ils pourront donc non seulement servir à mieux faire comprendre la présente invention, mais aussi contribuer à sa définition, le cas échéant.

La figure 1 représente un diagramme générique d’un dispositif selon l’invention. Le dispositif d’analyse ferroviaire 2 comprend une mémoire 4, un extracteur 6, une unité d’apprentissage automatique basé sur renforcement du gradient 8 et un correcteur 10 optionnel. La mémoire 4 peut être tout type de stockage de données propre à recevoir des données numériques : disque dur, disque dur à mémoire flash, mémoire flash sous toute forme, mémoire vive, disque magnétique, stockage distribué localement ou dans le cloud, etc. Les données calculées par le dispositif peuvent être stockées sur tout type de mémoire similaire à la mémoire 4, ou sur celle-ci. Ces données peuvent être effacées après que le dispositif a effectué ses tâches ou conservées.

Dans l’exemple décrit ici, la mémoire 4 reçoit des données de mesure d’une voie ferroviaire. Ces données de mesure sont dans l’exemple décrit ici en grande majorité reçues d’une locomotive EM80H, dite « Plasser ». Ce type de locomotive est spécifiquement dédié à la mesure de voie ferroviaire afin d’en assurer le suivi et la maintenance. Les sorties de ce type de locomotive sont typiquement des signaux comme représenté en Figure 6.

Dans l’exemple décrit ici, la mémoire 4 reçoit ainsi quatre signaux de mesure sous forme d’échantillons : un signal de mesure de gauche, un signal de mesure de dévers, un signal de mesure de nivellement, et un signal de mesure d’écart.

Les figures 2 à 5 représentent la nature respective des défauts de gauche, de dévers, de nivellement et d’écart. Ainsi, un défaut de gauche est constaté lorsqu’une portion d’un rail est surélevée par rapport à l’autre rail, un défaut de dévers est constaté lorsqu’un rail est surélevé dans l’ensemble par rapport à l’autre rail, un défaut de nivellement est constaté lorsque les deux rails présentent une portion surélevée alors qu’ils devraient rester plats, et un défaut d’écart est constaté lorsque les rails dévient axialement par rapport à la direction qu’ils devraient avoir.

Afin de pouvoir utiliser et comparer ces signaux, chacune des données les composant sont associées d’une part à un identifiant de parcours daté, c’est-à-dire un identifiant permettant de savoir quelle voie ferroviaire a été mesurée, et à quelle date cette mesure correspond, et d’autre part à un identifiant de tronçon. En effet, comme on le verra plus bas, les données de mesure sont analysées dans l’exemple décrit ici par tronçons de 50 m de longueur. En variante, les tronçons pourraient être plus courts, par exemple de 25 m, dès lors qu’une précision suffisante est disponible sur la synchronisation des signaux, ou plus longue, par exemple de 100m. Plus la longueur est petite, plus le risque de présence de portions de voie non homogènes entre elles dans un même tronçon est limité. Par portions de voie non homogènes entre elles dans un même tronçon, on entend le fait que, par la nature du parcours, des portions d’un même tronçon se comportent de manière différente vis-à-vis de l’apparition de défauts et que le tronçon est donc « incohérent » de ce point de vue. Cela peut être le cas si la longueur de tronçon est importante, typiquement de 200 m, et qu’une partie du tronçon est proche d’un endroit soumis à beaucoup de vibration, ou d’un endroit où la composition du sol est très différente du reste du tronçon. S’agissant de voies ferroviaires, les longueurs caractéristiques (virages, stabilité du terrain, etc.) sont assez importantes, et la longueur de 50 m apparaît donc naturellement avantageuse.

Ainsi les données de mesure sont formées par une valeur de mesure d’un type de défaut, un identifiant de parcours daté et un identifiant de tronçon.

En variante, le dispositif 2 pourrait recevoir des données de mesure de voie brutes, et calculer les signaux de mesure décrits plus haut. Toujours en variante, l’identifiant de parcours daté pourrait être une simple date, le lien entre les identifiants de tronçon d’un même parcours pouvant alors être implicite.

En plus de ces signaux, la mémoire 4 reçoit d’autres informations, comme le nombre de passages de trains sur la voie ferroviaire entre deux mesures, le tonnage de matériel roulant entre deux mesures, ces données formant des données de matériel ferroviaire.

Les données de mesure d’un tronçon donné et d’une date donnée peuvent par ailleurs être associées aux données de mesure de ce même tronçon des mesures précédentes. Ces données de mesure « passées » forment des données historiques et peuvent être répliquées en tant que données historiques associées aux données de mesure ou simplement associées sur la base de leur identifiant de parcours de mesure daté et leur identifiant de tronçon. En variante, les données de mesure pourraient être simplifiées de sorte qu’un identifiant de tronçon n’est associé qu’à une seule donnée de mesure par type de mesure. Cela revient à faire un tronçon de très petite taille, ou par exemple à moyenner toutes les données de mesure d’un tronçon donné. Le résultat obtenu sera moins précis mais des économies de calcul pourront être réalisées.

Les données de mesure reçues dans la mémoire 4 sont utilisées directement ou indirectement par l’extracteur 6 afin de produire un jeu de caractéristiques qui est fourni à l’unité d’apprentissage automatique basé sur renforcement du gradient 8 pour réaliser le calcul des valeurs de maintenance prédictive. Les termes « renforcement du gradient » et « caractéristique » doivent être interprétés avec le sens qui leur est accordé dans le domaine de l’apprentissage automatique, c’est-à-dire respectivement « gradient boosting » et « feature » en anglais.

Comme cela a été décrit plus haut, les données de mesure peuvent concerner des mesures caractéristiques de défauts que peuvent présenter une voie ferroviaire. Ainsi, l’extracteur 6 est agencé pour déterminer, pour les données de mesure associées à un identifiant de parcours daté donné, une pluralité de caractéristiques qui vont être fournies à la couche d’entrée de l’unité d’apprentissage automatique basé sur renforcement du gradient 8.

Dans l’exemple décrit ici, pour chaque identifiant de tronçon, chaque type de défaut est associé à quatre caractéristiques : la valeur maximale parmi les valeurs de mesures concernées, la valeur minimale parmi les valeurs de mesure concernées, la valeur de mesure du percentile 90 parmi les valeurs de mesure concernées, et la valeur de mesure du percentile 10 parmi les valeurs de mesure concernées. En variante, certaines seulement de ces valeurs pourraient être retenues, comme la valeur de mesure du percentile 90 parmi les valeurs de mesure concernées.

L’extracteur 6, l’unité d’apprentissage automatique basé sur renforcement du gradient 8 et le correcteur 10 sont des éléments accédant directement ou indirectement à la mémoire 4. Ils peuvent être réalisés sous la forme d’un code informatique approprié exécuté sur un ou plusieurs processeurs. Par processeurs, il doit être compris tout processeur adapté aux calculs décrits plus bas. Un tel processeur peut être réalisé de toute manière connue, sous la forme d’un microprocesseur pour ordinateur personnel, d’une puce dédiée de type FPGA ou SoC, d’une ressource de calcul sur une grille ou dans le cloud, d’une grappe de processeurs graphiques (GPUs), d’un microcontrôleur, ou de toute autre forme propre à fournir la puissance de calcul nécessaire à la réalisation décrite plus bas. Un ou plusieurs de ces éléments peuvent également être réalisés sous la forme de circuits électroniques spécialisés tel un ASIC. Une combinaison de processeur et de circuits électroniques peut également être envisagée. Dans le cas de l’unité d’apprentissage automatique basé sur renforcement du gradient 8, des processeurs dédiés à l’apprentissage automatique pourront aussi être envisagés.

L’extracteur 6 est également agencé pour établir des caractéristiques dans le jeu de caractéristiques sur la base des données de matériel ferroviaire et sur la base des données historiques.

Ainsi, pour les données de matériel ferroviaire, l’extracteur 6 peut déterminer des caractéristiques de matériel ferroviaire à partir du nombre de passages de trains et du tonnage de matériel roulant ayant circulé dans les 7 et/ou 15 et/ou 30 derniers jours précédant la date associée à l’identifiant de parcours daté sur le parcours associé. De manière similaire, des caractéristiques historiques peuvent comprendre les caractéristiques d’écart, les caractéristiques de nivellement, les caractéristiques de gauche, les caractéristiques de dévers pour chaque identifiant de tronçon qui correspondent au premier et/ou deuxième et/ou troisième et/ou quatrième identifiant de parcours daté antérieur, pour chaque identifiant de tronçon, avec à chaque fois le nombre de jour écoulés. Parmi les caractéristiques historiques peuvent aussi figurer des relevés terrain par les opérateurs (défauts de géométrie, état général des voies et des rails), la topographie (modèles de terrain) ou encore les travaux de maintenance.

Le jeu de caractéristiques ainsi établi pour chaque identifiant de tronçon est alors fourni à l’entrée de l’unité d’apprentissage automatique basé sur renforcement du gradient 8. Celle-ci est dans l’exemple décrit un arbre à renforcement du gradient. Dans l’exemple décrit ici, la librairie LightGBM version 3.0.0, maintenue par Microsoft, est utilisée depuis Python avec la fonction ‘LightGBMClassifïer’ et les hyperparamètres suivants.

Type de modèles (‘boosting type’) : ‘gbdt’ - le gradient boosted tree usuel Nombres de feuilles terminales (‘num_leaves’) : 50,

Profondeur maximale de l’arbre (‘max depth’) : pas de limite,

Taux d’apprentissage du boosting (Teaming rate’) : 0,1,

Nombre d’arbres boostés dans le modèle (‘n estimators’) : 1000,

Fonction objectif (‘objective’) : classification binaire (‘binary’ avec fonction de perte logistique - log-loss),

Taux d’échantillonnage aléatoire (sans remise) sur le jeu de données pour construire un arbre (‘subsample’) : 0,7 soit 70% ,

Taux d’échantillonnage aléatoire (sans remise) sur les variables en entrée pour construire un arbre (‘colsample bytree’) : 50%,

Pondération de chaque classe (‘class weight’) : équilibrée pour les classifications binaires.

Les autres hyperparamètres sont moins importants pour la configuration de l’algorithme et sont ceux par défaut de la fonction ‘ LightGBMClassifïer ’.

La Demanderesse a identifié que ce type d’apprentissage automatique est de loin le plus efficace, devant les méthodes de régression logistique, SVM (Support Vector Machine en anglais, ou machine à vecteurs de support), ou les méthodes Random Forest (forêts aléatoires), mais également par rapport aux méthodes à base d’apprentissage profond, qui sont plus adaptées au traitement d’images.

L’entraînement de l’unité d’apprentissage automatique basé sur renforcement du gradient 8 a été réalisé à partir de l’historique de maintenance existant pour les lignes ferroviaires du chemin de fer gabonais, avec comme label la mesure des défauts qui ont été réellement mesurés. Idéalement, l’unité d’apprentissage automatique basé sur renforcement du gradient 8 pourra faire l’objet d’un entraînement spécifique pour chaque voie ferroviaire à laquelle elle doit être appliquée. Les résultats les plus favorables ont été obtenus avec l’utilisation de toutes les caractéristiques décrites ci-dessus. En variante, l’unité d’apprentissage automatique basé sur renforcement du gradient 8 pourrait n’utiliser qu’une seule caractéristique par catégorie de caractéristique, voire une seule caractéristique tout court.

Le correcteur 10 est optionnel. En effet, dans ce qui précède, il a été considéré que les données de mesures étaient déjà synchronisées entre elles. Néanmoins, la Demanderesse a constaté que l’historique des mesures prélevées par la locomotive EM80H est difficile à réconcilier entre deux passages. Ceci est dû : au manque d'exactitude du point de départ d'une campagne de mesure, et à l'usure et au glissement des roues de la locomotive (l’emplacement de mesure étant déterminé par odométrie). Il est donc souhaitable de synchroniser les données de mesure avec les données de mesure déjà présentes dans la mémoire 4. La Demanderesse a découvert qu’il est particulièrement avantageux d’utiliser les données de mesure de dévers à cet effet.

La figure 7 représente un exemple de mise en œuvre d’une fonction permettant de synchroniser les données de mesure comprenant un nouvel identifiant de parcours daté aux données de mesure déjà présentes dans la mémoire 4 pour ce parcours.

Dans une première opération 700, cette fonction reçoit les données de mesure de devers des données de mesure à synchroniser via une fonction Inp(). En option, la fonction Inp() peut également récupérer les données de référence associées à l’identifiant de parcours daté des données de mesure reçues par la fonction Inp(). Ensuite, dans une opération 710, ces données sont lissées au moyen d’un filtre passe-bas par une fonction Filt(). Cela permet notamment d’éliminer certaines perturbations liées à la précision de la locomotive, ainsi qu’à l’état de la voie ferroviaire.

Une fois le signal lissé, le signal résultant est analysé par une fonction Detect() dans une opération 720 afin de déterminer les points pour lesquels la mesure de dévers dépasse 15 mm. Ces points représentent physiquement le début et la fin de chaque courbe. En variante, ce seuil pourrait être de 5 mm ou moins, ou les points de début et de fin de courbe pourraient être déterminés, par exemple en se basant sur une dérivée du signal. Ces points de début et de fin sont ensuite utilisés par une fonction Match() dans une opération 730 afin de les comparer à des données de référence. Ces données de référence peuvent correspondre à des données de mesure dans lesquelles une confiance absolue est accordée, ou encore un plan de la voie ferroviaire à sa construction. L’association par la fonction Match() entre les points caractéristiques du signal lissé et ceux des données de référence peut être faite par analyse de la similarité des courbes résultantes, par exemple sur la base de l’ordre de ces points et du sens et de l’amplitude du signal de dévers correspondant. Cet appairage est particulièrement avantageux car il est assez simple à mettre en œuvre et permet de tenir compte du fait que les points caractéristiques et leur enchaînement est unique à chaque voie ferroviaire. Ainsi, il est possible d’atteindre une précision de l’ordre de 50 centimètres pour les données de mesures traitées par le correcteur 10, par opposition aux précisions de l’ordre d’une dizaine de mètres des solutions de l’état de l’art.

Enfin, une fonction Sync() vient modifier dans une opération 740 les données de mesure sur la base des recalages des points caractéristiques identifiés à l’opération 730. Pour cela, le début et la fin de chaque partie du signal correspondant est aligné sur la base de ce recalage. Cela induit une translation et/ou une compression/dilatation du signal concerné. Cette même transformation est appliquée à tous les signaux associés au même identifiant de parcours daté.