SYSTEM AND METHOD FOR PROCESSING DIGITAL IMAGES FOR OBJECT RECOGNITION

Title:

SYSTEM AND METHOD FOR PROCESSING DIGITAL IMAGES FOR OBJECT RECOGNITION

Document Type and Number:

WIPO Patent Application WO/2003/085592

Kind Code:

A1

Abstract:

The invention concerns a system for processing images for object recognition in a digital image (26) displayed in input of the system, comprising a set of image processing modules (22, 24) adapted to emit jointly pulses depending on the intensity of the input image pixels and for delivering, in output, a digital image (28) containing data concerning the nature of the object, the processing modules (22, 24) being connected in pairs through connecting elements (L) extending between the output of a first module (22) and the input of a second module (24). It further comprises means for configuring (32) the connecting elements in accordance with the type of the object to be detected in the image and based on optimal configuration parameters (34) obtained through prior learning.

Inventors:

CHIVA EMMANUEL (FR)
KODJABACHIAN JEROME (FR)

Application Number:

PCT/FR2002/000896

Publication Date:

October 16, 2003

Filing Date:

March 13, 2002

Export Citation:

Click for automatic bibliography generation Help

Assignee:

MATHEMATIQUES APPLIQUEES S A (FR)
CHIVA EMMANUEL (FR)
KODJABACHIAN JEROME (FR)

International Classes:

G06K9/66; (IPC1-7): G06K9/66

Domestic Patent References:

WO2001004826A1

2001-01-18

Foreign References:

FR2814572A1

2002-03-29

Other References:

WALDEMARK J ET AL: "Hybrid neural networks for automatic target recognition", SYSTEMS, MAN, AND CYBERNETICS, 1997. COMPUTATIONAL CYBERNETICS AND SIMULATION., 1997 IEEE INTERNATIONAL CONFERENCE ON ORLANDO, FL, USA 12-15 OCT. 1997, NEW YORK, NY, USA,IEEE, US, 12 October 1997 (1997-10-12), pages 4016 - 4021, XP010249230, ISBN: 0-7803-4053-1

Attorney, Agent or Firm:

Bureau, Casalonga-josse D. A. (8 avenue Percier Paris, FR)

Download PDF:

View/Download PDF PDF Help

Claims:

REVENDICATIONS

1.

Système de traitement d'images numériques pour la reconnaissance d'un objet dans une image présentée en entrée du système, comprenant un ensemble de modules (22,24) de traitement d'image adaptés pour émettre conjointement des impulsions en fonction de l'intensité des pixels de l'image d'entrée et pour délivrer, en sortie, des informations relatives à la nature de l'objet dans l'image, les modules de traitement étant reliés deux à deux par des éléments de liaison (L) s'étendant entre la sortie d'un premier module (22) et l'entrée d'un deuxième module (24) pour la transmission d'impulsions vers ce deuxième module, caractérisé en ce qu'il comporte en outre des moyens de configuration (32) des éléments de liaison en fonction de la nature de l'objet à détecter dans l'image et à partir de paramètres de configuration optimale obtenus par apprentissage préalable.

2.

Système de traitement d'images numériques selon la revendication 1, caractérisé en ce qu'il comporte un étage d'apprentissage (52) associé à une base de données d'apprentissage (54) regroupant un ou plusieurs ensembles d'images correspondant chacun à un type d'objet, l'étage d'apprentissage comprenant des moyens de mémorisation (58) dans lesquels sont stockées des valeurs de paramètres de configuration, et des moyens (56) pour présenter les images de chaque type en entrée du système pour différentes configurations des éléments de liaison correspondant respectivement aux valeurs des paramètres de configuration, et en ce qu'il comporte en outre des moyens de calcul de scores (62) pour affecter à chaque couple formé par une image et une configuration des éléments de liaison un score représentatif de la pertinence de l'image visàvis du type d'objet.

3.

Système de traitement d'images numériques selon la revendication 2, caractérisé en ce qu'une étiquette est associée à chaque image dans ladite base de données en fonction de la correspondance entre l'image et ledit type d'objet, et en ce que les moyens de calcul de score comportent des moyens pour élaborer, pour chaque image, une fonction de calcul à partir de fonctions prédéterminées et de l'étiquette correspondante.

4.

Système de traitement d'images numériques selon l'une des revendications 2 et 3, caractérisé en ce que l'étage d'apprentissage (52) comporte des moyens pour calculer un score global pour chaque configuration et pour calculer le score global le plus élevé, et identifier ainsi les paramètres de configuration optimale pour chaque type d'objet.

5.

Système de traitement d'images numériques selon l'une quelconque des revendications 1 à 4, caractérisé en ce qu'il comporte en outre des moyens (20) pour élaborer un ensemble d'images par grossissements successifs de l'image qui est présentée en entrée du système et qui est susceptible de contenir un objet à reconnaître, en utilisant des facteurs d'échelle (s) respectifs.

6.

Système de traitement d'images numériques selon la revendication 5, dépendante de la revendication 2, caractérisé en ce qu'il comporte des moyens (20) de comparaison des scores résultant du traitement, par les modules de traitement d'image, des éléments d'image dudit ensemble d'images élaborées avec une valeur de seuil de détection de l'objet pour identifier les éléments d'image susceptibles de correspondre audit objet.

7.

Système de traitement d'images numériques selon la revendication 6, caractérisé en ce qu'il comporte en outre un étage de traitement additionnel adapté pour assurer une discrimination, parmi les éléments d'image candidats susceptibles de correspondre audit objet, entre les éléments d'image englobant un objet à détecter et les éléments d'image n'englobant pas un tel objet, à partir d'une distance séparant lesdits éléments d'image candidats.

8.	Système de traitement d'images numériques selon l'une quelconque des revendications 1 à 7, caractérisé en ce que l'un au moins des modules de traitement d'image comporte des neurones à impulsion.

9.	Système de traitement d'images numériques selon l'une quelconque des revendications 1 à 8, caractérisé en ce que les modules de traitement d'image comportent un module d'interface d'entrée (22) adapté pour procéder à un codage temporel des niveaux d'intensité de chaque pixel.

10.

Procédé de traitement d'images numériques pour la reconnaissance d'un objet dans une image numérique (26) présentée en entrée d'un système de traitement d'images comprenant un ensemble de modules de traitement d'image (22,24) adaptés pour émettre conjointement des impulsions en fonction de l'intensité des pixels de l'image et pour délivrer, en sortie, des informations relatives à la nature de l'objet dans l'image, les modules de traitement (22,24) étant reliés deux à deux par des éléments de liaison (L) s'étendant entre la sortie d'un premier module (22) et l'entrée d'un deuxième module (24) pour la transmission d'impulsions vers ce deuxième module, caractérisé par le fait que l'on met en oeuvre une phase d'apprentissage préalable de paramètres de configuration optimale des liaisons entre les modules (22,24) pour l'objet à reconnaître dans l'image, et l'on configure les liaisons à partir desdits paramètres de configuration.

11.

Procédé de traitement d'images numériques selon la revendication 10, caractérisé en ce qu'au cours de l'étape d'apprentissage, on présente successivement, en entrée du système, des images extraites d'une base d'images (54) contenant un ensemble d'images d'un objet de mme nature que l'objet à reconnaître, pour différentes configurations des liaisons entre les modules de traitement, on calcule un score pour chaque configuration des liaisons, et l'on identifie la configuration ayant le score le plus élevé.

12.

Procédé de traitement d'images numériques selon l'une des revendications 10 et 11, caractérisé en ce que postérieurement à la présentation de l'image en entrée du système de traitement, on élabore un ensemble d'images en utilisant des facteurs d'échelle respectifs, on met en oeuvre des phases successives de traitement d'image pour des éléments d'image respectifs de chacune des images élaborées.

13.

Procédé de traitement d'images numériques selon la revendication 12, caractérisé en ce que l'on calcule un score pour chaque phase de traitement d'image à partir des informations délivrées en sortie par les modules de traitement d'image, et l'on compare les scores avec un seuil de détection de l'objet pour identifier les éléments d'image susceptibles de correspondre audit objet.

14.

Procédé de traitement d'images numériques selon la revendication 13, caractérisé en ce qu'il comporte en outre une étape de traitement additionnel au cours de laquelle on effectue une discrimination entre les éléments d'image englobant un objet à détecter et les éléments d'image n'englobant pas un tel objet, parmi les éléments d'image candidats susceptibles de correspondre audit objet.

Description:

Système et procédé de traitement d'images numériques pour la reconnaissance d'objets.

La présente invention concerne un système de traitement d'images numériques ainsi qu'un procédé de traitement d'images numériques correspondant.

Plus particulièrement, l'invention porte sur un système et un procédé de traitement d'images destiné à la reconnaissance d'un objet dans une image.

De manière conventionnelle, pour la reconnaissance d'une forme ou d'un objet dans une image, on utilise un réseau neuronal recevant, en entrée, les niveaux d'intensité d'éléments d'image correspondant à un objet inconnu à reconnaître.

Par analyse de la valeur de sortie des neurones, c'est-à-dire de leur activité, il est possible de déterminer le degré de correspondance entre l'objet à analyser et un modèle d'objet connu.

On pourra, à cet égard, se référer au document EP-A-0 422 654 qui décrit un type spécifique de réseau neuronal.

Les réseaux neuronaux sont généralement agencés sous la forme de couches constituant chacune un module de traitement. Ces modules sont reliés entre eux par des éléments de liaison qui s'étendent entre les neurones de chaque couche selon une configuration spécifique.

Les réseaux neuronaux sont pourvus d'entrées sur lesquelles sont présentés des signaux, issus par exemple d'un dispositif de prise de vues, de sorte qu'un neurone soit connecté à chaque pixel de l'image issue de ce dispositif.

Lorsque le niveau d'activité d'un neurone est supérieur à une valeur de seuil prédéterminée, ce neurone émet, en sortie, des impulsions, lesquelles sont envoyées aux neurones qui lui sont connectés.

Les éléments de liaison des modules des différentes couches sont organisés de manière à obtenir en sortie du réseau neuronal un

signal spécifique traduisant la nature d'un objet à détecter ou à reconnaître.

Il est ainsi possible, par traitement ultérieur, de détecter, reconnaître et localiser des objets dans une image présentée en entrée d'un tel réseau.

Les systèmes de reconnaissance d'objets basés sur l'utilisation de réseaux neuronaux présentent un inconvénient majeur, relatif au fait qu'ils ne sont configurés, de manière optimale, que pour un type d'objet à détecter.

Ainsi, la présente invention a pour but la fourniture d'un système et d'un procédé de traitement d'images, permettant de reconnaître des objets dans une image avec une fiabilité accrue, en limitant le taux de fausses détections.

L'invention propose donc un système de traitement d'images numériques comprenant un ensemble de modules de traitement d'images adaptés pour émettre conjointement des impulsions en fonction de l'intensité des pixels de l'image d'entrée et pour délivrer, en sortie, des informations relatives à la nature de l'objet dans l'image, les modules de traitement étant reliés deux à deux par des éléments de liaison s'étendant entre la sortie d'un premier module et l'entrée d'un deuxième module pour la transmission d'impulsions vers ce deuxième module.

Ce système de traitement d'images comporte en outre des moyens de configuration des éléments de liaison en fonction de la nature de l'objet à détecter dans l'image et à partir de paramètres de configuration optimale obtenus par apprentissage préalable.

Il est par conséquent possible d'optimiser la configuration du système de traitement d'images, et en particulier des éléments de liaison, en fonction de la nature de l'objet à reconnaître.

Selon une autre caractéristique de ce système, celui-ci comporte un étage d'apprentissage associé à une base de données d'apprentissage regroupant un ou plusieurs ensembles d'images correspondant chacun à un type d'objet, l'étage d'apprentissage comprenant des moyens de mémorisation dans lesquels sont stockées

des valeurs de paramètres de configuration, et des moyens pour présenter les images de chaque type en entrée du système pour différentes configurations des éléments de liaison correspondant respectivement aux valeurs des paramètres de configuration, et en ce qu'il comporte en outre des moyens de calcul de scores pour affecter à chaque couple formé par une image et une configuration des éléments de liaison un score représentatif de la pertinence de l'image vis-à-vis du type d'objet.

On conçoit ainsi que l'apprentissage des paramètres de configuration optimale peut s'effectuer de manière automatique en scrutant l'ensemble des images d'une base d'images.

Selon un mode de réalisation particulier, une étiquette est associée à chaque image dans ladite base de données en fonction de la correspondance entre l'image et ledit type d'objet, et en ce que les moyens de calcul de score comportent des moyens pour élaborer, pour chaque image, une fonction de calcul à partir de fonctions prédéterminées et de l'étiquette correspondante.

De préférence, l'étage d'apprentissage comporte des moyens pour calculer un score global pour chaque configuration et pour calculer le score global le plus élevé, et identifier ainsi les paramètres de configuration optimale pour chaque type d'objet.

Selon un autre mode de réalisation particulier, le système selon l'invention comporte en outre des moyens pour élaborer un ensemble d'images par grossissements successifs de l'image qui est présentée en entrée du système et qui est susceptible de contenir un objet à reconnaître, en utilisant des facteurs d'échelle respectifs.

Selon une autre caractéristique de ce système, celui-ci comporte des moyens de comparaison des scores résultant du traitement, par les modules de traitement d'image, des éléments d'image dudit ensemble d'images élaborées avec une valeur de seuil de détection de l'objet pour identifier les éléments d'image susceptibles de correspondre audit objet.

Un étage de traitement additionnel adapté pour assurer une discrimination, parmi les éléments d'image candidats susceptibles de

correspondre audit objet, entre les éléments d'image englobant un objet à détecter et les éléments d'image n'englobant pas un tel objet, à partir d'une distance séparant lesdits éléments d'image candidats, peut également tre prévu.

L'un au moins des modules de traitement d'image comporte des neurones à impulsion.

Selon une caractéristique avantageuse, les modules de traitement d'image comportent un module d'interface d'entrée adapté pour procéder à un codage temporel des niveaux d'intensité de chaque pixel.

Selon l'invention, il est également proposé un procédé de traitement d'images numériques pour la reconnaissance d'un objet dans une image numérique présenté en entrée d'un système de traitement d'images, comprenant un ensemble de modules de traitement d'images adaptés pour émettre conjointement des impulsions en fonction de l'intensité des pixels de l'image et pour délivrer, en sortie, au moins une image numérique contenant des informations relatives à la nature de l'objet dans l'image, les modules de traitement étant reliés deux à deux par des éléments de liaison s'étendant entre la sortie d'un premier module et l'entrée d'un deuxième module pour la transmission d'impulsions vers ce deuxième module.

Selon ce procédé de traitement d'images, on met en oeuvre une phase d'apprentissage préalable de paramètres de configuration optimale des liaisons entre les modules pour l'objet à reconnaître dans l'image, et l'on configure les liaisons à partir desdits paramètres de configuration.

Selon un mode de mise en oeuvre avantageux, au cours de l'étape d'apprentissage, on présente successivement, en entrée du système, des images extraites d'une base d'images contenant un ensemble d'images d'un objet de mme nature que l'objet à reconnaître, pour différentes configurations des liaisons entre les modules de traitement, on calcule un score pour chaque configuration

des liaisons, et l'on identifie la configuration ayant le score le plus élevé.

De préférence, pour s'affranchir des problèmes de taille d'image et d'objet à reconnaître, postérieurement à la présentation de l'image en entrée du système de traitement, on élabore un ensemble d'images en utilisant des facteurs d'échelle respectifs, on met en oeuvre des phases successives de traitement d'image pour des éléments d'image respectifs de chacune des images élaborées.

Selon une autre caractéristique de ce procédé, on calcule un score pour chaque phase de traitement d'image à partir des informations délivrées en sortie par les modules de traitement d'image, et l'on compare les scores avec un seuil de détection de l'objet pour identifier les éléments d'image susceptibles de correspondre audit objet.

Selon un autre mode de mise en oeuvre de ce procédé, on prévoit en outre une étape de traitement additionnel au cours de laquelle on effectue une discrimination entre les éléments d'image englobant un objet à détecter et les éléments d'image n'englobant pas un tel objet, parmi les éléments d'image candidats susceptibles de correspondre audit objet.

D'autres buts, caractéristiques et avantages de l'invention apparaîtront à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels : -la figure 1 est un schéma synoptique illustrant l'architecture générale d'une installation de prise de vue pourvue d'un système de traitement d'images conforme à l'invention ; -la figure 2 est un schéma synoptique illustrant la structure d'un premier exemple de réalisation d'un système de traitement d'images conforme à l'invention ; -la figure 3 est un schéma synoptique illustrant la structure d'un autre exemple de réalisation d'un système de traitement d'images selon l'invention ;

-la figure 4 est une vue schématique des modules de traitement d'image entrant dans la constitution du système de la figures 2 ; -la figure 5 illustre la structure d'un neurone d'un réseau neuronal entrant dans la constitution de l'un des modules de traitement de la figure 4 ; -la figure 6 est une vue détaillée du système de traitement d'image des figures 2 ou 3 ; -la figure 7 est un organigramme illustrant la phase d'apprentissage préalable des paramètres de configuration optimale des liaisons entre les modules ; et -la figure 8 est un organigramme montrant les principales phases d'une procédure de traitement d'image mise en oeuvre au moyen d'un système de traitement d'image configuré conformément à l'invention.

Sur la figure 1, on a représenté la structure générale d'une installation de prises de vues, désignée par la référence numérique générale 10.

Dans l'exemple d'application considéré, ce système 10 est destiné à prendre une ou plusieurs vues d'un objet 12, constitué en l'espèce par un aéronef, et à traiter ces vues au moyen d'un système de traitement d'image 14, de manière à reconnaître l'objet 12, c'est-à-dire à identifier le type d'objet auquel il appartient.

A cet effet, outre le système de traitement d'image 14, l'installation 10 est pourvue de moyens de prises de vue 15, de type classique, raccordés au système de traitement d'image 14, et une interface d'entrée/sortie 18, destinée à présenter à l'utilisateur le résultat du traitement d'image effectué au sein du système de traitement 14, et à permettre à l'utilisateur d'entrer des paramètres de configuration du système 14.

Les moyens de prise de vues sont constitués par des moyens numériques de prise de vues ou sont associés à un convertisseur analogique-numérique.

Comme on le voit sur cette figure 1, le système de traitement 14 comporte essentiellement un calculateur 20 dans lequel sont

hébergés tous les moyens logiciels permettant une détection et une reconnaissance de l'objet 12, comme cela sera exposé en détail par la suite, ainsi qu'une base d'image 16 servant à configurer le système de traitement 14 en fonction de la nature de l'objet à reconnaître.

Sur les figures 2 et 3, on a représenté deux exemples d'architecture pour le système de traitement d'image 14, cette architecture étant par exemple implémentée sous une forme logicielle hébergée au sein du calculateur 20.

En se référant aux figures 2 et 4, le système de traitement d'image 14 comporte un ensemble de modules de traitement d'image, tels que 22 et 24, constitués, l'un, à savoir le module de traitement désigné par la référence numérique 22, par un module d'interface d'entrée, et l'autre, à savoir le module de traitement désigné par la référence numérique 24, par un module de traitement de sortie.

Le module d'interface d'entrée reçoit, en entrée, une image 26 à traiter, tandis que le module de traitement de sortie 24 délivre, en sortie, une image de sortie 28, qui contient des informations relatives à la nature de l'objet dans l'image, permettant une reconnaissance de ce dernier.

Les modules de traitement 22 et 24 contiennent chacun un ensemble d'éléments de traitement, tels que 30, répartis selon un réseau bidimensionnel.

Comme on le voit sur la figure 4, les modules de traitement 22 et 24, et en particulier les éléments de traitement 30, communiquent entre eux par l'intermédiaire d'éléments de liaison L.

En ce qui concerne l'image d'entrée 26, comme cela est conventionnel, celle-ci comporte un ensemble de pixels Pij répartis en lignes i et colonnes j, associés chacun à une valeur d'intensité.

Au niveau de l'interface d'entrée 22, chaque élément de traitement 30 communique avec un pixel Pij.

De mme, l'image de sortie 28 est constituée d'un ensemble de pixels P'ij répartis en ligne i et colonne j.

Comme on le voit sur la figure 4, au niveau du module de traitement de sortie 24, chaque élément de traitement 30 communique avec un pixel P'ij de l'image de sortie 28.

Entre l'interface d'entrée 22 et le module de traitement de sortie 24, les éléments de liaison L peuvent tre configurés de manière à conformer les liaisons entre les éléments de traitement 30, c'est-à- dire créer des liaisons spécifiques entre la sortie de l'interface d'entrée 22 et l'entrée du module de traitement de sortie 24, en fonction de la nature d'un objet à détecter dans l'image d'entrée 26.

A cet effet, le système de traitement d'image 14 est pourvu d'une interface de configuration 32 adaptée pour créer et configurer des éléments de liaison spécifiques L entre les modules de traitement 22 et 24, à partir de paramètres d'apprentissage 34 correspondant à une configuration optimale des éléments de liaison L pour le type d'objet à reconnaître dans l'image d'entrée 26.

Ainsi, par exemple, si l'on cherche à reconnaître un avion dans l'image, on configurera les éléments de liaison de manière optimale pour la détection d'avions dans l'image.

Comme cela sera décrit en détail par la suite en référence à la figure 6, ces paramètres de configuration sont délivrés par un étage d'apprentissage dont est pourvu le système de traitement d'image 14.

Les paramètres de configuration générés pour créer les éléments de liaison L entre les modules de traitement 22 et 24, sont de différentes natures.

Ils peuvent par exemple tre constitués par la référence des éléments de traitement 30 à relier, la référence des modules de traitement entre lesquels il convient de créer des liaisons, le nombre de modules,...

En effet, comme on le voit sur la figure 3, contrairement au mode de réalisation visible sur la figure 2, selon lequel le système de traitement 14 n'est pourvu que de deux modules de traitement 22 et 24, il est également possible, en fonction de la nature de l'image à traiter et de sa complexité, de pourvoir le système d'un nombre quelconque de modules de traitement additionnel, tels que 36, interposés entre

l'interface d'entrée 22 et le module de traitement de sortie 24. Dans ce cas, les paramètres de configuration comprennent l'indication des modules de traitement entre lesquels il convient de réaliser des éléments de liaison L.

En ce qui concerne l'interface d'entrée 22, qui reçoit les pixels Pi, de l'image d'entrée 26, qui constitue la couche d'entrée du système de traitement, cette interface est constituée par un étage de codage temporel de l'intensité des pixels de l'image d'entrée, en transformant la valeur de l'intensité de chaque pixel en une valeur de retard, en délivrant des impulsions à des instants en fonction du niveau d'intensité du pixel qui lui est associé. Par exemple, plus l'intensité d'un pixel est élevée, plus le retard est faible.

Les impulsions ainsi générées sont ensuite délivrées à chaque élément de traitement 30 du module de traitement de sortie, éventuellement par l'intermédiaire de modules additionnels, dont elles augmentent l'activité jusqu'à déclencher l'émission éventuelle de nouvelles impulsions lorsque le niveau d'activité au sein de cet élément de traitement dépasse un seuil prédéterminé.

Ainsi, le niveau d'activation et le délai avant impulsion observé au niveau du module de traitement de sortie 24 déterminent la valeur de l'intensité des pixels de l'image de sortie 28.

Comme indiqué précédemment, les modules de traitement d'image sont constitués par des éléments de traitement répartis selon un réseau bidimensionnel.

De préférence, en particulier en ce qui concerne le module de traitement de sortie 24, ainsi que les modules de traitement additionnel 36 dans le mode de réalisation de la figure 3, les éléments de ces modules sont des neurones à impulsions.

Dans ce cas, l'interface d'entrée 22 est constituée par la couche d'entrée du réseau de neurones.

Selon cet agencement, chacun des modules de traitement correspond à une couche du réseau neuronal.

On a représenté sur la figure 5 l'architecture générale d'un neurone entrant dans la constitution d'un module de traitement.

Comme on le voit sur cette figure 5, un élément d'un réseau neuronal comporte deux parties, à savoir : une unité d'entrée 38 et une unité de génération d'impulsions 42.

L'unité d'entrée 38 effectue un traitement des impulsions d'entrée Y (kl),... : et Y (kn) provenant de neurones adjacents, avec une fonction R établissant un retard exponentiel.

Les signaux ainsi élaborés sont ensuite combinés au moyen d'un sommateur 46, une constante additive, égale à Bj, étant en outre ajoutée.

Ainsi, en sortie, l'unité de liaison 40 délivre un signal Uj satisfaisant à la relation suivante : Uj = X (W) +Bj dans laquelle Wij désigne un coefficient de liaison.

En ce qui concerne l'unité 42 de génération d'impulsions, celle-ci comporte un comparateur 48 dont l'entrée non inverseuse reçoit, en entrée, le signal Uj ainsi élaboré, ainsi qu'un élément retardateur 49 caractérisé en outre par un coefficient multiplicateur Aj, dont la sortie communique avec l'entrée inverseuse du comparateur et dont l'entrée est reliée à un étage 50 de génération d'impulsions.

L'élément retardateur 49 est destiné à l'élaboration d'une valeur de seuil 0j pour le comparateur 48.

Le générateur d'impulsions 50 est constitué par un générateur de type classique. Il est destiné à délivrer un train d'impulsions lorsque la valeur du signal U, dépasse la valeur de seuil Qj.

Le train d'impulsions ainsi délivré est ensuite fourni, en aval, à l'entrée des neurones de la couche supérieure.

En configurant de manière appropriée les éléments de liaison L entre les modules de traitement, il est possible de disposer, dans l'image de sortie 28, d'informations permettant d'identifier précisément la nature de l'objet présent dans l'image d'entrée 26.

Comme indiqué précédemment, conformément à l'invention, pour configurer ces éléments de liaison en fonction de la nature de l'objet à reconnaître, on utilise un étage d'apprentissage.

En se référant à la figure 6, cet étage d'apprentissage, désigné par la référence numérique générale 52, délivre les paramètres de configuration d'architecture 34 à l'interface de configuration 32.

Il est associé à une base de données d'apprentissage 54 permettant, lors d'une phase d'apprentissage, de connaître la performance de chaque type de configuration pour différentes images de divers types, chaque type étant caractérisé par le fait que les images correspondantes contiennent un mme objet particulier.

Dans la suite de la description, on considèrera qu'il convient d'acquérir des paramètres de configuration optimale pour un seul type d'images. Il convient alors de connaître la performance de chaque configuration possible ou disponible pour les images de ce type.

On conçoit néanmoins que pour l'obtention des paramètres de configuration optimale pour des images de différentes natures, cette phase d'apprentissage est répétée en conséquence en utilisant des bases de données spécifiques à chaque type d'images.

Sur la figure 6, l'étage d'apprentissage 52 comporte un module de manipulation d'images 56 destiné à présenter, en tant qu'image d'entrée, chacune des images extraites de la base de données 54.

Un module de configuration d'architecture 58 est chargé d'élaborer les paramètres de configuration d'architecture 34 et de les délivrer à l'interface de configuration 32.

A cet effet, ce module 58 comporte, stockés en mémoire, un ou plusieurs jeux de paramètres d'architecture représentant les meilleurs candidats à un instant donné lors de l'apprentissage.

En outre, un module de calcul de scores 62 effectue un traitement de l'image de sortie 28 de manière à élaborer un score représentatif de la pertinence de l'image vis-à-vis de l'objet qu'il convient de reconnaître dans l'image de sortie.

Comme on le conçoit, différentes caractéristiques de l'image peuvent servir de base à l'élaboration du score. Ainsi, par exemple, l'intensité des pixels dans une zone spécifique de l'image peut tre utilisée pour l'élaboration de ce score.

On notera néanmoins que, de préférence, ce score est élaboré en utilisant différentes fonctions prédéterminées choisies en fonction de la valeur d'une étiquette associée à chacune des images au sein de la base de données 54.

En effet, cette base de données 54 regroupe pour un type donné d'image, des images pertinentes et des images non pertinentes. Une étiquette ayant une valeur positive est affectée aux images pertinentes.

Au contraire, une étiquette ayant une valeur nulle est affectée aux images non pertinentes.

A partir de ces labels, on choisit les fonctions d'élaboration de scores de manière à obtenir un score élevé pour les images pertinentes, et un score faible pour les images non pertinentes.

Enfin, l'étage d'apprentissage 52 est complété par un noyau d'apprentissage 64 assurant le pilotage des différents éléments entrant dans la constitution de l'étage d'apprentissage.

On va maintenant décrire, en référence à la figure 7, une phase d'apprentissage de paramètres de configuration optimale pour un type donné d'objet à reconnaître dans une image.

Comme indiqué précédemment, le but de cette phase est d'acquérir les paramètres de configuration permettant d'obtenir un score le plus élevé.

Lors d'une première étape 66, l'utilisateur entre, au moyen de l'interface 18, les références de M d'images disponibles dans la base 16, qui sont destinées à tre utilisées pour la phase d'apprentissage à mettre en oeuvre, ainsi que des valeurs de seuil Thl et Th2 correspondant respectivement à une valeur de score à partir de laquelle on considère que la configuration est suffisamment efficace, et à une valeur de seuil de durée destinée à tre utilisée pour l'arrt de la phase d'apprentissage, comme cela sera indiqué par la suite.

Lors de l'étape 68 suivante, le système de traitement d'image, et en particulier le noyau d'apprentissage 64, procède à une initialisation de N paramètres de configuration d'architecture P1, P2, ..., PN.

Lors de l'étape 70 suivante, il est procédé à une mise à zéro d'une variable t de temps. Il est ensuite procédé à une incrémentation de cette variable t (étape 72).

Lors de l'étape 74 suivante, le système de traitement positionne à zéro une variable k servant à identifier un jeu de paramètres de configuration, puis procède à une incrémentation de cette variable (étape 76).

Des paramètres de configuration Pk sont alors envoyés par le manipulateur de configuration d'architecture 58 à l'interface de configuration 32, de manière à configurer, en conséquence, les éléments de liaison entre les modules de traitement (étape 78).

Une variable i, destinée à désigner chacune des M images utilisées pour l'apprentissage, est alors positionnée à zéro (étape 80), puis incrémentée (étape 82).

Lors de l'étape 84 suivante, pour la configuration correspondant aux paramètres de configuration Pk, l'image Ml est présentée en entrée de l'interface d'entrée 22, et le système de traitement procède au traitement de cette image. Parallèlement, à partir de l'étiquette qui est associée à cette image, le module d'évaluation de score 62 procède à un choix de la fonction F destinée à tre utilisée pour le calcul du score.

Il est alors procédé au calcul du score Sk ; pour l'image numéro i et pour la configuration numéro k, c'est-à-dire, à ce stade de la procédure d'apprentissage, au score obtenu pour la première image et pour la première configuration.

Lors de l'étape 86 suivante, un test est effectué de manière à déterminer si toutes les images ont été présentées en entrée du système de traitement d'image.

Si tel n'est pas le cas, la procédure retourne à l'étape 82 précédemment mentionnée. Les étapes 82 à 86 sont alors effectuées à nouveau pour les autres images.

Si tel est le cas, lors de l'étape 88 suivante, il est procédé, par l'étage d'apprentissage, à un calcul du score global pour l'architecture k considérée, c'est-à-dire à un calcul d'un score Sx élaboré à partir

d'une fonction d'élaboration de score global f et des scores élémentaires Ski obtenus successivement pour les images i et pour la configuration k considérée. Par exemple, cette fonction d'élaboration de score global peut tre constituée par une sommation combinée, le cas échéant, à une pondération. A ce stade de la procédure, le score global correspond au score Sl.

Lors de l'étape 90 suivante, un test est effectué de manière à déterminer si toutes les configurations N ont été testées.

Si tel n'est pas le cas, la procédure retourne à l'étape 76 précédemment mentionnée. Les étapes 76 à 90 sont alors à nouveau effectuées pour une autre configuration du système de traitement d'images.

Si tel est le cas, lors de l'étape 92 suivante, il est procédé à un test de manière à déterminer si le meilleur score S est supérieur à la première valeur de seuil Thl, ou si la variable de durée t est supérieure à la deuxième valeur de seuil Th2.

Si tel est le cas, lors de l'étape 94 suivante, les paramètres de configuration P correspondant aux meilleurs scores sont délivrés, en sortie, par exemple sur l'interface d'entrée/sortie 18.

Si tel n'est pas le cas, les paramètres de configuration sont alors modifiés (étape 95) et la procédure retourne à l'étape 72 précédemment mentionnée.

Comme on le conçoit, à partir de cette phase d'apprentissage préalable, il est possible de déterminer les paramètres de configuration optimale pour un type d'objet donné à détecter.

Ces paramètres peuvent alors tre utilisés lors de l'exploitation du système de traitement d'image pour la reconnaissance d'objets proprement dits.

On va maintenant décrire, en référence à la figure 8, une phase de reconnaissance d'objets mise en oeuvre au moyen de paramètres de configuration obtenus lors de la phase d'apprentissage préalable. On suppose, dans cet exemple, que la position et l'échelle de l'objet à reconnaître ne sont pas connus, c'est-à-dire qu'il s'agit en l'espèce de détecter un objet.

Lors d'une première étape 96, une image à traiter est présentée en entrée du système de traitement d'image, les paramètres de configuration optimale P sont entrés au moyen de l'interface d'entrée/sortie 18, de manière à fournir au système de traitement l'indication de la configuration adaptée à l'objet à rechercher.

Par exemple, si l'on cherche à reconnaître un avion dans l'image, les paramètres correspondant à la meilleure configuration pour une telle recherche sont entrés lors de cette étape.

Lors de l'étape 98 suivante, le calculateur 20 procède à l'élaboration d'un ensemble d'images à partir de l'image présentée en entrée du système, en utilisant des facteurs d'échelle respectifs. C'est- à-dire, on forme un image pyramidale constituée par l'association de plusieurs images grossies formées à partir de l'image d'entrée en utilisant des coefficients d'agrandissement respectifs.

Lors de l'étape 100 suivante, des variables x, y et s sont positionnées à zéro. Les variables x et y correspondent à des coordonnées dans un système de coordonnées cartésiennes dans une image particulière identifiée par la variable s, laquelle correspond à un facteur d'échelle permettant d'identifier les images élaborées par grossissement de l'image d'entrée.

Lors de l'étape 102 suivante, on procède à un traitement des éléments d'image correspondant à la position désignée par les variables x, y et s.

On procède alors à un calcul de score, de manière similaire à celle utilisée lors de la phase d'apprentissage (étape 104). Au cours de cette étape 104, on procède à une comparaison du score ainsi obtenu avec une valeur de seuil préalablement entrée par l'utilisateur, de manière à identifier les éléments d'image candidats susceptibles de correspondre à un objet à détecter.

Lors de l'étape 106 suivante, on procède à un test de manière à déterminer si d'autres éléments d'image doivent tre testés.

Si tel est le cas, la procédure retourne à l'étape 102 précédemment mentionnée pour le traitement des éléments d'image restants.

Si tel n'est pas le cas, lors de l'étape 108 suivante, il est procédé à un traitement ultérieur des éléments d'image candidats.

Ce traitement est mis en oeuvre au sein d'un étage de traitement additionnel intégré au calculateur 20, de manière à procéder à une discrimination, parmi les éléments d'image considérés comme candidats, entre les éléments d'image englobant réellement un objet à détecter et les éléments d'image n'englobant pas un tel objet, c'est-à- dire correspondant à une fausse détection.

Un tel traitement additionnel peut, par exemple, s'effectuer en déterminant la distance séparant des éléments d'image candidats et en comparant cette distance avec une valeur de seuil, de manière à ne conserver les éléments d'image candidats qui ne sont séparés d'une distance inférieure à la valeur de seuil.

On constate en effet que les éléments d'image candidats, qui sont séparés d'une distance relativement importante, correspondent généralement à des fausses détections.

A l'issu de cette étape de traitement additionnel, le système de traitement d'image est en mesure de délivrer, en sortie, par exemple sur l'interface d'entrée/sortie 18, la liste des coordonnées des éléments d'image correspondant à l'objet détecté (étape 110).

Previous Patent: METHOD FOR SYNTHESIZING A MINUTIAE TEMPLATE AND INCREASING RELIABILITY OF FINGERPRINT MATCHING USING...

Next Patent: WIRELESS ACOUSTIC BASED POINTING DEVICE, E.G. COMPUTER MOUSE, FOR CONTROLLING A CURSOR ON A DISPLAY ...