Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SYSTEM FOR COUNTING PEOPLE
Document Type and Number:
WIPO Patent Application WO/2010/130964
Kind Code:
A1
Abstract:
System (1) for counting people, comprising image acquisition means (4) and data processing means (5), characterized in that the image acquisition means (4) include a stereoscopic sensor, said data processing means being able to receive stereoscopic images from said stereoscopic sensor, to infer whether or not one or more persons are present in the field of vision of said stereoscopic sensor (5), and, for each person whose presence has been detected, to calculate the movement path of said person in order to determine whether said person should be counted or not.

Inventors:
KHOUDOUR LOUAHDI (FR)
YAHIAOUI TAREK (FR)
Application Number:
PCT/FR2010/050938
Publication Date:
November 18, 2010
Filing Date:
May 14, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
INRETS INST NAT DE RECH SUR LE (FR)
KHOUDOUR LOUAHDI (FR)
YAHIAOUI TAREK (FR)
International Classes:
G07C9/00
Domestic Patent References:
WO2009017687A12009-02-05
Foreign References:
EP0847030A21998-06-10
US20060067456A12006-03-30
EP1100050A12001-05-16
Other References:
None
Attorney, Agent or Firm:
LAGET, Jean-Loup (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Système de comptage (1) de personnes comportant des moyens d'acquisition d'images (4) et des moyens de traitement de données (5), les moyens d'acquisition d'images (4) comprenant un capteur stéréoscopique, lesdits moyens de traitement de données étant aptes à recevoir des images stéréoscopiques provenant dudit capteur stéréoscopique, à en déduire la présence ou non d'une ou de plusieurs personne(s) dans le champ de vision dudit capteur stéréoscopique (5), et, pour chaque personne dont la présence a été détectée, à calculer la trajectoire de ladite personne pour déterminer si ladite personne doit être comptabilisée ou non, caractérisé en ce que ledit capteur stéréoscopique a une résolution inférieure ou égale à 320 pixels x 240 pixels.

2. Système de comptage selon la revendication 1, caractérisé en ce que ledit capteur stéréoscopique (4) comprend deux webcams (6a,

6b), la fréquence d'acquisition de chacune desdites webcams (6a, 6b) étant d'environ trente images par seconde.

3. Système de comptage selon la revendication 1 ou 2, caractérisé en ce que lesdits moyens d'acquisition d'images (4) et lesdits moyens de traitement de données (5) sont connectés entre eux par le biais d'une interface USB2.

4. Système de comptage selon la revendication 1 ou 2, caractérisé en ce que lesdits moyens d'acquisition d'images (4) et lesdits moyens de traitement de données (5) sont connectés entre eux par un bus d'entrée-sortie de type série

5. Procédé de comptage apte à être exécuté par les moyens de traitement du système de comptage selon l'une quelconque des revendications 1 à 4, caractérisé en ce qu'il comprend des étapes consistant à : (a) recevoir deux images stéréoscopiques provenant d'un capteur stéréoscopique présentant une résolution inférieure ou égale à 320 pixels x 240 pixels,

(b) calculer, pour ladite paire d'images stéréoscopiques, une carte de disparités, (c) exploiter ladite carte de disparités pour calculer une carte des hauteurs représentant les distances par rapport au sol de chaque point de la scène, et

(d) utiliser ladite carte des hauteurs pour mettre en évidence la présence d'une ou plusieurs personne(s).

6. Procédé de comptage selon la revendication 5, caractérisé en ce que l'étape (d) comprend des sous-étapes consistant à :

(e) segmenter ladite carte des hauteurs pour mettre en évidence les têtes des personnes, le résultat étant une image binaire appelée carte des noyaux, un noyaux correspondant à un ensemble de pixels connexes représentant vraisemblablement la tête d'une personne,

(f) utiliser ladite carte des noyaux pour obtenir un vecteur d'attributs caractérisant chaque personne détectée,

(g) utiliser ledit vecteur d'attributs pour calculer la trajectoire de ladite personne, et

(h) analyser ladite trajectoire dans une série d'images successives pour déterminer si ladite personne doit être comptabilisée ou non.

7. Procédé de comptage selon la revendication 5 ou 6, caractérisé en ce qu'il comprend des étapes consistant à tester des critères de similarité choisis parmi la similarité des niveaux de gris des centres des voisinages de calcul, la similarité d'appartenance à un contour, la similarité des allures des courbes des niveaux de gris des lignes centrales des voisinages de calcul et la similarité d'appartenance à une région affectée par le mouvement. 8. Procédé de comptage selon l'une quelconque des revendications 5 à 7, caractérisé en ce qu'il est exécuté en temps réel.

9. Procédé de comptage selon l'une quelconque des revendications 5 à 7, caractérisé en ce qu'il est exécuté en temps différé.

10. Utilisation du système de comptage selon l'une quelconque des revendications 1 à 4 pour compter les passagers entrant et sortant par une porte d'un autobus, ledit capteur stéréoscopique (4) étant placé verticalement au dessus de la porte (3) de l'autobus.

Description:
SYSTEME DE COMPTAGE DE PERSONNES

La présente invention a pour objet un système de comptage de personnes. Le système de comptage de personnes est en particulier destiné à être utilisé pour compter des voyageurs entrant et sortant d'un moyen de transport, par exemple un autobus. Le comptage de voyageurs est un besoin primordial pour les opérateurs de transport. Effectivement, ces derniers cherchent une information de comptage fiable et précise pour pouvoir planifier et gérer de la manière la plus adéquate possible les ressources humaines, financières et matérielles. En particulier, le partage de recettes entre les opérateurs desservant les mêmes zones et l'évaluation du taux de fraude sont deux objectifs qui nécessitent une information de comptage très précise. Dans ce dernier cas, les approximations et les estimations statistiques ne suffisent pas pour réaliser ces objectifs.

De nombreux systèmes de comptage de personnes dans les transports en commun existent et sont basés sur des technologies diverses, par exemple les capteurs infrarouges, les ultrasons, les tapis- contact ou les rayons lumineux. Cependant, les systèmes existants ont des taux d'erreur très élevés et ne peuvent pas gérer des situations complexes comme la sortie d'une foule de personnes. En outre, les systèmes existants sont généralement coûteux et nécessitent un traitement des données complexe. Le système de comptage peut également être utilisé dans un magasin, un musée, un cinéma, un centre sportif, ou de manière générale dans tout lieu public ou privé.

La présente invention a pour but de proposer un système de comptage de personnes qui évite au moins certains des inconvénients précités, qui soit économique et fiable.

A cet effet, l'invention a pour objet un système de comptage de personnes comportant des moyens d'acquisition d'images et des moyens de traitement de données, caractérisé en ce que les moyens d'acquisition d'images comprennent un capteur stéréoscopique, lesdits moyens de traitement de données étant aptes à recevoir des images stéréoscopiques provenant dudit capteur stéréoscopique, à en déduire la présence ou non d'une ou de plusieurs personne(s) dans le champ de vision dudit capteur stéréoscopique, et, pour chaque personne dont la présence a été détectée, à calculer la trajectoire de ladite personne pour déterminer si ladite personne doit être comptabilisée ou non. De préférence, le capteur stéréoscopique a une résolution inférieure ou égale à 320 pixels x 240 pixels.

Avantageusement, ledit capteur stéréoscopique comprend deux webcams, la fréquence d'acquisition de chacune desdites webcams étant d'environ trente images par seconde. Selon un mode de réalisation de l'invention, lesdits moyens d'acquisition d'images et lesdits moyens de traitement de données sont connectés entre eux par le biais d'une interface USB2.

Selon un autre mode de réalisation de l'invention, lesdits moyens d'acquisition d'images et lesdits moyens de traitement de données sont connectés entre eux par un bus d'entrée-sortie de type série.

De préférence, lesdits moyens de traitement exécutent un procédé de comptage comprenant des étapes consistant, pour chaque paire d'images stéréoscopiques, à : (a) calculer une carte de disparités, (b) exploiter ladite carte de disparités pour calculer une carte des hauteurs représentant les distances par rapport au sol de chaque point de la scène, et

(c) utiliser ladite carte des hauteurs pour mettre en évidence la présence d'une ou plusieurs personne(s). Avantageusement, l'étape (c) comprend des sous-étapes consistant à :

(d) segmenter ladite carte des hauteurs pour mettre en évidence les têtes des personnes, le résultat étant une image binaire appelée carte des noyaux, un noyau correspondant à un ensemble de pixels connexes représentant vraisemblablement la tête d'une personne,

(e) utiliser ladite carte des noyaux pour obtenir un vecteur d'attributs caractérisant chaque personne détectée,

(f) utiliser ledit vecteur d'attribut pour calculer la trajectoire de ladite personne, et (g) analyser ladite trajectoire dans une série d'images successives pour déterminer si ladite personne doit être comptabilisée ou non. Selon un mode de réalisation de l'invention, ledit procédé de comptage comprend des étapes consistant à tester des critères de similarité choisis parmi la similarité des niveaux de gris des centres des voisinages de calcul, la similarité d'appartenance à un contour, la similarité des allures des courbes des niveaux de gris des lignes centrales des voisinages de calcul et la similarité d'appartenance à une région affectée par le mouvement.

Selon un mode de réalisation de l'invention, lesdits moyens de traitement exécutent un procédé de comptage, ledit procédé de comptage étant exécuté en temps réel.

Selon un autre mode de réalisation de l'invention, lesdits moyens de traitement exécutent un procédé de comptage, ledit procédé de comptage étant exécuté en temps différé.

L'invention a également pour objet l'utilisation du système de comptage pour compter les passagers entrant et sortant par une porte d'un autobus, ledit capteur stéréoscopique étant placé verticalement au dessus de la porte de l'autobus.

L'invention sera mieux comprise, et d'autres buts, détails, caractéristiques et avantages de celle-ci apparaîtront plus clairement au cours de la description explicative détaillée qui va suivre, de plusieurs modes de réalisation de l'invention donnés à titre d'exemples purement illustratifs et non limitatifs, en référence aux dessins schématiques annexés.

Sur ces dessins : - la figure 1 est une vue schématique simplifiée en perspective du système de comptage selon un mode de réalisation de l'invention ; la figure 2 est un schéma fonctionnel représentant les étapes du procédé de comptage de personnes ; - les figures 3a à 3b sont des courbes représentant des variables utilisées par les moyens de traitement des données du système de comptage : o la figure 3 a est une courbe représentant le critère de dissemblance en fonction du décalage s avant l'utilisation d'un coefficient de pondération ; o la figure 3b est une courbe représentant la variation de la valeur du coefficient de pondération en fonction du décalage s ; o La courbe 3c est une courbe représentant le critère de dissemblance en fonction du décalage s après l'intégration du coefficient de pondération ; la figure 4a est une vue schématique d'une zone de comptage utilisée par le procédé de comptage de personnes, montrant des exemples de trajectoires valides ; et - la figure 4b est une vue schématique de la zone de comptage, montrant des exemples de trajectoires non valides.

L'invention a pour objet un système de comptage de personnes basé sur la vision stéréoscopique. Dans l'exemple représenté sur la figure 1, le système de comptage est utilisé pour compter les passagers 2 entrant et sortant d'un autobus via une porte 3.

Un objectif est de fournir un système de comptage 1 précis et adapté à l'environnement dans lequel il est utilisé, dans l'exemple l'autobus. Le système de comptage 1 comporte des moyens d'acquisition d'images, ou capteur 4, et des moyens de traitement de données, par exemple un ordinateur 5, qui sont par exemple connectés entre eux par le biais d'une interface USB2 (Universal Sériai Bus). En variante, le capteur 4 et l'ordinateur 5 sont connectés entre eux par un bus d'entrée- sortie de type série (IEEE). Cela permet d'augmenter le débit et la vitesse de transmission.

L'idée de base est d'isoler et de séparer les têtes des personnes pour pouvoir les compter. La façon la plus favorable pour le faire est d'installer les moyens d'acquisition d'images 4 de manière à avoir une vue de dessus de la scène observée.

Le capteur stéréoscopique 4 comprend une webcam gauche 6a, pour réaliser des images gauches, et une webcam droite 6b, pour réaliser des images droites. Les webcams 6a, 6b sont synchronisées, calibrées et montées dans un boitier. Le capteur 4 est alimenté en énergie par des moyens d'alimentation 7 du système 1. La fréquence d'acquisition de chaque webcam 6a, 6b est par exemple d'environ trente images par seconde. Les webcams 6a, 6b ont une basse résolution, inférieure ou égale à 320 pixels x 240 pixels. En variante, la résolution peut être de 160 pixels x 120 pixels ou de 80 pixels x 60 pixels.

L'utilisation d'un capteur 4 basse résolution permet, d'une part, de réduire le prix du capteur 4, donc du système 1 et, d'autre part, de limiter la quantité de données à traiter. Il est ainsi possible de réaliser un traitement en temps réel en utilisant des moyens de traitement simples, par exemple un ordinateur (PC) standard 5, sans perte de précision de comptage. On notera que l'utilisation de moyens d'acquisition d'images 4 basse résolution implique d'utiliser un procédé de traitement adapté, par exemple celui décrit ci-dessous.

Les deux webcams 6a, 6b sont mises en place dans l'autobus de manière que leurs plans images soient parallèles et qu'ils aient la même ligne de base (configuration épipolaire). En d'autres termes, dans l'exemple, le capteur 4 est placé verticalement au dessus de la porte 3 de l'autobus pour avoir une vue de dessus des têtes des passagers entrant et sortant par cette porte.

Les moyens de traitement 5 exploitent les images stéréoscopiques acquises à l'aide du capteur 4 et sauvegardent les résultats de comptage. Les moyens de traitement 5 comportent quatre blocs de traitements : un bloc de détection, un bloc de segmentation, un bloc d'extraction d'attributs et un bloc de suivi et de comptage.

Le bloc de détection calcule une carte de disparités pour chaque paire d'images stéréoscopiques et exploite la carte de disparité pour calculer une carte des hauteurs représentant la distance par rapport au sol de chaque point de la scène.

Le bloc de segmentation utilise la carte des hauteurs pour mettre en évidence les têtes des passagers, qui correspondent aux zones connexes de hauteurs importantes. Le résultat est une image binaire sur laquelle sont représentés des noyaux. Le but est d'obtenir pour chaque tête dans la scène observée un noyau sur l'image binaire.

Le bloc d'extraction des attributs mesure un certain nombre de paramètres à partir de l'image réelle gauche, la carte des hauteurs et l'image binaire résultant du bloc de segmentation. De ce fait, on obtient un vecteur d'attributs pour chaque noyau qui définit les coordonnées de celui-ci, sa taille, sa forme, le niveau de gris moyen de la région qui lui correspond dans l'image réelle ainsi que la hauteur moyenne de la région qui lui correspond dans la carte des hauteurs.

Le bloc de suivi et de comptage utilise les vecteurs d'attributs précédents pour restituer les trajectoires des noyaux, c'est-à-dire les trajectoires des têtes des passagers. Le comptage des passagers s'effectue à partir de l'analyse de chacune des trajectoires des noyaux dans les images successives.

En se référant à la figure 2, on va maintenant décrire plus en détail le procédé de comptage de personnes. Le procédé est exécuté dans l'ordinateur 5.

Selon un premier mode de réalisation de l'invention, le procédé est exécuté en temps réel. Dans ce mode de réalisation, les données provenant des webcams 6a, 6b sont stockées temporairement dans une mémoire tampon le temps nécessaire à leur traitement, mais ne sont pas enregistrées.

Selon un deuxième mode de réalisation de l'invention, le procédé est exécuté en temps différé. Dans ce mode de réalisation, les données provenant des webcams 6a, 6b sont au préalable enregistrées dans une mémoire, puis sont récupérées dans la mémoire pour réaliser le traitement. Par exemple les images provenant de la webcam 6a sont enregistrées dans un fichier de données « images gauches » et les images provenant de la webcam 6b sont enregistrées dans un fichier de données « images droites ».

A l'étape 1, l'ordinateur 5 reçoit deux images stéréoscopiques, provenant respectivement des deux webcams 6a, 6b. Dans le cas du premier mode de réalisation, les deux images proviennent directement des deux webcams 6a, 6b. Dans le cas du deuxième mode de réalisation, les deux images proviennent des deux webcams 6a, 6b via les fichiers de données. L'étape 1 est par exemple réalisée périodiquement avec une période de 1/30 seconde.

Les étapes 2 à 5 sont des étapes de test de critères de similarité.

On appelle critère de similarité un critère de ressemblance discriminant pouvant exister entre les pixels à apparier ou entre leurs voisinages (par exemple : le niveau de gris, le signe du gradient, l'appartenance à une forme géométrique bien précise, ou autre). Les objectifs de l'exploitation de ces critères de similarité sont, d'une part, la réduction du temps de calcul (car on ne tient compte que des pixels vérifiant les critères) et, d'autre part, l'amélioration de la mise en correspondance et du choix des pixels homologues.

Ici, on veut en particulier améliorer la qualité de la mise en correspondance. Pour cela, on pondère un critère de dissemblance C SAD permettant d' affiner le choix des pixels homologues. Ceci est effectué par l'introduction d'un coefficient de pondération dont la valeur dépend de la vérification ou non d'un critère de similarité. Quand le critère de similarité est vérifié le coefficient de pondération prend une valeur permettant de réduire le critère de dissemblance pour favoriser la mise en correspondance des pixels vérifiant ce critère de similarité. La valeur que prend le coefficient de pondération quand le critère de similarité n'est pas vérifié n'affecte aucunement le critère de dissemblance. Ceci est modélisé par une multiplication du critère de dissemblance C SAD par un coefficient de pondération.

Le critère de dissemblance initial s'écrit ainsi :

C SAD (x, y, z) = ∑ \G(x + i + s, y + /) - D(x + i, y + j)\ y

Avec : G(x,y): le niveau de gris du pixel (x,y) de l'image gauche qu'on cherche à apparier,

D(x,y) : le niveau de gris du pixel candidat (x,y) dans l'image droite, et s : le décalage entre les deux pixels gauche et droite. La mesure de dissemblance après l'introduction du critère de similarité s'écrit alors comme suit :

C Sim (x, y, z) = coef £ \G (x + i + s, y + j) - D (x + i, y + j)\ y coef désignant le coefficient de pondération, avec :

[coef = 1 si le critère de similarité n'est pas vérifié, et sinon coef = coefO avec 0 < coefO < 1 A titre d'exemple, la figure 3a est une courbe représentant le critère de dissemblance en fonction du décalage s avant l'utilisation d'un coefficient de pondération, la figure 3b est une courbe représentant la variation de la valeur du coefficient de pondération en fonction du décalage s, et la courbe 3c est une courbe représentant le critère de dissemblance en fonction du décalage s après l'intégration du coefficient de pondération. La disparité d correspond au décalage pour lequel le critère de dissemblance est minimal.

Dans l'exemple présenté, le fait de se contenter de la comparaison des voisinages des pixels à apparier conduit à une erreur de mise en correspondance. De ce fait, la multiplication par un coefficient de pondération permet de favoriser l'un des minimas de la courbe de dissemblance par rapport aux autres. Ainsi, la nouvelle valeur de la disparité correspond à un point pour lequel la dissemblance est minimale et le critère de similarité est vérifié.

En se basant sur ce principe, quatre critères de similarité on été définis. L'information de similarité qu'apporte chacun de ces critères de similarité est discriminante, n'est pas redondante par rapport aux autres et ne nécessite pas un temps de calcul rédhibitoire. Les critères de similarité retenus sont les suivants : similarité des niveaux de gris des centres des voisinages de calcul, similarité d'appartenance à un contour, similarité des allures des courbes des niveaux de gris des lignes centrales des voisinages de calcul et similarité d'appartenance à une région affectée par le mouvement. Des coefficients α, β, γ et μ ont été associés respectivement à ces critères de similarité. Les valeurs de ces coefficients varient selon que les critères sont vérifiés ou non.

α = lsi G(x + s, y) et D(x, y) n' ont pas des niveaux de gris similaires α = αθ avec 0 < αO < 1 si G(x + s, y) et D(x, y) ont des niveaux de gris similaires β = lsiG(x + s,y)etD(x,y)m correspondent pas tous deux à des points de contours β = β 0 avec 0 < β 0 < 1 si G(x + s, y) et D(x, y) correspondent tous deux à des points de contours

γ = lsi les courbes des niveaux de gris des lignes centrales des voisinages de calcul gauche et droite nont pas la même allure γ = γθ avecθ < γθ < 1 si les courbes des niveaux de gris des lignes centrales des voisinages de calcul gauche et droite ont la même allure

μ = lsiG(x + s, y)etD(x, y)nç correspond ent pas simultaném ent à un objet mobile ou statique μ = μO avec 0 < μO < 1 si G(x + s, y) et D(x, y) correspond ent simultaném ent à un objet mobile ou statique

Les valeurs optimales αO, βO, γO et μO ont été calculées expérimentalement en choisissant les valeurs minimisant le taux d'erreur de mise en correspondance.

Des variantes de la mesure du critère de dissemblance sont possibles. Par exemple, pour améliorer la précision de l'appariement des pixels, les différents critères de similarité peuvent être combinés. On considère dans ce cas que les critères de similarité proposés sont de nature différente et par conséquent plus ou moins indépendants. Cela signifie que l'effet d'un critère n'est pas redondant ou opposé à celui des autres. Il est donc possible de réunir les différents critères pour constituer un critère global. Un modèle additif a été choisi pour le calcul de la dissemblance, ce qui correspond à la pondération du critère de dissemblance par un coefficient englobant les quatre critères. La formulation globale devient :

C(x,y,s) = (a + $ +y + + i + s, y + j) - D(x + i,y + j)\ y Cette valeur est utilisée à l'étape 6. A l'étape 2, le procédé teste un premier critère de similarité, relatif aux niveaux de gris des pixels à apparier. Le coefficient α est associé à ce critère, comme cela a été décrit précédemment.

Si le critère de similarité est vérifié α= αO sinon α= 1. Après le calcul du coefficient α, le procédé passe à l'étape 3.

A l'étape 3, le procédé teste un deuxième critère de similarité, relatif à l'appartenance à des contours. Le coefficient β est associé à ce critère, comme cela a été décrit précédemment.

Si le critère de similarité est vérifié β=βθ, sinon β=l. Après le calcul du coefficient β, le procédé passe à l'étape 4.

A l'étape 4, le procédé teste un troisième critère de similarité, relatif aux niveaux de gris des lignes centrales. Le coefficient γ est associé à ce critère, comme cela a été décrit précédemment.

Si le critère de similarité est vérifié γ=γθ, sinon γ=l. Après le calcul du coefficient γ, le procédé passe à l'étape 5.

A l'étape 5, le procédé teste un quatrième critère de similarité, relatif à l'appartenance à une région affectée par le mouvement. Le coefficient μ est associé à ce critère, comme cela a été décrit précédemment. Si le critère de similarité est vérifié μ=μθ, sinon μ=l. Après le calcul du coefficient μ, le procédé passe à l'étape 6.

A l'étape 6, le procédé détermine une carte de disparités dense à partir de la mise en correspondance des pixels des images droite et gauche, c'est-à-dire en fonction des critères de similarité testés aux étapes 2 à 5. Plus la valeur de disparité en un point est élevée et plus le point correspondant est proche du capteur.

Diverses techniques pour le calcul des disparités sont connues.

Elles proposent des solutions pour rechercher les pixels homologues qui sont les pixels dans les images gauche et droite d'un capteur stéréoscopique qui correspondent aux deux projections du même point dans la scène. Ici, on utilise de préférence une technique de mise en correspondance rapide. La somme des différences absolues (SAD), qui est une technique basée sur la mesure de dissemblance entre les voisinages des pixels à apparier, représente une approche qui permet un compromis entre la robustesse du calcul des disparités et le temps de traitement. Dans l'exemple du comptage des passagers entrant et sortant de l'autobus, le capteur est proche des objets observés. La difficulté principale, dans ce cas de figure, est le nombre élevé d'occultations dans les images stéréoscopiques, ce qui correspond à des régions dans la scène qui apparaissent sur une image et pas sur l'autre.

Pour résoudre ce problème, on utilise une technique basée sur la mesure de dissemblance, mais qui intègre les critères de similarité entre les pixels à mettre en correspondance ainsi que leur voisinage pour améliorer la mise en correspondance de façon globale sur l'ensemble de l'image et de façon particulière au niveau des régions occultées ou au niveau de celles qui leur sont proches.

La disparité, dans ce cas spécifique, est la différence entre les abscisses des deux projections d'un point de la scène sur les deux images. La stéréovision dense fournit des cartes de disparités denses correspondant à la représentation de chaque point de la scène (pixel) par la valeur de disparité lui correspondant. L'objectif est de déterminer l'information de distance par rapport au capteur en chaque point de la scène. Celle-ci est inversement proportionnelle à la valeur de disparité.

A l'étape 7, le procédé transforme l'information de disparité en information de hauteur en utilisant une transformation mathématique basée sur une modélisation géométrique du stéréoscope. Le résultat à l'issu de cette étape est une carte de hauteurs.

A l'étape 8, le procédé segmente la carte de hauteurs pour mettre en évidence les noyaux, qui représentent les têtes des personnes qui passent sous le capteur, et les suivre. Ces noyaux possèdent des caractéristiques (niveau de gris moyen, largeur, hauteur, entre autres) qui permettent de les suivre dans la zone de comptage. Ainsi des vecteurs de ces caractéristiques sont utilisés pour le suivi.

En d'autres termes, les cartes de disparités calculées sont transformées en cartes des hauteurs, par une simple triangulation, puis, pour mettre en évidence les têtes des passagers, le procédé définit un certain nombre d'intervalles de hauteurs. Pour chaque intervalle, le procédé dispose d'une image binaire sur laquelle ne figurent que les régions ayant une hauteur comprise entre les valeurs limitant l'intervalle. L'application de filtres morphologiques de type ouvertures ainsi que la suppression des voisinages des entités connexes identifiées dans les intervalles supérieurs sur chacune de ces images binaires permet d'identifier les têtes des personnes ayant des tailles comprises dans ces intervalles. A la fin du traitement, on obtient une image binaire qui représente la réunion des résultats intermédiaires sur laquelle chaque noyau correspond à la tête d'une personne.

L'étape de segmentation de la carte des hauteurs consiste à identifier, à partir de celle-ci, la partie supérieure du corps de chacune des personnes évoluant dans la scène. Le but est de permettre la mise en évidence des têtes de ces personnes. Le principe de l'approche proposée se base sur la définition d'un certain nombre de niveaux de seuillage dans la carte des hauteurs. Pour un certain nombre d'intervalles de hauteurs prédéfinies, l'objectif est d'identifier et de reconnaître des zones correspondant à des têtes dans les images seuillées selon ces intervalles. On va maintenant décrire plus en détail l'étape 8.

Le nombre d'intervalles est par exemple fixé à quatre, les hauteurs des intervalles correspondant à des hauteurs de personnes. Cela revient à dire que cinq seuils Si sont prédéfinis, i étant un indice entier compris entre 1 et 5, pour définir les différents intervalles. Le seuil Si correspondant à la hauteur la plus élevée est S5 et celui qui correspond à la hauteur la moins élevée est S l, qui correspond à la taille moyenne d'un enfant de quatre ans car les enfants de cet âge représentent une catégorie d'usagers qui ne paie pas pour le transport.

L'étape 8 comporte les sous-étapes décrites ci-dessous. Une première sous-étape consiste à binariser l'image avec les seuils Si correspondant à l'intervalle. On obtient une image dans laquelle un pixel de valeur 1 indique que le point de la scène correspondant présente une hauteur comprise entre Si et Si-I . La première sous-étape est effectuée pour chaque intervalle, ce qui permet d'obtenir quatre images binaires.

Une deuxième sous-étape est exécutée pour tous les intervalles sauf l'intervalle supérieur. Le procédé élimine les éléments de l'image correspondant à des personnes déjà identifiées lors du traitement des intervalles précédents. Ces éléments sont repérés car ils sont connexes ou situés aux voisinages de marqueurs déjà définis lors d'un passage à la quatrième sous-étape. Une troisième sous-étape consiste à éliminer les zones de petites dimensions qui sont considérées comme des erreurs de détection. Pour ce faire, le procédé utilise une opération d'ouverture morphologique, qui élimine les composantes connexes de l'image dont la surface est faible. Une quatrième sous-étape consiste à définir des marqueurs sur les éléments connexes de l'image qui n'ont pas été éliminés lors d'un passage à la deuxième sous-étape. Ces marqueurs indiquent les têtes des personnes dont la hauteur est comprise entre Si et Si-I .

Une cinquième sous-étape consiste à unir les images binaires résultantes pour mettre en évidence, sur l'image initiale, tous les noyaux identifiés.

A l'étape 9, le procédé calcule pour chaque noyau détecté, un certain nombre de paramètres. Ces paramètres décrivent la position et forme du noyau et correspondent à une description du niveau de gris de la zone correspondante au noyau sur l'image réelle et la hauteur par rapport au sol de la zone correspondante au noyau sur la carte de hauteurs. Cet ensemble de paramètres est appelé vecteur d'attributs. De ce fait, à l'étape 9 le procédé calcule pour chaque noyau un vecteur d'attributs qui permet d'identifier chaque noyau. On va maintenant décrire plus en détail l'étape 9. Cette étape permet notamment d'identifier les personnes de petites tailles, par exemple les enfants.

Comme décrit précédemment, le procédé associe à chaque noyau détecté un vecteur appelé vecteur d'attributs. Ce vecteur représente un ensemble de propriétés qui distinguent chaque noyau des autres noyaux présents dans la même scène, c'est-à-dire dans la même image. Dans l'exemple, les noyaux sont les têtes des personnes et les attributs sont des propriétés qui varient d'une tête à une autre. Des attributs permettant de réaliser le traitement des noyaux sont par exemple : - la valeur moyenne des niveaux de gris des points du noyau, calculée à partir des images réelles, la hauteur moyenne des points correspondant aux pixels constituant le noyau, calculée à partir de la carte des hauteurs, le nombre de pixels formant le noyau, calculé à partir de la carte de hauteurs segmentée (ce qui correspond à la taille du noyau), et la largeur et la longueur du noyau, ainsi que les coordonnées du centre de gravité du noyau, calculées à partir de la carte des hauteurs segmentée.

Il faut noter que plus le nombre d'attributs discriminants entre noyaux est important et plus la procédure de suivi sera fiable. Ainsi, en variante, les vecteurs d'attributs peuvent comprendre sept composantes, à savoir : la taille du noyau en pixels, la largeur du noyau en pixels, la longueur du noyau en pixels, la hauteur moyenne du noyau en centimètres, - le niveau de gris moyen du noyau, et les coordonnées horizontales du noyau.

A l'étape 10, le procédé exploite les vecteurs d'attributs pour reconstituer les trajectoires de toutes les têtes détectées. La procédure consiste à exploiter les mesures correspondant aux vecteurs d'attributs à l'instant t et effectuer une prédiction sur la variation de ces derniers et comparer les résultats de la prédiction avec les mesures correspondant aux vecteurs d'attributs à l'instant t+1. La procédure de suivi consiste ensuite à mesurer d'une façon combinatoire une probabilité de correspondance ce qui permet d'associer les noyaux de l'instant t à ceux de l'instant t+1 et ainsi reconstituer leurs trajectoires. Toutes les données de suivi sont sauvegardées et sont utilisées à la fin de la séquence par la procédure de comptage.

A l'issue de l'étape 10, le procédé teste la fin de la séquence. Si la séquence n'est pas finie, le procédé revient à l'étape 1 pour acquérir un nouveau couple d'images stéréoscopiques et effectuer une nouvelle boucle de traitement, sinon le procédé passe à l'étape 11.

A l'étape 11, le procédé analyse les trajectoires, c'est-à-dire que le procédé teste la validité de la trajectoire de chaque noyau représentant une personne dont la présence a été détectée. L'étape 11 est répétée pour chaque trajectoire. Si le procédé considère que la trajectoire est valide, il passe à l'étape 12, sinon il reboucle à l'étape 11 pour analyser une nouvelle trajectoire.

Pour réaliser le suivi d'une trajectoire, le procédé associe à chaque objet segmenté un vecteur appelé vecteur attributs. Ce vecteur est un ensemble de propriétés qui distinguent chaque objet des autres dans la même scène. Dans notre cas, les objets qui nous intéressent sont les noyaux, c'est-à-dire les têtes de personnes, et les attributs sont des propriétés qui varient d'un noyau à l'autre, par exemple taille du noyau, largeur du noyau, longueur du noyau, hauteur moyenne en centimètres de la région correspondant au noyau sur la carte des hauteurs, niveau de gris moyen de la région correspondant au noyau sur l'image réelle et coordonnées horizontales (x ,y) du centre de gravité du noyau. D'autres attributs peuvent être introduits dans la phase de suivi.

Le suivi peut être réalisé en utilisant un filtre de Kalman. Cela consiste à effectuer une prédiction sur les positions des noyaux et à comparer les positions prédites avec les positions de la mesure courante.

La figure 4a représente une zone de comptage 20 rectangulaire.

La zone de comptage 20 correspond à une zone située sous le capteur 4.

La zone de comptage 20 comporte une ligne supérieure 20a et une ligne inférieure 20b.

Une première trajectoire valide, symbolisée par la flèche 21, correspond à une entrée avec une apparition au voisinage de la ligne supérieure 20a et une disparition dans la zone de comptage 20, ce qui signifie que la personne rentre et reste dans la zone de comptage 20. Une telle personne est prise en compte.

Une deuxième trajectoire valide, symbolisée par la flèche 22, correspond à une entrée avec une apparition au voisinage de la ligne supérieure 20a et une disparition au voisinage de la ligne inférieure 20b, ce qui signifie que la personne rentre et traverse la zone de comptage 20. Une telle personne est également prise en compte.

Une troisième trajectoire valide, symbolisée par la flèche 23, correspond à une sortie avec une apparition au voisinage de la ligne inférieure 20b et une disparition au voisinage de la ligne supérieure 20a, ce qui signifie que la personne traverse la zone de comptage 20 lors de sa sortie. Une telle personne est également prise en compte. Un quatrième type de trajectoire valide, symbolisé par les flèches 24a et 24b, correspond à une sortie avec une apparition dans la zone de comptage 20 et une disparition au voisinage de la ligne supérieure 20a, ce qui signifie que la personne se trouve dans la zone de comptage 20 avant sa sortie. Une telle personne est également prise en compte.

La figure 4b, qui représente également la zone de comptage 20, montre des exemples de trajectoires non valides.

Une première trajectoire non valide, symbolisée par la flèche 25, correspond à une apparition au voisinage de la ligne supérieure 20a et une disparition au voisinage de la même ligne 20a, ce qui signifie que la personne est entrée puis immédiatement ressortie.

Une deuxième trajectoire non valide, symbolisée par la flèche 26, correspond à une apparition au voisinage de la ligne inférieure 20b et une disparition au voisinage de la même ligne 20b, ce qui correspond à une intention de sortie avortée.

Une troisième trajectoire non valide, symbolisée par la flèche 27, correspond à une apparition et une disparition dans la zone de comptage 20, ce qui correspond à une errance sous le capteur 4 sans intentions précises.

Une quatrième trajectoire non valide, symbolisée par la flèche 28, correspond à une apparition au voisinage de la ligne inférieure 20b et une disparition dans la zone de comptage 20.

Lorsque, à l'étape 11, le procédé considère que la trajectoire testée ne doit pas entraîner le comptage d'une personne, le procédé se termine pour la trajectoire considérée.

A l'étape 12, le procédé considère que la trajectoire testée à Pétapell doit entraîner le comptage d'une personne. Dans ce cas, le procédé incrémente d'une unité le compteur d'entrées ou le compteur de sorties, selon le sens de la trajectoire.

A l'issue de I'étapel2, le procédé effectue un test (étape 13) pour vérifier si toutes les trajectoires ont été analysées. Si le test n'est pas vérifié le procédé revient à l'étape 11, sinon le procédé s'arrête.

Le système de comptage a été évalué sur des données réelles et les résultats obtenus présentent un taux d'erreur maximum de l'ordre de 1%. Le système permet notamment de réaliser un comptage de passagers par classe de taille. En effet, la segmentation de la carte de hauteurs étant réalisée par classe de hauteurs, il est possible de disposer du comptage en fonction de cette classe de hauteurs. Ainsi, il est possible de discriminer les flux d'adultes et d'enfants par exemple.

Le système permet également de prendre en compte des cas de descentes temporaires.

Dans le cas des autobus par exemple, les données correspondant à chaque personne descendant sont gardées en mémoire tampon un certain temps, c'est-à-dire que les attributs du noyau correspondant à la tête de cette personne sont mémorisés temporairement, pour vérifier si la descente de la personne n'est pas temporaire. Cette information est très importante pour les exploitants d'autobus qui veulent connaitre le nombre exact de descentes et de montées par arrêt. L'exploitation de la vision stéréoscopique et la mise en évidence des têtes des passagers en utilisant un procédé qui ne dépend pas de l'information couleur (niveaux de gris) permettent de baisser la résolution des images à traiter sans dégrader de manière significative la précision de comptage. Cet avantage a été démontré par différentes évaluations du système de comptage. Ainsi, le manque d'information due à la baisse de résolution est compensé par l'information de hauteur et la segmentation de la scène en fonction de paramètres géométriques. D'autre part, la hauteur par rapport au sol est insensible à la variation de la résolution. Par exemple, une personne qui mesure lm80 correspondra à un noyau d'une hauteur de lm80 quelque soit la résolution des images. De ce fait, le procédé de comptage permet d'obtenir une bonne précision de comptage malgré les contraintes de variabilité de l'éclairage, de baisse de résolution, de juxtaposition et de nature déformable des objets observés. Bien que l'invention ait été décrite en relation avec plusieurs modes de réalisation particuliers, il est bien évident qu'elle n'y est nullement limitée et qu'elle comprend tous les équivalents techniques des moyens décrits ainsi que leurs combinaisons si celles-ci entrent dans le cadre de l'invention.