Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR ASSISTING IN MAKING A DECISION ON BIOMETRIC DATA
Document Type and Number:
WIPO Patent Application WO/2007/054458
Kind Code:
A1
Abstract:
The invention relates to a method for assisting a user in making decision for comparing an individual biometric data items with a database related to a large number of individuals consisting in acquiring the biometric data items of a considered individual, in encoding said data items, in pairwisely comparing the data items with corresponding data items of the database, in setting, for each comparison score (S1 to Sn), a duplicate occurrence frequency/non-duplicate occurrence frequency ratio, in calculating (1) the product of all available ratios, in standardising said product (2), in comparing the standardised ratio (4) with a predetermined threshold and in displaying said result to the user for validating it, if necessary.

Inventors:
BEAUDET JEAN (FR)
Application Number:
PCT/EP2006/068028
Publication Date:
May 18, 2007
Filing Date:
November 02, 2006
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
THALES SA (FR)
BEAUDET JEAN (FR)
International Classes:
G06K9/68
Foreign References:
US5661666A1997-08-26
US20030031348A12003-02-13
US5661666A1997-08-26
US20030031348A12003-02-13
Other References:
PRABHAKAR S ET AL: "Decision-level fusion in fingerprint verification", PATTERN RECOGNITION, ELSEVIER, KIDLINGTON, GB, vol. 35, no. 4, April 2002 (2002-04-01), pages 861 - 874, XP004329459, ISSN: 0031-3203
PRABHAKAR ET AL.: "Pattern recognition", vol. 35, April 2002, ELSEVIER, article "Decision- level fusion fingerprint verification", pages: 861 - 874
Attorney, Agent or Firm:
CHAVERNEFF, Vladimir et al. (Conseils en Propriété Industrielle 31-3, avenue Aristide Briand ARCUEIL Cedex, FR)
Download PDF:
Claims:
REVENDICATIONS

1 . Procédé d ' aide à la prise de décision par un utilisateur pour la comparaison de données biométriques d ' un individu avec celles d'une base de données relative à un grand nombre d ' individus, caractérisé en ce que l'on effectue une acquisition de données biométriques d'un individu considéré, que l'on encode ces données, qu ' on les compare deux à deux avec des données correspondantes de la base de données, que l'on établit pour chaque score (Sl à Sn) de comparaison le rapport fréquence d'apparition d'un doublon/fréquence d'apparition d'un non-doublon, que l'on calcule (1 ) le produit de tous les rapports disponibles, que l'on normalise ce produit (2), que l'on compare à un seuil préfixé le rapport normalisé (4), que l'on garde les valeurs supérieures au seuil préfixé (5) et que l'on soumet à l'utilisateur ce résultat pour qu ' il le valide le cas échéant.

2. Procédé selon la revendication 1 , caractérisé en ce que l'on effectue en cascade, après seuillage, au moins une autre sélection semblable à la première, avec un autre ensemble de scores obtenus dans d'autres conditions d'obtention de scores.

3. Procédé selon la revendication 1 ou 2, caractérisé en ce que l'on calcule le produit des rapports disponibles en additionnant leurs logarithmes.

4. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'on détermine le seuil par expérimentation sur des échantillons de la base de données.

5. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'on utilise pour n données biométriques à comparer un ensemble de 2 λ n transcodeurs (2) pour normaliser le produit des rapports disponibles, ces transcodeurs étant du type LUT.

6. Procédé selon la revendication 5, caractérisé en ce que chacune des 2 λ n LUT est associée à un et un seul des 2 λ n sous-ensembles (I) possibles des indices (i) des scores connus.

7. Procédé selon la revendication 5 ou 6. caractérisé en ce que Ton initialise les 2 λ n LUT en réalisant des mesures pour seulement un nombre restreint d'entre elles, à savoir celles pour lesquelles le sous- ensemble (I) des indices (i) des scores connus est de cardinal 2 ou moins, les autres étant calculées.

8. Dispositif pour la mise en œuvre du procédé selon l'une des revendications 1 à 7, caractérisé en ce qu ' il comporte, à chaque sortie de valeur de score (Sl à Sn) d ' un dispositif de comparaison de données biométriques un dispositif convertisseur de valeur de score en rapports « fréquence d'apparition d'un doublon/fréquence d ' apparition d'un non-doublon » (LUTl à LUTn), les sorties de tous les dispositifs convertisseurs étant reliées à un dispositif multiplieur

(1 ) suivi d'un ensemble de 2 λ n transcodeurs de valeurs de produits en scores (2), d'un dispositif de seuillage (4) à deux sorties, « doublon » (5) et non-doublon » (6).

9. Dispositif selon la revendication 8, caractérisé en ce que les dispositifs convertisseurs fournissent des valeurs logarithmiques, que le dispositif multiplieur est constitué d'un additionneur et qu'un dispositif de conversion logarithmique-linéaire (3) est disposé entre l'ensemble de transcodeurs et le dispositif de seuillage.

Description:

PROCEDE D'AIDE A LA PRISE DE DECISION POUR LA COMPARAISON

DE DONNEES BIOMETRIQUES

La présente invention se rapporte à un procédé d'aide à la prise de décision pour la comparaison de données biométriques.

Pour comparer les données biométriques relatives à deux individus et déterminer s'il s ' agit de la même personne (on parle alors d'un doublon) ou de personnes différentes (non-doublons), on peut disposer de plusieurs données numériques. Celles-ci correspondent par exemple aux scores de comparaison de chacun de leurs dix doigts. La présente demande s'intéresse plus particulièrement à la fusion des scores de ces données, afin de prendre au mieux la décision doublon/non-doublon. Les mesures usuelles de performance de comparaison sont des taux d'erreur, à savoir :

-Le FAR (False Acceptance Rate), qui est un taux de classement « doublon » pour des données d'individus qui sont en réalité différents,

-Le FRR (Falsc Rejectance Rate) qui est un taux de classement « non- doublon » pour des données appartenant en réalité au même individu.

Lorsque l ' on doit traiter un grand nombre de scores de comparaison différents, par exemple ceux relatifs aux dix doigts d'un individu, en vue d'une prise de décision unique, on réalise la fusion de ces scores. Dans ce cas, l ' opérateur de fusion est efficace si, pour un FAR donné, il minimise le FRR (ou inversement, si, pour un FRR donné, il minimise le FAR).

Pour réaliser la fusion, on calcule la moyenne géométrique m des scores de comparaison de chacun des dix doigts. A l'aide d'une simple comparaison de m avec un seuil, on prend la décision « doublon » ou « non doublon ». Le seuil est déterminé expérimentalement par des mesures faites sur un échantillon de données.

Un tel procédé connu a cependant les inconvénients suivants :

-11 traite mal le cas où certaines données numériques ne sont pas disponibles (par exemple parce qu'il n'est pas possible d ' acquérir l ' image des empreintes de certains doigts).

-Il s'applique de façon peu efficace aux scores fournis par certains opérateurs de comparaison. Par exemple, dans Ic cas de deux opérateurs, il impose une branche

d'hyperbole en tant que frontière de décision, ce qui ne permet pas toujours d'obtenir une solution optimale.

-Il présuppose que les différents opérateurs de comparaison fournissent des scores homogènes, ce qui n ' est par exemple pas le cas si l ' on veut fusionner des scores d'empreintes digitales avec des scores de reconnaissance faciale.

La présente invention a pour objet un procédé d'aide à la prise de décision par un utilisateur pour la comparaison de données biométriques d'un individu avec celles d'une base de données relative à un grand nombre d'individus, en vue de la réduction du nombre de cas de la base, procédé permettant de traiter avec une qualité sensiblement constante les cas où l ' on dispose de toutes les données nécessaires, comme les cas où certaines de ces données sont manquantes, ce procédé offrant une frontière de décision qui puisse s ' adapter aux opérateurs de comparaison que l'on veut fusionner, en vue d'obtenir les meilleurs résultats possibles (par exemple une FRR la plus faible possible pour un FAR donné), ce procédé permettant également de fusionner des scores de comparaison non homogènes.

Le procédé conforme à l'invention est un procédé d'aide à la prise de décision par un utilisateur pour la comparaison de données biométriques d'un individu avec celles d'une base de données relative à un grand nombre d ' individus, et il est caractérisé en ce que l'on effectue une acquisition de données biométriques d'un individu considéré, que l'on encode ces données, qu'on les compare deux à deux avec des données correspondantes de la base de données, que l'on établit pour chaque score de comparaison le rapport fréquence d ' apparition d'un doublon/fréquence d'apparition d ' un non-doublon, que l'on calcule le produit de tous les rapports disponibles, que l ' on normalise ce produit, que l'on compare à un seuil préfixé le rapport normalisé, que l'on garde les valeurs supérieures au seuil préfixé et que l'on soumet à l'utilisateur ce résultat pour qu ' il le valide le cas échéant.

Selon une autre caractéristique de l'invention, on effectue en cascade, après seui liage, au moins une autre sélection semblable à la première, avec un autre ensemble de scores obtenus dans d ' autres conditions d'obtention de scores. Selon une autre caractéristique de l'invention, on détermine le seuil par expérimentation sur des échantillons de la base de données.

Selon une autre caractéristique de l'invention, on utilise pour n données biométriques à comparer un ensemble de 2 λ n transcodeurs pour normaliser le produit des rapports disponibles, ces transcodeurs étant du type LUT. Chacune des 2 λ n LUT est associée à un et un seul des 2 λ n sous-ensembles possibles des indices des scores connus.

Selon une autre caractéristique de 1 " invention, on initialise les 2 λ n LUT en réalisant des mesures pour seulement un nombre restreint d'entre elles, à savoir celles pour lesquelles le sous-ensemble des indices des scores connus est de cardinal 2 ou moins, les autres étant calculées. La présente invention sera mieux comprise à la lecture de la description détaillée d'un mode de réalisation, pris à titre d ' exemple non limitatif et illustré par le dessin annexé, sur lequel la figure unique est un chronogramme des principales étapes du processus de fusion du procédé de l'invention.

Pour la mise en œuvre du procédé de l ' invention, on constitue d'abord une base de données biométriques à partir de données acquises de façon classique, puis numérisées et encodées. Cette base regroupe pour chacun des individus n données biométriques. Ensuite, on effectue un grand nombre de comparaisons (par exemple quelques milliers à quelques centaines de milliers) de ces données, d'une part entre non-doublons et d'autre part entre doublons. Chaque comparaison a pour résultat une liste s de n scores : s = (si , s2, ... , sn). On appelle ND la classe des non- doublons et D la classe des doublons. On mesure les probabilités d ' observation fD(s,)=P(si/D) pour les doublons et fND(si)=P(si/ND) pour les non-doublons avec une méthode classique d ' estimation de distributions, par exemple avec un noyau gaussien. Pour réaliser la fusion des scores de ces différentes données, on décompose le problème global de la comparaison de n données biométriques différentes en 2" sous- problèmes, en fonction des scores disponibles (le fait que des données parmi les n données envisagées soient indisponibles n'est pas rédhibitoire pour la mise en œuvre du procédé de l'invention). Chacun de ces sous-problèmes est identifié par le sous- ensemble I c [l ,2,...n] des indices i pour lesquels les scores sont connus.

Pour chacun de ces sous-problèmes, on procède de la façon suivante. On définit

r,(s) = π HD(S 1 ) / IND(S 1 ) /G /

L " opérateur de classification réalise simplement un seuillage sur ce rapport η(s). On en déduit la règle de décision suivante : on classe les observations successives en D si i"i(s) >= R| et en ND dans le cas contraire. Cependant plutôt que de maintenir 2 n seuils R| (un pour chaque sous-ensemble I possible) on préfère convertir ri en une valeur qui soit utilisable indépendamment de 1. Pour chaque sous-problème on établit donc une table de correspondance η->FAR, suivant la fonction : x h-) P(rι ≥ x) . C ' est cette valeur qui est le score final sur lequel on prendra la décision D ou ND. Cette correspondance est établie de la façon suivante. En supposant qu'il y a indépendance des variables S 1 , on peut calculer la relation. On notera que les valeurs fD(s,) et fND(si) sont suffisantes pour réaliser ce calcul. Ensuite, on procède à un réajustement si l ' hypothèse d'indépendance n'est pas vérifiée statistiquement de la façon suivante : si card(I) <=2, on établit la relation par une mesure sur un grand nombre de comparaisons, sinon, pour chacun des sous-problèmes associés aux paires d'indices I'={i,jj incluses dans I, on mesure l'écart entre la relation calculée et la relation mesurée. λ partir de la relation calculée pour η->FAR d'une part, et de la moyenne de ces écarts d'autre part, on détermine la relation η->FAR. En référence à la figure unique du dessin, on va décrire le processus de fusion de données conforme à la présente invention. Pour ce faire, on suppose que l'on dispose de n empreintes digitales (n=10 dans ce cas) d'un individu et/ou autres données biométriques de cet individu. Pour chacune de ces empreintes, on effectue un « matching » (comparaison des empreintes de l'individu en question avec celles d'une base de données, par exemple un « matching de Hough » ) et on obtient à chaque fois un score de comparaison. Ce score est par exemple un entier de l ' intervalle [0,1000]. Les différents scores S, correspondants sont notés S l ,

S2 Sn en haut de la figure. Ces scores sont présentés chacun à l'entrée d'un convertisseur, respectivement LUTl , LUT2,....LUTn. Ces convertisseurs sont des tables de correspondance mémorisées dans des mémoires du type « Look-Up

Table » et fournissent chacun, pour chaque valeur de score d'entrée, le rapport r, égal à iO(s,)/fND(S|). comme précisé ci-dessus. En outre, selon une caractéristique de l ' invention, les valeurs de r, sont calculées selon une échelle logarithmique à base 10. Ainsi, un circuit 1. branché aux sorties respectives de tous les convertisseurs LUTl à LUTn, présente à sa sortie le produit P de tous les r, , c'est-à-dire P= (ri * r 2 *.... *r n ). Ce circuit 1 est constitué d ' un simple additionneur qui effectue la somme des logarithmes de tous les r,.

Le circuit 1 est suivi d'un ensemble 2 de 2" transcodeurs (pour n données biométriques aux entrées S l à Sn). Ces transcodeurs sont également du type LUT et ils sont chargés de transcoder P en valeur de score correspondant (également exprimé dans sa valeur logarithmique à base 10), c'est-à-dire en valeur de FAR. En outre, les transcodeurs de l'ensemble 2 effectuent une interpolation. Cette interpolation est une interpolation linéaire en échelle loglO. Elle est nécessaire car les valeurs en entrée (les ratios ri) n'appartiennent pas à un ensemble fini (ce sont des nombres flottants).

Les scores disponibles à la sortie de l ' ensemble 2 sous forme logarithmique sont convertis en valeurs linéaires par un circuit de conversion 3, puis envoyés à un circuit de seuillage 4. Ce circuit 4 compare le FAR ainsi calculé par les circuits qui le précèdent à un seuil qui représente le FAR réel de l ' ensemble. Ce seuil est réglé de façon que le taux d'erreur pris en compte pour les traitements ultérieurs ne dépasse pas une valeur acceptable (par exemple pour qu'un opérateur humain examinant la sortie du circuit 5, mentionné ci-dessous, n'ait pas un trop grand nombre de vérifications à effectuer). Le circuit 4 comporte deux sorties 5 et 6, respectivement « doublon » et « non-doublon ». Un signal apparaît sur la sortie 5 lorsque la valeur de FAR issue du circuit 3 est inférieure au seuil du circuit 4, et sur la sortie 6 dans le cas contraire. On remarquera que dans le cas où un signal apparaît sur la sortie 5. un opérateur humain procède à des vérifications complémentaires de type classique pour ne valider que les réponses qu'il estime être bonnes.