[0001] Die Erfindung betrifft ein Verfahren zur Verarbeitung und Speicherung von biometrischen
Daten.
[0002] Das Fachgebiet der Biometrie beschäftigt sich mit der Anwendung mathematischer Methoden
zur zahlenmäßigen Erfassung, Planung und Auswertung von Experimenten in Biologie,
Medizin und Landwirtschaft. Hierbei ist insbesondere die Untersuchung des menschlichen
Körpers von Interesse.
[0003] Ein praktisches Anwendungsbeispiel stellt die Erfassung und mathematische Beschreibung
von Fingerabdrücken zu deren Erkennung, basierend auf der mathematischen Beschreibung
des Verlaufs der papillaren Linien und ihrer Minutien, dar. Die Muster der papillaren
Linien sind von besonderem Interesse, da sie eine eindeutige Identifizierung der betreffenden
Person gestatten.
[0004] So ist es beispielsweise möglich, Kunden einer Bank, beim Bedienen eines Geldautomaten
nicht mehr mittels Zahlenkombinationen sondern anhand ihrer Fingerabdrücke zu identifizieren.
Hierzu müssen jedoch Daten, die Informationen zu den Fingerabdrücken wiedergeben,
beispielsweise auf einer Kreditkarte bzw. Bankkarte gespeichert sein. Diese Daten
müssen auf der Karte so abgelegt werden, daß ein unerlaubter Zugriff nicht möglich
ist. Um einen unerlaubten Zugriff auf die Daten zu vermeiden, können die Daten verschlüsselt
abgespeichert werden.
[0005] Bei bisherigen biometrischen Verfahren werden die biometrischen Daten aufgenommen
und in Form sogenannter Meßmengen gespeichert. Die Meßmengen werden jeweils durch
eine Menge von Meßparametern oder aber auch durch eine bijektiv numerische Beschreibung
der Meßmenge dargestellt. Bei der bijektiv numerischen Beschreibung wird somit eine
numerische Methode gewählt, um die Parameter der Meßmenge geeignet zu beschreiben.
Beim Einsatz biometrischer Verfahren werden zur Erreichung eines Zugriffschutzes Meßmengen
zunächst als Referenzmengen gespeichert. Dann werden neu erstellte Meßmengen mittels
eines Maßes mit den Referenzmengen verglichen, und es wird so festgestellt, ob es
sich um dieselbe Biomasse handelt, von der beide Meßmengen erstellt wurden. Dabei
kann auch berücksichtigt werden, mit welcher Wahrscheinlichkeit es sich um dieselbe
Biomasse handelt.
[0006] Werden solche Meßmengen beispielsweise zum Anlegen von Datenbanken oder zur sonstigen
Speicherung vorgesehen, so werden Darstellungen der Meßmengen gespeichert. Handelt
es sich um eine besonders geschützte Speicherung, so wird oft eine zweiwegverschlüsselte
Abbildung der Meßmenge gespeichert, es können aber auch beispielsweise komprimierte
Parametersätze gespeichert werden, um Speicherplatz zu sparen.
[0007] Nachteilig bei dem bekannten Verfahren ist, daß die Zweiwegverschlüsselung keine
ausreichende Sicherheit bietet.
[0008] Demgegenüber werden bei dem erfindungsgemäßen Verfahren zur Verarbeitung und Speicherung
von biometrischen Daten die erfaßten Daten in Form einer Meßmenge dargestellt, die
Meßmenge einem geeigneten Numerierungssystem zugeteilt, der Meßmenge mindestens ein
Wert aus einer abzählbaren Menge von Werten zugewiesen und dieser mindestens eine
Wert verschlüsselt auf einem geeigneten Datenträger gespeichert.
[0009] Vorteilhafte Ausgestaltungen der Erfindung ergeben sich aus den Unteransprüchen.
[0010] Das erfindungsgemäße Verfahren zeichnet sich dadurch aus, daß nach der Erstellung
einer Darstellung der Meßmenge oder in späteren Arbeitsgängen die Erstellung von Numerierungen
der gemessenen Biomasse durch Zuteilung der Meßmenge in geeignete Numerierungssysteme
erfolgt. Somit wird aus einer Darstellung einer Meßmenge errechnet, welche Nummern
die durch die Meßmenge repräsentierte Biomasse in geeigneten Numerierungssystemen
hat. Dies erfolgt anstelle oder zusätzlich zum weiteren Verfahren einer Darstellung
der Meßmenge, egal ob diese ein Parametersatz, eine bijektiv numerische Beschreibung
oder etwas Äquivalentes ist.
[0011] Der Erfindung liegt die Erkenntnis zugrunde, daß ein Raum von möglichen Meßmengen
bei biometrischen Verfahren nicht dicht besetzt oder auch nur gleichmäßig besetzt
ist. Mögliche Meßmengen bilden Häufchen um die exakte Abbildung von Biomasse im Raum
herum, bedingt durch Meß- und Abbildungsfehler, sowie durch Meßungenauigkeiten.
[0012] Numerierung bedeutet, daß Äquivalenzklassen gebildet werden, die es erlauben, Biomasse
abzuzählen, indem diese Äquivivalenzklassen so gebildet werden, daß eine eindeutige
Zuordnung von Biomassen zu einer oder mehreren Äquvivalenzklassen erreicht wird, die
so gewählt sind, daß sie es zulassen, die Biomasse abzuzählen. Hierfür sind verschiedene
mathematische Ansätze denkbar.
[0013] Die Schritte des Verfahrens, nämlich die Speicherung, Verschlüsselung, Entschlüsselung
und Erkennung der biometrischen Daten können vorzugsweise von einem Computerprogramm
ausgeführt werden. Dieses weist Programmcodemittel auf, um alle Schritte des vorstehend
beschriebenen Verfahrens durchzuführen. Das Computerprogramm wird auf einen Computer
oder einer entsprechenden Recheneinheit zur Ausführung gebracht. Diese Recheneinheit
ist beispielsweise in einen Bankautomat mit Geldkartenleser enthalten.
[0014] Ein erfindungsgemäßes Computerprogrammprodukt weist Programmcodemittel auf, die auf
einem computerlesbaren Datenträger gespeichert sind, um das vorstehend beschriebene
Verfahren durchzuführen. Die Programmcodemittel sind auf einem computerlesbaren Datenträger
gespeichert. Als geeignete Datenträger können EEPROMS und Flashmemories, aber auch
CD-Roms, Disketten oder Festplattenlaufwerke verwendet werden.
[0015] Die erfaßten biometrischen Daten, unter anderem die Meßmengen, können auf einem Aufzeichnungsträger
bzw. Datenträger aufgezeichnet sein. Dieser ist beispielsweise in einer Geldkarte
enthalten. Der Aufzeichnungsträger kann die Meßmengen, die Daten die sich durch Zuteilung
der Meßmengen in geeignete Numerierungssysteme ergeben und/oder diese Daten in verschlüsselter
Form enthalten.
[0016] Der erfindungsgemäße Aufzeichnungsträger dient zur Verwendung in dem vorstehend beschriebenen
Verfahren. Auf dem Datenträger ist ein Datensatz aufgezeichnet, der mindestens einen
verschlüsselten Wert wiedergibt, wobei der mindestens eine Wert die Numerierung einer
biometrische Daten darstellenden Meßmenge wiedergibt. Die Zuordnung von Meßmenge zu
dem Wert erfolgt über eine Äquivalenzklasse.
[0017] Das erfindungsgemäße Verfahren zum Verwenden biometrischer Daten zur Identifizierung
von Personen sieht vor, daß biometrische Daten einer zu identifizierenden Person erfaßt
werden, diese Daten in Form einer Meßmenge dargestellt werden, die Meßmange einem
geeigneten Numerierungssystem zugeteilt wird, so daß der Meßmenge mindestens ein Wert
aus einer abzählbaren Menge von Werten zugewiesen werden kann und dieser mindestens
eine Wert verschlüsselt wird. Dieser verschlüsselte Wert wird mit einem (auf einem
Aufzeichnungsträger) gespeicherten ebenfalls verschlüsselten Wert verglichen, um die
Person zu identifizieren.
[0018] Bei der Anwendung werden die auf dem Aufzeichnungsträger enthaltenen Daten mit den
Daten verglichen, die vom Nutzer zur Identifizierung, beispielsweise durch Scannen
eines Fingerabdrucks, eingelesen worden sind.
[0019] Zur Verdeutlichung wird nachfolgend ein Beispiel näher erläutert. Dieses Beispiel
verdeutlicht die Bildung von Numerierungen mittels dreier Äquvivalenzklassen, gebildet
durch n-Voxelraster.
[0020] Es wird davon ausgegangen, daß Parametersätze P
i = {p
i,1, p
i,2, p
i,3, ...} gemessen werden. Diese Parametersätze stellen Meßmengen dar. Es genügt diese
Betrachtung, da bei bijektiv numerischer Darstellung der Meßmengen leicht aus den
Darstellungen geeignete Parametersätze abgebildet werden können. Weiterhin ist ein
geeignetes Maß M definiert, das die Dreiecksungleichung erfüllt und zum Vergleich
von Parametersätzen geeignet ist.
[0021] Passend zu diesem Maß werden Dimensionen für den Raum der Meßmengen insofern definiert,
daß für alle Dimensionen d gilt, wenn P
i, P
k und P
l in allen Dimensionen bis auf eine d gleich sind und P
i von P
k dasselbe Maß wie P
k von P
l hat, und P
i, P
k und P
l verschieden sind, daß dann P
i von P
l das doppelte Maß wie von P
k hat. Es geht selbstverständlich auch andersherum. Es werden Dimensionen und ein geeignetes
Maß definiert, wobei aber oft in einer Anwendung bereits ein Maß vorliegt.
[0022] Es werden so viele Dimensionen definiert wie nötig sind, um den Meßraum vollständig
aufzuspannen. Des weiteren werden so wenig Dimensionen wie möglich definiert, damit
keine lineare Abhängigkeiten der Dimensionen bestehen.
[0023] Die Forderung nach der Senkrechten zwischen den Dimensionen kann, muß aber nicht
gegeben sein. Der Begriff n-Voxel bezeichnet somit im folgenden nicht unbedingt n-Kuben.
Da wir nicht unbedingt euklidische Räume betrachten, sind die n-Voxel nicht unbedingt
geometrisch zu sehen, in jedem Falle aber isomorph und mit jeweils nach dem verwendeten
Maß gleich großen Kanten.
[0024] Anschließend werden geeignete Referenzklassen gebildet, indem eine Maßzahl m
0 so gewählt wird, daß diese größer als der vierfache maximale Streufaktor der Häufchen
und also größer als die vierfache Maßzahl m ist, die als maximales Maß zur Ähnlichkeit
im Sinne der Betrachtung der Meßmengen ist. Eine solche Maßzahl m gibt es in jedem
biometrischen Verfahren, oft auch implizit, da in vielen Fällen das Maß implizit in
der algorithmischen Lösung des Vergleichens von Darstellungen von Meßmengen implementiert
vorliegt. Die Maßzahl m
0 wird vorzugsweise möglichst klein gewählt, also möglichst nahe an 4m
0.
[0025] Zu beachten ist, daß jeder Meßraum endlich ist. Es gibt somit in allen Dimensionen
Gültigkeitsintervalle, da jede Messung einen gültigen Meßbereich in jedem Meßparameter
hat.
[0026] Daraufhin wird der Meßraum in ein n-Voxelraster R
1 aufgeteilt, wobei die Voxel eine Kantenlänge von m
0 haben. Die n-Voxel bilden die Äquvivalenzklassen von Punkten im Meßraum. Das Problem
"überhängender" n-Voxel wird einfach ignoriert, womit der Meßraum entsprechend vergrößert
wird. Eines der n-Voxel hat den Ursprung als Eckpunkt.
[0027] Weiterhin wird der Meßraum in ein weiteres n-Voxelraster R
2 aufgeteilt. Diese n-Voxel haben ebenfalls eine Kantenlänge von m
0. Der Ursprung bildet hier jedoch den Mittelpunkt eines n-Voxels. Auch hier wird das
Problem der Überhänge der n-Voxel am Rand ignoriert.
[0028] Beim Betrachten von R
1 und R
2 ist festzustellen, daß im zweidimensionalen noch Schnittpunkte zwischen den n-Voxelkanten
beider Räume existieren. Dies ist bei drei Dimensionen nicht mehr der Fall. Der Beweis
hierfür ist bekannt und vielfach geführt in der Literatur nachzulesen.
[0029] Falls - da zweidimensional - nötig, wird der Raum zum dritten in ein solches n-Voxelraster
R
3 aufgeteilt, so daß dieses die Schnittpunkte der n-Voxel aus R
1 und R
2 als Mittelpunkte seiner n-Voxel besitzt. Dieses Raster hat dann die doppelte n-Voxeldichte
von R
1 und R
2, mit anderen Worten, die n-Voxel von R
3 haben als Kantenlänge 1/2 m
0. Auch in diesem Fall funktioniert das erfindungsgemäße Verfahren.
[0030] Die n-Voxel der Raster R
1, R
2 und gegebenenfalls R
3 können nun leicht numeriert werden. Es wird lediglich nach einer beliebigen Systematik
duchgezählt.
[0031] Jeder Parametersatz wird nun durch zwei bzw. drei Nummern von n-Voxeln repräsentiert.
Es ist äußerst unwahrscheinlich, daß zwei Parametersätze gemessen werden, die von
verschiedenen Biomassen stammen und trotzdem in einem der Raster dasselbe n-Voxel
besetzen. Dies ist aufgrund der Tatsache, daß es äußerst unwahrscheinlich ist, daß
zwei Biomassen sehr ähnlich sind. Auf dieser Annahme basieren auch alle anderen biometrischen
Verfahren, die bspw. in der Identifikationstechnik eingesetzt werden. Umgekehrt ist
es aber unmöglich, daß zwei Parametersätze derselben Biomasse gültig gemessen werden,
ohne daß nicht wenigstens in einem Raster die beiden Parametersätze ein und dasselbe
n-Voxel besetzen.
[0032] Es handelt sich bei dieser Implementierung also um eine zweifache bzw. dreifache
Numerierung.
[0033] Bei dem erfindungsgemäßen Verfahren genügt somit die Speicherung von Mustern, die
die Numerierungen nicht bijektiv abbilden.
[0034] Es können somit beim Einsatz bei Identifikationsverfahren im Gegensatz zur Verarbeitung
von Parametersätzen oder von bijektiv numerischen Darstellungen von Referenzmeßmengen
Numerierungen einwegverschlüsselt gespeichert werden. Es ist nicht mehr nötig, die
verschlüsselten Nummern zu entschlüssen. Es genügt, die Numerierung der neuen Meßmenge
zu ermitteln und einwegzuverschlüsseln und dann die verschlüsselten Werte zu vergleichen.
Als Verschlüsselungsalgorithmen können hermkömmliche Standardalgorithmen dienen, wie
beispielsweise MD5. Somit können ohne große Sicherheitsbedenken hinreichend lange
Hashes von Numerierungen auf elektronischen, magnetischen oder sonst üblichen Datenträgern,
wie beispielsweise Magnet- oder Chipkarten, scheibenförmige Datenträger oder ähnliche,
gespeichert werden. Bei geeignet gewählter Numerierung und hinreichend großer Numerierungsbreite
ist der einzig bekannte Angriff auf diese Schlüssel, um zurück zu der Ursprungsnumerierung
zu kommen, das Brute-Force-Attack-Verfahren bzw. durch langwieriges Ausprobieren,
was nicht praktikabel ist.
[0035] Das erfindungsgemäße Verfahren verbessert demnach sämtliche Anwendungen der Biometrie
unter sicherheitstechnischen Gesichtspunkten. Mit diesem Verfahren werden biometrische
Anwendungen genau so sicher wie Verfahren, bei denen geeignet gewählte lange Kennwörter
oder Paßphrases zur Anwendung kommen. Somit ist einer der Hauptkritikpunkte an der
Sicherheit von biometrischen Verfahren zur Identifikation ausgeräumt.
[0036] Mit dem erfindungsgemäßen Verfahren ist es durchaus denkbar, auf sichere Art und
Weise Nummern von Fingerabdrücken MD5 gehasht auf einer Geldautomat- oder Kreditkarte
zu speichern und per Biometrie am POS-Gerät zu prüfen, ob der Fingerabdruck zeigt,
daß die bedienende Person autorisiert für die Verwendung der Karte ist. Diese Speicherung
kompromittiert nicht mehr die Sicherheit des Verfahrens, da endlich die Hauptforderung
in der Kryptographie, nämlich dokumentierte und offengelegte Verfahren zu verwenden
und trotzdem sicher zu sein, auch bei biometrischen Verfahren problemlos erfüllt sein
kann.
[0037] Zudem spart die Speicherung von Nummern im Gegensatz zur Speicherung von Parametersätzen
im erheblichen Maße Speicherplatz. Bei der Speicherung von Parametersätzen ist oftmals
mehr als 125 Byte Speicherplatz pro Parametersatz notwendig. Bei dem erfindungsgemäßen
Verfahren reicht beispielsweise bei der gezeigten zweifachen Numerierung bei 64 Bit-Nummern
bereits der Speicherplatz von 16 Byte aus. Nutzt man die Eigenschaft, daß es ausreichend
ist, Muster nicht bijektiver Abbildungen zu speichern, sind sogar wesentliche kleinere
Speichermengen denkbar. Bei der Verwendung von 64 Bit-Darstellungen der Nummern und
bei der Berücksichtigung der Tatsache, daß es sehr unwahrscheinlich ist, in der Anwendungen
zwei Darstellungen zu finden, die in ihrem XOR-Muster bei je 32 Bit, also insgesamt
in 32 Bit, gleich sind. So genügen beispielsweise 4 Byte zur Speicherung und Vergleichsmöglichkeit.
Das übertrifft in der minimalen Speicherplatzmenge auch jede bijektiv numerische Darstellungsmethode
einer Meßmenge bei mindestens gleicher Vergleichswahrscheinlichkeit.
[0038] Die beigefügte Zeichnung zeigt ein dreifaches Gitterraster. Zu erkennen ist die Überlagerung
dreier Raster 10, 12, 14, verdeutlicht durch die Verwendung unterschiedlich unterbrochener
Linien. Mittels der Raster 10, 12, 14 wird eine Fläche in unterschiedliche Bereiche
unterteilt.
[0039] Mit Hilfe der Raster 10, 12, 14 wird ein Parameterraum, in dem sich mögliche Werte
befinden, aufgespannt. Jedes Raster 10, 12, 14 definiert eine abzählbare Menge von
Feldern, so daß jedem Feld in jedem Raster 10, 12, 14 ein Wert zugewiesen werden kann.
Abzählen bedeutet somit in diesem Fall, eine Beziehung zwischen Position im Parameterraum
und einer natürlichen Zahl herzustellen, die dann einwegverschlüsselt werden kann.
Einer Meßmenge können nunmehr drei Werte, nämlich jeweils einer in jedem Raster 10,
12, 14 zugewiesen werden. Diese drei Werte werden verschlüsselt und dienen zur Identifizierung
der Person, deren biometrische Daten Grundlage der ermittelten Meßmenge war.
1. Verfahren zur Verarbeitung und Speicherung von biometrischen Daten, bei denen die
erfaßten Daten in Form einer Meßmenge dargestellt werden, die Meßmenge einem geeigneten
Numerierungssystem zugeteilt wird, der Meßmenge mindestens ein Wert aus einer abzählbaren
Menge von Werten zugewiesen wird und dieser mindestens eine Wert verschlüsselt auf
einem geeigneten Datenträger gespeichert wird.
2. Verfahren nach Anspruch 1, bei dem der mindestens eine Wert einwegverschlüsselt wird.
3. Verfahren nach Anspruch 1 oder 2, bei dem eine Numerierung der Meßmenge mittels mindestens
einer Äquivalenzklasse gebildet wird.
4. Computerprogramm mit Programmcodemitteln, um alle Schritte eines Verfahrens nach einem
der Ansprüche 1 bis 3 durchzuführen, wenn das Computerprogramm auf einem Computer
oder einer entsprechenden Recheneinheit ausgeführt wird.
5. Computerprogrammprodukt mit Programmcodemitteln, die auf einem computerlesbaren Datenträger
gespeichert sind, um ein Verfahren nach einem der Ansprüche 1 bis 3 durchzuführen,
wenn das Computerprogramm auf einem Computer oder einer entsprechenden Recheneinheit
ausgeführt wird.
6. Aufzeichnungsträger zur Verwendung in einem Verfahren nach einem der Ansprüche 1 bis
3, auf dem ein Datensatz aufgezeichnet ist, der mindestens einen verschlüsselten Wert
wiedergibt, wobei der mindestens eine Wert die Numerierung einer biometrische Daten
darstellenden Meßmenge wiedergibt.
7. Verfahren zum Verwenden biometrischer Daten zur Identifizierung, bei denen biometrische
Daten einer Person erfaßt werden, die erfaßten Daten in Form einer Meßmenge dargestellt
werden, die Meßmenge einem geeigneten Numerierungssystem zugeteilt wird, so daß der
Meßmenge mindestens ein Wert aus einer abzählbaren Menge von Werten zugewiesen wird,
dieser mindestens eine Wert verschlüsselt wird und mit mindestens einem auf einem
Aufzeichnungsträger gespeicherten verschlüsselten Wert verglichen wird.
8. Verfahren nach Anspruch 7, bei dem die biometrischen Daten durch Abscannen erfaßt
werden.
9. Computerprogramm mit Programmcodemitteln, um alle Schritte eines Verfahrens nach Anspruch
7 oder 8 durchzuführen, wenn das Computerprogramm auf einem Computer oder einer entsprechenden
Recheneinheit ausgeführt wird.
10. Computerprogrammprodukt mit Programmcodemitteln, die auf einem computerlesbaren Datenträger
gespeichert sind, um ein Verfahren nach Anspruch 7 oder 8 durchzuführen, wenn das
Computerprogramm auf einem Computer oder einer entsprechenden Recheneinheit ausgeführt
wird.