Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR PRODUCING SCALEABLE IMAGE MATRICES
Document Type and Number:
WIPO Patent Application WO/2008/017430
Kind Code:
A1
Abstract:
A method for producing an image matrix (1) comprises the steps of providing a network having a quantity of link starting nodes (2) and a quantity of link destination nodes (3) with intervening links (4), forming a matrix (5) having rows and columns, wherein the link starting nodes are assigned to the rows and the link destination nodes are assigned to the columns, or vice versa, and positioning visual representations (6) of the link starting nodes (2) or of the link destination nodes (3) in place of the links in the matrix, thus resulting in the image matrix (1).

Inventors:
SCHICH MAXIMILIAN (DE)
Application Number:
PCT/EP2007/006900
Publication Date:
February 14, 2008
Filing Date:
August 03, 2007
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
MAX PLANCK GESELLSCHAFT (DE)
SCHICH MAXIMILIAN (DE)
International Classes:
G06F17/30
Domestic Patent References:
WO2001040998A12001-06-07
Foreign References:
EP1241585A12002-09-18
Other References:
J. GAMEZ: "MAPPING STUDIES OF LAS VEGAS", ARCHITECTURE STUDIES LIBRARY, MAPS AND AERIAL PHOTOS RESOURCES, 7 September 2005 (2005-09-07), University of Nevada, Las Vegas Libraries, pages 1 - 3, XP002456515, Retrieved from the Internet [retrieved on 20071024]
JEWELL N J ET AL: "Hierarchically searching the web for images", IMAGE PROCESSING AND ITS APPLICATIONS, 1999. SEVENTH INTERNATIONAL CONFERENCE ON (CONF. PUBL. NO. 465) MANCHESTER, UK 13-15 JULY 1999, LONDON, UK,IEE, UK, vol. 1, 13 July 1999 (1999-07-13), pages 296 - 300, XP006501269, ISBN: 0-85296-717-9
Attorney, Agent or Firm:
HERTZ, Oliver (Akademiestrasse 7, München, DE)
Download PDF:
Claims:

Ansprüche

1. Verfahren zur Herstellung einer Bildmatrix (1), mit den Schritten:

- Bereitstellen eines Netzwerks mit einer Menge von Linkausgangsknoten (2) und einer Menge von Linkzielknoten (3) mit dazwischen liegenden Links (4), - Bilden einer Matrix (5) mit Zeilen und Spalten, wobei die Linkausgangsknoten den Zeilen zugeordnet werden und die Linkzielknoten den Spalten oder umgekehrt, und

- Platzieren von visuellen Repräsentationen (6) der Linksausgangsknoten (2) oder der Linkzielknoten (3) an Stelle der Links in der Matrix, so dass sich die Bildmatrix (1) ergibt.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass

- Linkausgangsknoten (2) klassifizierbare Gegenstände und Linkzielknoten (3) Klassifikationskriterien sind oder umge- kehrt.

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass

- Gegenstände und/oder Klassifikationskriterien Gegenstände aus einer Menge von Personen, örtlichkeiten, Zeitbereichen, physikalischen Objekten, konzeptuellen Objekten, Ereignissen und Perioden sind.

4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass - Gegenstände und/oder Klassifikationskriterien durch einzelne Knoten oder als Gruppe von Knoten repräsentiert sind.

5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass

- bei einem mehrwertigen Link von und/oder zu einem mehrteiligen Gegenstand oder einem mehrteiligen Klassifikationskri- terium eine Detail-Bildmatrix (7) platziert wird.

6. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass

- bei einem mehrwertigen Link von und/oder zu einem mehrtei- ligen Gegenstand oder einem mehrteiligen Klassifikationskriterium eine eindimensionale überblickstafel (8) platziert wird.

7. Verfahren nach einem der Ansprüche 2 bis 4, dadurch ge- kennzeichnet, dass

- bei einem mehrwertigen Link von und/oder zu einem mehrteiligen Gegenstand oder einem mehrteiligen Klassifikationskriterium eine Bildmontage (9) platziert wird.

8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass

- mehrteilige, insbesondere hierarchisch unterteilte Gegenstände oder Klassifikationskriterien in der Matrix bei einem Eingabesignal in mehrere Matrixzeilen oder Matrixspalten auf- gefaltet werden.

9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass

- mehrteilige, insbesondere hierarchisch unterteilte Gegens- tände oder Klassifikationskriterien in der Matrix bei einem

Eingabesignal in einer Matrixzeile oder Matrixspalte zusam- mengefasst werden.

10. Verfahren nach den Ansprüchen 2 bis 9, dadurch gekennzeichnet, dass

- einzelne Gegenstände und/oder Klassifikationskriterien in der Bildmatrix anhand von genauer spezifizierbaren Beziehun- gen verbunden werden können.

11. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch den Schritt:

- Ausgabe mindestens eines Teils der Bildmatrix auf einem Ausgabegerät, insbesondere auf einem Bildschirm oder einem

Drucker, oder in einer Datei.

12. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch den Schritt: - Datenbearbeitung der Daten der Bildmatrix, und

- Speicherung der bearbeiteten Daten und/oder Ausgabe einer modifizierten Bildmatrix.

13. Verfahren nach Anspruch 12, bei dem: - die Datenbearbeitung eine Dateneingabe, eine Bilderkennung, eine Korrelation und/oder eine Umordnung von Daten der Bildmatrix umfasst.

14. Verfahren nach Anspruch 13, bei dem: - die Speicherung in einer Datenmenge vorgesehen ist, aus der das Bereitstellen des Netzwerks erfolgt.

15. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass - das Verfahren auf einer elektronischen Datenverarbeitungsanlage abläuft.

16. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass

- an den Matrixelementen der Bildmatrix (1) Zusatzinformationen platziert werden.

17. Elektronische Datenverarbeitungsanlage, umfassend einen Prozessor und ein Speichermedium, wobei das Speichermedium eine Software beinhaltet, welche den Prozessor dazu veran- lasst, das Verfahren nach einem der vorhergehenden Ansprüche auszuführen.

18. Speichermedium umfassend eine Software für eine elektronische Datenverarbeitungsanlage mit einem Prozessor, wobei die Software den Prozessor dazu veranlasst, das Verfahren nach einem der vorhergehenden Ansprüche auszuführen.

Description:

Verfahren zur Herstellung skalierbarer Bildmatrizen

Gegenstand der Erfindung

Die vorliegende Erfindung betrifft ein Verfahren zur Herstellung von Bildmatrizen. Das Verfahren gehört zu den technischen Gebieten der Bildwissenschaft, der Datenverarbeitung sowie der Netzwerkwissenschaft (sog. "Science of Complex Networks" ) .

Stand der Technik

Eine Bildmatrix ist allgemein eine zweidimensionale Anordnung von Bildern in Reihen und Spalten. Die Position des Bildes (Reihe, Spalte) in der Bildmatrix repräsentiert eine Information über die Beziehung des Bildes zu den Inhalten (Bedeutungen) der zugehörigen Reihen- und Spaltenpositionen und eine Beziehung zwischen den Reihen- und Spaltenpositionen. Eine

Bildmatrix ist eine Visualisierung (Anzeige) der Bilder, die dem Betrachter bisher ermöglicht, Beziehungen zwischen Bildern bzw. zwischen Reihen- und Spaltenpositionen zu erkennen.

Bildmatrizen gibt es mindestens seit dem 1181 entstandenen , Klosterneuburger Altar λ des Nikolaus von Verdun, der das Netzwerk der typologischen Verweise in der Bibel visuali- siert. Ein modernes Beispiel ist das Architekturprojekt ,Schedule of Las Vegas Strip hoteis' (siehe http: //www. library . unlv. edu/arch/lasvegas/map/index2. html oder in dem Buch ,Learning from Las Vegas λ von Venturi, Scott-Brown und Izenour (London/Cambridge 1977)), bei dem jeweils eine Reihe der Bildmatrix einem Hotel in Las Vegas, z. B. Hotel "Paris", und jeweils eine Spalte der Bildmatrix ei-

nem Merkmal der Hotels, z. B. das Aussehen der Fassade zugeordnet ist. Die Betrachtung der Bildmatrix ermöglicht z. B. einen Vergleich der Merkmale der Hotels.

Allen bekannten Beispielen ist allerdings gemeinsam, dass die Bildmatrix erzeugt wird, indem die enthaltenen Abbildungen (Bilder) bei der Herstellung der Bildmatrizen eigens erzeugt werden. Eine zunächst leere Tabelle wird dabei mit neuen Bildern aufgefüllt. Eine herkömmliche Bildmatrix stellt ledig- lieh eine systematische Präsentation von vorab vorhandenen

Informationen dar, ohne eine weitere Auswertung der Informationen zu erlauben. Herkömmliche Bildmatrizen präsentieren in der Regel ausschließlich positive Korrelation, d.h. das Vorhandensein einer Beziehung, zwischen Merkmalen, nicht jedoch negative Korrelation, d.h. die Abwesenheit einer solchen Beziehung, zwischen Merkmalen.

Aus dem Stand der Technik ergibt sich, dass die Untersuchung größerer Mengen von klassifizierten Gegenständen in der Regel an Einzeldarstellungen (wie etwa Datenblätter eines einzelnen Gegenstandes) oder an eindimensionale Listendarstellungen (wie etwa Ergebnislisten oder eindimensionale überblickstafeln) gebunden ist.

Phänomene, in denen ein Zusammenhang besteht zwischen der

Klassifikation und den visuellen Eigenschaften der Gegenstände bzw. der Klassifikationskriterien, lassen sich daher insbesondere mit den herkömmlichen Bildmatrizen nur schwer untersuchen.

Aufgabe der Erfindung

Es ist daher Aufgabe der Erfindung, ein verbessertes Verfahren anzugeben, welches die vorstehend genannten Nachteile

ausräumt. Ferner ist es Aufgabe der Erfindung ein Speichermedium oder eine elektronische Datenverarbeitungsanlage, die einen Prozessor und ein Speichermedium umfasst, bereitzustellen, um das Verfahren auszuführen.

Diese Aufgabe wird durch ein Verfahren mit den Merkmalen von Anspruch 1 gelöst. Vorteilhafte Ausführungsformen und Anwendungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.

Zusammenfassung der Erfindung

Die Aufgabe wird durch ein Verfahren mit den im Patentanspruch 1 aufgeführten Merkmale gelöst: Dem Bereitstellen ei- nes Netzwerks mit einer Menge von Linkausgangsknoten und einer Menge von Linkzielknoten mit dazwischen liegenden Links folgt das Bilden einer Matrix mit Zeilen und Spalten, wobei Linkausgangsknoten den Zeilen zugeordnet werden und Linkzielknoten den Spalten oder umgekehrt. Schließlich wird die ge- suchte Bildmatrix erzeugt, indem visuelle Repräsentationen der Linksausgangsknoten oder der Linkzielknoten an Stelle der Links in der Matrix platziert werden.

Im Unterschied zu existierenden Bildmatrizen, die durch das Auffüllen einer leeren Tabelle mit eigens angefertigten Bildern entstehen, tritt im vorgestellten Verfahren existierende Bildinformation von Knoten eines (Klassifikations-) Netzwerks an die Stelle der Links in den Zellen der Matrix. Mit der Erfindung wird eine Bildmatrix bereitgestellt, die eine Visua- lisierung (Anzeige) von Bildern umfasst und dem Betrachter vorteilhafterweise ermöglicht, Beziehungen zwischen Bildern zu erkennen oder herzustellen, und/oder die Bilder einer Datenverarbeitung und/oder Datenpflege zu unterziehen. Der mit der Erfindung erzielte Vorteil besteht insbesondere darin,

dass die Erfindung im Umgang mit größeren Mengen von klassifizierten Gegenständen, die Untersuchung von Phänomenen erleichtert, in denen ein Zusammenhang besteht zwischen der Klassifikation und den visuellen Eigenschaften der Gegenstän- de und/oder der Klassifikationskriterien.

Das Verfahren erleichtert unter anderem die Explikation von direkten Abhängigkeiten sowie die Extraktion von diachronen Phänomenen aus einer gegebenen Menge von klassifizierten (BiId-) Daten. Des weiteren erlaubt das Verfahren im Gegensatz zu herkömmlichen Listendarstellungen und überblickstafeln die simultane Untersuchung von Daten im Kontext zweier Datendimensionen. Im Vergleich zum Stand der Technik bedeutet dies eine erhebliche Beschleunigung der Arbeit, da umständliches Navigieren in der Datenmenge entfällt.

Das Verfahren stellt vorteilhafterweise ein vollständig oder teilweise automatisierbares Werkzeug zur Bearbeitung großer Datenmengen dar. Die erfindungsgemäße Bildmatrix kann aus der Datenmenge heraus ohne Vorkenntnisse, insbesondere ohne Wissen des Nutzers über vorhandene Korrelationen zwischen Daten konstruiert werden.

Nach einer vorteilhaften Ausführungsform des Verfahrens sind Linkausgangsknoten des oben erwähnten Netzwerks klassifizierbare Gegenstände und Linkzielknoten Klassifikationskriterien oder umgekehrt.

Nach einer weiteren vorteilhaften Ausführungsform sind Ge- genstände und/oder Klassifikationskriterien dabei aus einer Menge von Personen, örtlichkeiten, Zeitbereichen, physikalischen Objekten, konzeptuellen Objekten, Ereignissen und Perioden. Ein Ereignis ist dabei die Zusammenkunft mehrerer der vorgenannten Gegenstände in einem Knoten, d.h. beispielsweise

die Zusammenkunft eines physikalischen Objekts, einer örtlichkeit und einem Zeitbereich in einem Aufenthaltsereignis. Perioden sind u.a. kontinuierliche, nicht diskrete Ausdehnungen in einer oder mehrerer der genannten Gegenstandsdimensio- nen, d.h. beispielsweise eine Stilperiode, die sowohl eine räumliche wie eine zeitliche Ausdehnung über mehrere örtlichkeiten und Zeitbereiche besitzt.

Eine vorteilhafte Ausgestaltung der angegebenen Merkmale ist gegeben, wenn Gegenstände und/oder Klassifikationskriterien durch einzelne Knoten oder als Gruppe von Knoten repräsentiert sind. Gegenstände und Klassifikationskriterien, die durch eine Gruppe von Knoten repräsentiert werden, sind mehrteilig. Zwischen mehrteiligen Gegenständen und Klassifikati- onskriterien gibt es gegebenenfalls , mehrwertige Links \ da mehr als ein Knoten des jeweiligen mehrteiligen Gegenstandes oder Klassifikationskriteriums verlinkt sein kann. Dabei sind mehrteilige Gegenstände ggf. nur indirekt, z.B. über untergeordnete Teilknoten mit einem Klassifikationskriterium ver- linkt. Da die im Wert der Matrixzelle ausdrückte Beziehung zwischen Ausgangsknoten und Zielknoten dadurch erheblich an Komplexität gewinnt, wird Sie im Folgenden zur besseren Unterscheidung als , Kante λ bezeichnet. Die Kante zwischen einem (mehrteiligen) Gegenstand und einem (mehrteiligen) Klassifi- kationskriterium kann einen Link oder mehrere Links enthalten oder leer sein.

Bei einer weiteren vorteilhaften Ausgestaltung des Verfahrens ist vorgesehen, dass bei einem mehrwertigen Link von/oder zu einem mehrteiligen Gegenstand oder einem mehrteiligen Klassifikationskriterium entweder eine Detail-Bildmatrix, eine eindimensionale überblickstafel oder eine Bildmontage platziert wird.

Bei einer weiteren vorteilhaften Ausgestaltung des Verfahrens ist vorgesehen, dass mehrteilige, insbesondere hierarchisch unterteilte Gegenstände oder Klassifikationskriterien in der Matrix bei einem Eingabesignal in mehrere Matrixzeilen oder Matrixspalten aufgefaltet beziehungsweise in eine Matrixzeile oder Matrixspalte zusammengefasst werden.

Bei einer weiteren vorteilhaften Ausgestaltung des Verfahrens ist vorgesehen, dass einzelne Gegenstände und/oder Klassifi- kationskriterien in der Bildmatrix anhand von genauer spezifizierbaren Beziehungen verbunden werden können.

Vorteilhafterweise kann die Bildmatrix im Laufe des Verfahrens auf einem Ausgabegerät, insbesondere auf einem BiId- schirm oder einem Drucker, oder in einer Datei ausgegeben werden .

Gemäß einer weiteren vorteilhaften Ausgestaltung der Erfindung kann vorgesehen sein, dass an den Matrixelementen der Bildmatrix zusätzlich weitere Informationen platziert werden, die aus einer Datenbank abgerufen werden und zu den jeweiligen Linkausgangsknoten oder Linkzielknoten gehören. Derartige Zusatzinformationen können beispielsweise weitere Daten betreffend ein visualisiertes Bild umfassen.

Gemäß einer weiteren vorteilhaften Ausgestaltung der Erfindung kann eine Datenbearbeitung vorgesehen sein, bei der die Daten der Bildmatrix (Bilder, Texte und/oder weitere Informationen an den Matrixelementen) einer weiteren Bearbeitung, vorzugsweise einer Dateneingabe, einer Bilderkennung, einer Korrelation und/oder eine Umordnung der Daten, unterzogen werden. Die bearbeiteten Daten werden anschließend gespeichert und/oder als eine bearbeitete (modifizierte) Bildmatrix ausgegeben.

Gemäß einer weiteren vorteilhaften Ausgestaltung der Erfindung kann die Speicherung der bearbeiteten Daten in einer Datenmenge erfolgen, aus der das Bereitstellen des Netzwerks erfolgt. Vorteilhafterweise kann damit die Information der Datenmenge automatisiert angereichert und für die weitere Nutzung vervollständigt werden.

Die genannten Weiterbildungen der Erfindung ermöglichen vor- teilhafterweise:

a) den erleichterten Umgang mit der Ambivalenz der höheren Einheit von Gegenständen und Klassifikationskriterien (Vorteil 1),

b) eine einfachere Annäherung an die Begründung der Korrelation der Gegenstände (Vorteil 2),

c) die Extraktion von zeitgebundenen Phänomenen bezüglich der Gegenstände wie der Klassifikationskriterien (Vorteil 3) ,

d) eine einfachere Beantwortung von impliziten visuellen Detailfragen (Vorteil 4), sowie

e) eine Erleichterung von Datenanalyse und -revision der Ausgangsdatenmenge (Vorteil 5).

Die genaue Erläuterung der genannten Vorteile 1 bis 5 folgt der Erläuterung der Erfindung am Ende der Beschreibung.

Das Verfahren ist beispielsweise einsetzbar in den Bereichen der Bibliometrie (Explikation von impliziten Bildzitaten) , der Kunstgeschichte (Rezeption, Tradierung, Mnemosyne) , der Netzwerkwissenschaft sowie in Fragen des Urheberrechts.

Weitere Gegenstände der Erfindung sind ein Speichermedium und/oder eine elektronische Datenverarbeitungsanlage, die einen Prozessor und ein Speichermedium umfassen, wobei das Speichermedium eine Software beinhaltet, welche den Prozessor dazu veranlasst, das erfindungsgemäße auszuführen.

Kurzbeschreibung der Zeichnungen

Weitere Vorteile und Einzelheiten der Erfindung sind in den Zeichnungen dargestellt und werden im Folgenden unter Bezug auf bevorzugte Ausführungsformen der Erfindung näher beschrieben. Es zeigen:

Figur 1 ein Flussdiagramm mit einer Illustration des erfindungsgemäßen Verfahrens;

Figur 2a-c Matrizen mit zunehmenden Informationsgehalt;

Figur 3 die Bildung der Bildmatrix, wobei visuelle Repräsentationen der Knoten an die Stelle der Links rücken;

Figuren 4a-c Bildmatrizen mit zunehmender Informations- dichte;

Figur 5 Innerhalb einer Bildmatrix führt die Montage von relevanten Teilknoten zur besseren Vergleichbarkeit der Darstellungen;

Figur 6 drei einfache Schritte von der Matrix zur Bildmatrix;

Figur 7 eine Blockdarstellung der allgemeinen Vorgehensweise der Herstellung einer Bildmatrix;

Figur 8 die Rohform der Basisliste (Adjazenzliste) ;

Figur 9 die Extraktion verschiedener Recordnummern (Knoten-IDs) in der Basisliste, welche die externe Beantwortung simultaner lokaler, globaler wie metalokaler Fragestellungen bzw. die Rekonstruktion einer Baumstruktur erlaubt;

Figur 10 eine allgemeine Vorgehensweise zur Herstellung einer Matrix (Detail aus Figur 7);

Figur 11 einen Ausschnitt aus einer Matrix;

Figur 12 einen Ausschnitt aus einer Bildmatrix;

Figur 13 einer Illustration einer Kante, die in Matrixzeilen oder Matrixspalten unterschiedlicher Zusammenfassung eine unterschiedliche Anzahl von Links enthalten kann;

Figur 14 eine Detail-Bildmatrix, die eine bessere Zuordnung von Information bietet, während ein Detailüberblick größere Abbildungen auf vergleichbarer Fläche bietet;

Figur 15 ein Skalieren oder Zoomen einer Matrix: lokal > metalokal > global; und

Figur 16 strenge Knotenbäume, die das Zoomen ähnlich dem Auf- und Zublättern des Verzeichnisbaumes in einem herkömmlichen Betriebs-

System (Icons nach Windows-Explorer™) erlauben.

Bevorzugte Ausführungsformen der Erfindung

Es folgt die Erläuterung der Erfindung anhand der Zeichnungen nach Aufbau und Wirkungsweise der dargestellten Erfindung. Ausführungsformen der Erfindung werden im Folgenden unter beispielhaftem Bezug auf die Bild- und Kunstwissenschaften erläutert. Die Umsetzung der Erfindung ist jedoch nicht auf diese Anwendung beschränkt, sondern in weiteren Bereichen möglich, die unten beispielhaft angegeben ist. Einige der Figuren illustrieren insbesondere für die Konstruktion einer Matrix oder Bildmatrix einzelne Textmerkmale, wie z. B. Ta- bellenwerte, die aus drucktechnischen Gründen nur verkleinert wiedergegeben und z. T. als illustrierende Bilder aufgefasst werden können.

Die Hauptschritte einer bevorzugten Ausführungsform des er- findungsgemäßen Verfahrens sind in Figur 1 und in der Blockdarstellung der Figur 7 gezeigt. Zunächst erfolgt bei Schritt Sl die Bereitstellung von Daten in mindestens einer Datenbank ('Datenmenge' in Figur 7). Die Daten umfassen Daten von Linkausgangsknoten, Daten von Linkzielknoten und Daten, welche die Links zwischen den Linkausgangsknoten und den Linkzielknoten charakterisieren. Die Daten können allgemein als BiId- und/oder Textdaten vorliegen, wobei die Daten von mindestens einem der Linkausgangsknoten und der Linkzielknoten visuali- sierbar sind (z.B. auch gesetzter Text einer gescannten Buch- seite) . Die Daten werden bei Schritt S2 in Form einer Basisliste (BASE in Figur 7, Inhalt z. B. Figur 8) bereitgestellt, welche alle zur Konstruktion der Matrix und der Bildmatrix erforderlichen Informationen enthält. Die Basisliste ist eine Datenliste mit dem unten beschriebenen Aufbau, die in einem

Datenspeicher gespeichert ist, der mit der Datenbank verbunden sein kann oder daraus extrahiert ist.

Auf der Grundlage der in der Basisliste enthaltenen Informa- tionen wird bei Schritt S3 eine Matrix konstruiert, deren

Reihen- und Spaltenpositionen durch die Auflistung der Linkausgangsknoten und Linkzielknoten (oder umgekehrt) gebildet werden. Die Matrixelemente (d.h. die Zellen der Matrix) umfassen eine Null (keine Information), falls zwischen den Linkausgangsknoten und Linkzielknoten der zugehörigen Reihen und Spalten kein Link besteht, oder ein Matrixelement, das Informationen über einen ein- oder mehrwertigen Link zwischen den zugehörigen Linkausgangsknoten und Linkzielknoten um- fasst. Diese Informationen werden aus der so genannten „edge- set"-Information aus der Basisliste gewonnen. An den betreffenden Matrixelementen wird eine Funktion (Unterprogramm) platziert, mit der abgefragt wird, ob die betreffende Kombination aus Reihe und Spalte im „edgeset" vorkommt. Falls dies der Fall ist, wird die Wertigkeit der Beziehung (Wertigkeit des Links) abgefragt. Bei einem einwertigen Link wird das

Bild des zugehörigen Linkausgangsknotens oder Linkzielknotens an die Stelle des Matrixelements gesetzt (Figur 3) . Bei mehrwertigen Links wird eine Detailmatrix (Figur 4a), eine überblickstafel (Figur 4b) oder eine Bildmontage (Figur 4c) an die Stelle des Matrixelements gesetzt.

Schließlich wird bei Schritt S4 aus der Matrix die gesuchte Bildmatrix konstruiert, in dem Matrixelemente durch visuelle Repräsentationen der zugehörigen Linkausgangsknoten oder Linkzielknoten ersetzt werden. Dabei kann eine Auswahl der visuellen Repräsentation in Abhängigkeit von der Wertigkeit des Links (Kantenwert) erfolgen.

Mit der Bereitstellung der Bildmatrix liegt in der Regel ein fertiges Verfahrensergebnis vor. Die Bildmatrix umfasst die Daten von Bildern, die Reihen und Spalten der Bildmatrix zugeordnet sind, und ggf. Zusatzinformationen. Die Daten stehen einem Nutzer zur Verfügung, der z. B. Beziehungen zwischen Bildern bzw. zwischen Reihen- und Spaltenpositionen untersuchen will.

Die weitere Nutzung der Bildmatrix wird vereinfacht, wenn mindestens ein Teil (Ausschnitt) der Bildmatrix ausgegeben wird. Es kann eine Ausgabe der Bildmatrix auf ein Anzeigegerät (z.B. Display, Ausdruck) oder in einen Datenspeicher erfolgen (Schritt S5) . Zur Ausgabe der Bildmatrix erfolgt eine Entschlüsselung der Bildmatrix.

Optional kann nach Schritt S3, S4 und/oder S5 eine weitere Datenbearbeitung vorgesehen sein, bei der die Bilder, Texte und/oder weiteren Informationen der Bildmatrix einer weiteren Bearbeitung unterzogen werden (Schritt S6) . Es können z. B. aus weiteren Datenressourcen weitere Informationen eingegeben werden, um die durch die Bildmatrix repräsentierte Information weiter anzureichern. Es kann eine Bilderkennung vorgesehen sein, um bestimmte Bilder (Muster) in den Zellen der Matrix zu erfassen und auszuwerten. Zwischen den Bildern, ggf. nach der Bilderkennung kann eine Korrelation bestimmter Teilbilder vorgesehen sein, um Beziehungen herzustellen. Des Weiteren kann eine Umordnung der Daten vorgesehen sein. Die Datenbearbeitung bei Schritt S6 kann von einem Nutzer oder automatisiert durch an sich verfügbare Datenverarbeitungs-Programme erfolgen, welche für die entsprechenden Funktionen, z. B. Bilderkennung, Korrelation eingerichtet sind. Im Falle des Sprunges von Schritt S3 direkt zur Datenbearbeitung (Schritt S6) wird nach einem erneuten Durchlauf von Sl bis S3 nach S6 die Bildmatrix erstellt (Schritt S4) .

Die bearbeiteten Daten werden anschließend gespeichert. Die Speicherung kann in der Ausgangs-Datenmenge oder einem separaten Speicher erfolgen. Alternativ oder zusätzlich kann mit den bearbeiteten Daten eine modifizierte Bildmatrix konstruiert werden.

Die Einzelheiten insbesondere der Schritte Sl bis S4 werden im Folgenden erläutert. Die praktische Umsetzung erfolgt mit an sich bekannten Methoden und Software-Werkzeugen, wie zum Beispiel einer Tabellenkalkulation oder HTML, deren Einzelheiten hier nicht beschrieben werden. Alternativ könnte das Verfahren z.B. auch im Rahmen einer Applikation im so genannten ,Semantic Web' mit Hilfe von JAVA und AJAX oder dgl . um- gesetzt werden.

1. Einführung

Eine Menge von klassifizierten Gegenständen lässt sich z.B. als Netzwerk aus Knoten und Links verstehen. Gegenstände und Klassifikationskriterien bilden dabei je eine Knotenart; die Zuweisung eines Gegenstandes zu einem Klassifikationskriterium geschieht durch den Klassifikationslink. Das so definierte Klassifikationsnetzwerk lässt sich wie jedes andere Netzwerk als Matrix abbilden.

Handelt es sich bei den klassifizierten Gegenständen um visuell darstellbare Objekte, so ist es möglich, die herkömmliche Matrix entsprechend anzureichern und in eine Bildmatrix umzu- wandeln. Hierzu werden die einfachen Links durch Abbildungen der Netzwerkknoten, d.h. Abbildungen der Gegenstände bzw. der Klassifikationskriterien ersetzt. Sinnvoll ist es dabei in vielen Fällen, einen Teil des Gegenstandes herauszugreifen, der dem verlinkten Klassifikationskriterium entspricht oder

umgekehrt. Das Verfahren erscheint daher im speziellen besonders dann sinnvoll wenn die fraglichen Gegenstände bzw. die Klassifikationskriterien in einer unterteilten, gegebenenfalls hierarchischen oder in einer zu höheren Einheiten zu- sammenfassbaren Form vorliegen.

Die visuell darstellbaren Objekte können in dem Verfahren sowohl die Rolle des Gegenstandes, als auch - in Spezialfällen - die des Klassifikationskriteriums übernehmen. Entsprechende Objekte in der Rolle des Gegenstandes werden im folgenden auch als Bilddokumente angesprochen. Ein Bilddokument wird dabei definiert als ein beliebiger, visuell repräsentierter bzw. repräsentierbarer Gegenstand oder eine Sammlung von mehreren derselben. Typische Beispiele von Bilddokumenten sind ein Buch mit Abbildungen, ein Buch mit gescannten Textseiten, eine Handzeichnung, ein Skizzenbuch, ein Photo, eine Photosammlung, die Photos eines Internetbenutzers oder eine Homepage.

Typische Beispiele von zusammenfassbaren Klassifikationskriterien sind Schlagwortmengen oder ,Tags λ , die zu sinnvollen Gruppen wie , Tagclustern λ zusammengefasst werden. Typische Beispiele von unterteilten Klassifikationskriterien sind hierarchische Systematiken, Thesauri oder Ontologien. Mehr oder weniger komplex unterteilbar und gleichzeitig zu höheren Einheiten zusammenfassbare Klassifikationskriterien sind Mengen von diskreten Gegenständen wie z.B. Websites, örtlichkeiten oder physikalische und konzeptuelle Objekte. Speziell vom Menschen geschaffene Objekte, wie antike Monumente, Baudenk- mäler oder Gemälde tauchen oft sowohl in der Rolle des Klassifikationskriteriums als auch in der des Gegenstandes auf, etwa wenn der Klassifikationslink die unbestimmte oder direkt nachweisbare Abhängigkeit eines Gegenstandes von anderen Gegenständen beschreibt (Rezeption oder Tradierung) .

Die Bildmatrix wird im vorliegenden Rahmen prinzipiell als eine Spezialform der herkömmlichen Matrix verstanden. Die Matrix bildet daher den Ausgangspunkt bei ihrer Herstellung. Sie wird dabei zunächst mit der nötigen Information zu Knoten und Links angereichert und dann in einem einfachen Schritt in eine Bildmatrix umgewandelt. Die Anreicherung kann dabei entweder direkt aus der Ausgangsdatenmenge entnommen werden, oder wird in einer neuen Adjazenzliste hinterlegt und vor- gehalten. Diese neue Adjazenzliste dient während der Bearbeitung und Analyse der Bildmatrix als vorübergehende Datenbasis. Sie wird im weiteren Verlauf als , Basisliste ' angesprochen. Die Basisliste kann das gesamte Netzwerk der Ausgangsdaten oder nur einen Teil davon enthalten und muss nach jeder größeren änderung neu erstellt oder aktualisiert werden.

Im Folgenden finden sich zunächst einige grundlegende Erklärungen zu Matrix und Bildmatrix. Darauf folgend wird eine mögliche Basisliste beispielhaft vorgestellt und ihre Her- Stellung genauer erläutert. Davon ausgehend wird die Erzeugung einer Matrix sowie der zugehörigen Bildmatrix expliziert. Darauf wird das Skalieren oder Zoomen der (Bild) Matrix, das heißt der Umgang mit den möglichen Zusammenfassungen oder Unterteilungen der Netzwerkknoten behan- delt. Schließlich werden verschiedene Vorteile des Verfahrens und der dadurch erzeugten Bildmatrizen dargestellt.

Als Beispielnetzwerk der Visualisierung dient dasjenige der Rezeption. Als Klassifikationskriterien enthält es unterteil- te antike Monumente, d.h. Kunstwerke oder Gebäudekomplexe; die Rolle der Gegenstände übernehmen (Bild) Dokumente, d.h. visuelle Quellen in denen die antiken Monumente dargestellt sind.

Für den Benutzer einer fertigen Implementierung des vorgestellten Verfahrens vollzieht sich der generelle Arbeitsablauf beim Erstellen einer Bildmatrix in der Regel anhand weniger einfacher Schritte (Figur 6) : Zunächst werden ggf. durch Sortieren der Matrix (Permutation) möglichst viele korrelierende Zeilen und Spalten der Matrix zusammengebracht, so dass ein Bereich von besonderer Dichte an gefüllten Zellen (Kantenwert größer gleich 1) entsteht. In einem weiteren Schritt werden die nicht benötigten Zeilen und Spalten wegge- filtert, so dass nur noch der relevante Bereich sichtbar bleibt. Schließlich wird der gefilterte Bereich per Klick in eine Bildmatrix umgewandelt.

Im Hintergrund enthält das technische Verfahren einige auto- matisierbare Vorgänge mit denen der Endbenutzer nicht direkt in Berührung kommen muss (vgl. Figur 7) . Sie werden im folgenden explizit erläutert.

2. Matrix und Bildmatrix

In einer Matrix werden die Knoten eines Netzwerks als Zeilen und Spalten dargestellt; die Kanten (ein- oder mehrwertige Links) als Punkte oder Zellen. Ein wichtiger Unterschied zur klassischen Netzvisualisierung, bei der die Knoten als Punkte und die Links als Linien dargestellt werden, besteht in den radikal verschiedenen Anreicherungsmöglichkeiten mit zusätzlicher Information. Während sich eine Netzdarstellung in erster Linie dazu eignet, die wie auch immer geartete Verortung der Knoten aufzuzeigen, bietet sich die Matrix vor allem dazu an, sequenzielle Strukturen wie etwa die Datierung von Objekten sichtbar zu machen. Die Permutation, das heißt die Sortierung und Gruppierung von Zeilen und Spalten nimmt dabei eine herausragende Rolle ein.

Bildet man ein Netzwerk aus Knoten und Links als Matrix ab, so steht am entsprechenden Schnittpunkt der beiden verlinkten Knoten zunächst entweder eine ,0 λ oder eine , 1\ je nach dem ob ein Link vorhanden ist oder nicht (Figuren 2a, Figur 11) .

Bereits diese einfache Form der Matrix ist von ungemeinem Nutzen, da sie bekanntlich dazu dienen kann, Rechenoperationen und Analysen im jeweiligen Netzwerk durchzuführen. Die bekannte Bandbreite reicht dabei von der Extraktion begehba- rer Navigationspfade bis zur Etablierung sinnvoller Gruppen durch Permutation, d.h. Vertauschen von Zeilen und Spalten (Stand der Technik) .

Eine Erweiterung der einfachen Matrix bedeutet die Gewichtung der Links mit einem bestimmten Wert. Sinnvoll ist dies beispielsweise bei einem Netzwerk in dem Ausgangs- und Zielknoten der Links zu Gruppen oder hierarchischen Strukturen zu- sammengefasst werden. Der Wert der Matrixzelle, der im Folgenden als Kante bezeichnet wird, entspricht hier der Anzahl tatsächlich vergebener Links zwischen den jeweiligen Zusammenfassungen. Die Zusammenfassung und Gewichtung der Matrixzeilen und -spalten kann realisiert werden, wie es im Stand der Technik beim "Block Modelling" in der so genannten Social Network Analysis vorgesehen ist.

Gibt es zwischen dem übergeordneten Gegenstand (z.B. einem Dokumentkomplex) und der übergeordneten Klassifikation (z.B. einem Monumentkomplex) drei Links (d.h. beispielsweise drei Zeichnungen in einem Skizzenbuch zu verschiedenen Teilen des Pantheon in Rom), so lautet der zugehörige Wert ,3 λ (Figur 2b) . Der gewichtete Wert einer solchen Kante repräsentiert genau genommen eine Detailmatrix der einzelnen Teilknoten der jeweiligen Komplexe (Figur 2c) .

Aus den genannten Fällen ergeben sich für die Matrix drei Möglichkeiten: Entweder erscheint an Stelle der jeweiligen Kante ,CP oder ,1' (entsprechend Link vorhanden oder nicht), ein Wert größer , 1 λ (falls der Link eine Zusammenfassung meh- rerer Links ist) oder eine Detailmatrix (falls die Teil-Links explizit gezeigt werden sollen) .

Um den erfindungsgemäßen Schritt von der Matrix zur Bildmatrix zu vollziehen, wird der Inhalt der Kanten durch die Ab- bildung des verlinkten Dokument (teil) s ersetzt. Allgemein formuliert, rückt die Abbildung entsprechend klassifizierter (Detail) Knoten an die Stelle der Links zwischen den Knoten von Dokument und Klassifikation (Figur 3) .

Anstelle einer 1 in der Matrix erscheint folglich ein Bild oder der Text des verlinkten Dokument (teil) s . Dabei ist es vorteilhaft, wenn die entsprechenden Quadranten in einer vorhandenen Abbildung referenziert sind oder daraus ausgeschnitten vorliegen.

Die einzelnen Dokument (teil) e sowie (Unter) Klassifikationen, können in der (Bild)matrix auch zu übergeordneten (globalen) oder zwischengelagerten (metalokalen) Einheiten zusammenge- fasst werden. Gewichtete Kanten mit einem Wert größer als 1 entsprechen dabei in der Matrix nicht einem einzigen Link, sondern mehreren Links zwischen den verbundenen, eventuell aus mehreren Teilen zusammengefassten Knoten. Dabei ergeben sich grundsätzlich drei Möglichkeiten:

Die einfachste Methode ist das Verwenden der Detailmatrizen

(Figur 2c) sowie deren Auffüllung mit den enthaltenen Einzelquadranten (Figur 4a).

Die zweite Methode ist das Auffüllen der Zelle mit den Abbildungen der relevanten Einzelquadranten, ohne sich an die Ordnung der Detailmatrix zu halten - ein Vorgehen, das besonders bei umfangreichen Detailmatrizen sinnvoll ist, da sonst die Abbildungen oft zu klein werden (Figur 4b) .

Die dritte Methode beinhaltet die Montage der enthaltenen Teildarstellungen (Figur 4c) - eine oft sinnvolle Anwendung, die vor allem bei mittleren übergeordneten Einheiten die Ver- gleichbarkeit deutlich verbessert: Im linken Teil von Figur 5 erkennt man drei Details aus einem Handzeichnungscodex des 16. Jahrhunderts ( , Dok-Vorlage λ ) , die durch den Klassifikationslink allesamt mit einem bestimmten Schnitt durch ein antikes Gebäude (, Monument*) verlinkt sind. Im rechten Teil von Figur 5 sind die drei Teile, so wie von den Autoren des Codex vorgesehen, montiert. Der Vergleich mit dem ebenfalls in der Matrix zu sehenden, eindeutig abhängigen Schnitt einer weiteren Zeichnungssammlung ( , Dok-Kopie λ ) ist dank der Montage in der zweiten Abbildung wesentlich einfacher.

Das große Problem an der Verwendung von Montagen dieser Art ist die Natur der übergeordneten Fragestellung: Die Montage repräsentiert streng genommen ggf. den Link zwischen einer ideellen übergeordneten Dokumenteinheit und dem entsprechen- den übergeordneten Klassifikationskriterium - eine Beziehung die in der Ausgangsdatenmenge in dieser Form eventuell überhaupt nicht existiert, da dort in der Regel nur die Links zwischen tatsächlich existierenden Dokument (teil) en und eventuell untergeordneten Klassifikationskriterien verzeichnet sind. Die Bildmatrix zeigt sich daher durch den Einsatz der Montagen als eigenständiges Produkt. Sie ist keine reine Abbildung der vorhandenen Daten, sondern geht in der Aussage über das vorgefundene hinaus.

Trotz der damit verbundenen Problematik ist die Anreicherung der Bildmatrix durch Montagen in vielen Fällen sinnvoll, da sich eine Vielzahl von Dokument (teil) en auch als Teil übergeordneter oder völlig unabhängiger, ideeller (Doku- ment) Konzepte verstehen lässt: Einzelne Skizzen verschiedener historischer Skizzenbücher lassen sich so zum Beispiel zu einem anzunehmenden Rekonstruktionsprojekt zusammenfassen; Fragmente einer einzelnen Darstellung lassen sich zur besseren Vergleichbarkeit ggf. zu einer unvollständigen Gesamtdar- Stellung verbinden. Aus der erhöhten Vergleichbarkeit können schließlich eventuell unbekannte Abhängigkeiten erschlossen werden (siehe Vorteil 2).

3. Beschreibung der Basisliste

Die bereits angesprochene ,Basisliste λ (Figur 8) oder ein dynamisches äquivalent, kann sowohl in der Ausgangsdatenmenge implizit vorliegen, oder extern erstellt werden. Aus drucktechnischen Gründen ist die Basisliste der Figur 8 in drei getrennten Teilbildern (Figuren 8a, 8b und 8c) gezeigt. Die Basisliste enthält Informationen zu Knoten und Links in der Ausgangsdatenmenge. Dabei können verschiedene Zusammenhänge zwischen Knoten auftreten, die schematisch in Figur 8 gezeigt sind. Figur 8 zeigt, dass die Extraktion verschiedener Re- cordnummern (Knoten-IDs) in der Basisliste die externe Beantwortung simultaner lokaler, globaler wie metalokaler Fragestellungen bzw. die Rekonstruktion einer Baumstruktur erlaubt.

Prinzipiell ist die Basisliste eine mit Metainformation zu Knoten und Kanten eines Netzwerks angereicherte Adjazenz- liste, die sowohl der Herstellung von skalierbaren (Bild) Matrizen wie auch der Herstellung von klassischen Netzvisualisierungen dienen kann. (Bild)Matrix wie Netzvisuali-

sierung bedürfen eines so genannten ,Nodesets λ (Knotensatz, Gruppe von Informationen über die Knoten des Netzwerks) sowie eines ,Edgesets λ (Kantensatz, Gruppe von Informationen über die Kanten des Netzwerks) . Beides ist in der Basisliste ent- halten, oder kann dynamisch aus derselben erzeugt werden. Zusätzlich vorhandene Anreicherungen können der besseren Sortierung sowie der klareren Darstellung des jeweiligen Endproduktes dienen. Durch Kombination verschiedener Basislisten ist es darüber hinaus auch möglich, die verschiedenen Netz- werktypen (wie Rezeption, Tradierung oder Baumstruktur) in einer einzigen Visualisierung zu verbinden.

In diesem Sinne zeigt die Bildmatrix eines Rezeptionsnetzwerks in den Figuren 12a - 12c in Superposition ein zweites Netzwerk in klassischer Netzvisualisierung - das Netzwerk der Tradierung.

Im Folgenden wird beispielhaft eine externe, von der Ausgangsdatenmenge getrennte Basisliste beschrieben sowie deren Herstellung erläutert. Ausgangspunkt ist dabei eine Datenbankausgabe (Schritt Sl in Figur 1) , die alle relevanten Linkverhältnisse eines Rezeptionsnetzwerks enthält. In einem zweiten Schritt wird die daraus erstellte einfache Adjazenz- liste der Links durch Knoteninformation aus einer weiteren Datenbankauslese angereichert. Das Vorgehen ist bezüglich jedes gewählten Teilnetzwerks gleich. Für jede Linkart in der Ausgangsdatenmenge kann (und sollte in der Regel) eine eigene Basisliste erstellt werden.

Wird die Basisliste als flache Tabelle (spreadsheet) repräsentiert, so enthält sie zweckdienlich drei Spaltengruppen (Figuren 8a, 8b und 8c) - eine zum Linkausgangsknoten, eine zum Linkzielknoten sowie eine weitere zu den sich daraus ergebenden Kanten. Jede Zeile repräsentiert in der Liste je ei-

nen real in der Ausgangsdatenmenge existierenden Link (die , self-self-edge λ ) .

Das Nodeset, also die Information zu den Knoten des Netzwerks lässt sich aus den ersten beiden Spaltengruppen der Basisliste extrahieren. Das Edgeset entspricht oder ergibt sich aus der dritten Spaltengruppe.

Die ersten beiden Spaltengruppen der Basisliste (Figur 8a, 8b) zu den Knoten sind in je vier Untergruppen unterteilt, entsprechend den unten genauer definierten Zusammenfassungen in ,Self λ , , Parent \ ,Main λ und ,Entity2 λ des jeweiligen Linkausgangs- oder Linkzielknotens. Jede der Untergruppen enthält an erster Stelle die entsprechende , Recordnummer λ (o- der ggf. eine beliebige andere Knoten-ID) , an zweiter Stelle den so genannten , Labeistring λ sowie an dritter Stelle die so genannte , Occurence":

Die erste Spalte der vier Untergruppen zu den Knoten in der Basisliste enthält die , Recordnummer ' des Ausgangs- oder

Zielknotens oder des korrespondierenden Knotens der entsprechenden Zusammenfassung (vgl. Figur 9, ,RecNo... λ entspricht in Figur 8, Doc... λ , z. B. ,DocSelf\ oder , Mon...\ z. B. ,MonSelf λ ) :

, RecnoSelf* ist die Recordnummer des ausgelesenen Knotens selbst.

, RecnoParent λ ist die Recordnummer des ersten übergeordneten Knotens in der ggf. vorhandenen Knotenhierarchie (part-of- link) . Sie dient zum Beispiel dazu, in einer Netzvisualisierung, zusätzlich zu Rezeption und Tradierung, die Baumstruktur eines Dokuments anzuzeigen. Für die Zusammenfassung übergeordneter Einheiten spielt sie nur eine indirekte Rolle.

, RecNoMain λ ist die Recordnummer des Knotens an der Spitze der jeweiligen Knotenhierarchie, die mit der , globalen' Dokumenteinheit zusammenfällt. Beim Auslesen wird zu diesem Zweck die Knotenhierarchie bis zu einer Markierungsbestimmung nach oben verfolgt. Jeder Knoten an der Spitze eines Dokumentbaumes wird dazu vor dem Auslesen entsprechend als , Main λ markiert .

, RecNoEntity2 λ ist die Recordnummer einer ggf. vorhandenen ideosynkratischen, sinnvollen , metalokalen λ Einheit des Dokuments, die mit Hilfe des Markers , Entity2 λ gekennzeichnet ist. Wie bei der , RecNoMain' wird die Knotenhierarchie auch hier beim Auslesen bis zur Markierungsbestimmung nach oben verfolgt.

So können die genannten Knoten-Identifizierungen in Figur 9 z. B. mit , RecnoSelf λ auf ein bestimmtes Bild in einem Buch, , RecnoParent λ auf die direkt übergeordnete Seite in dem Buch, , RecNoMain λ auf das Buch an sich, und , RecNoEntity2 λ auf einen mehrere Seiten umfassenden Katalogeintrag in dem Buch verweisen .

Die zweite Spalte der vier Untergruppen zu den Knoten in der Basisliste (Figur 8) enthält den so genannten , Labeistring x . Er dient dazu die jeweiligen Knoten in der Matrix mit nützlicher Information anzureichern.

In der Regel, das heißt wenn Ausgangs- und Zielknoten von un- terschiedlicher Art sind, ist es zweckdienlich zwei verschiedene Formate für den , Labeistring λ zu definieren. Im Folgenden wird beispielhaft zunächst ein sinnvoller Labeistring für (Bild) Dokumente sowie danach ein weiterer für die Klassifikation (hier antike Monumente) erläutert.

Labeistring Dokument:

Recno- Seif I RecnoParent | RecnoMain | RecnoEntity2 | Type | LabelSelf I Label | DateName | begin | end | lstArtist | ImgFile

Am Beginn des Labeistrings der (Bild) Dokumente stehen die bereits vorgestellten Recordnummern, die der Zusammenfassung nach übergeordneten Einheiten dienen (vgl. Figur 9).

, Type λ spezifiziert zweckmäßig die Knotenart des ausgelesenen Eintrags, das heißt im Fall von Dokumenten, z.B. ob es sich um ein Einzelobjekt, eine Publikation oder um ein Photo han- delt.

, LabelSelf enthält ausschließlich die Bezeichnung des Knotens selbst. Sie ist notwendig, wenn zum Beispiel die Baumstruktur eines Dokuments als Netzwerk visualisiert werden soll, ohne an den Knoten des Baumes redundante Information zu zeigen.

, Label" enthält die vollständige Bezeichnung des Knotens, in der auch Informationen übergeordneter oder, wie im Fall der Dokument-Lokation zweckmässig, hypotaktisch verbundene Knoten einbezogen sein können. Das Label entspricht z.B. bei Einzelobjekten sinnvoller Weise mehr oder weniger der Folge „Ort / Institution / Abteilung : Codex / Folio / Quadrant" und bei Publikationen der Folge „Kurzname / Stelle".

, DateName λ enthält z.B. die Bezeichnung des (ersten) zur Datierung herangezogenen Zeitbereichs. (Dokumente können selbstverständlich auch inkl. Angabe der Datierungsherkunft

konkurrierend d.h. mehrfach datiert werden, etwa bei divergierender Forschungsmeinung.)

,begin λ und ,end λ enthalten die zu , DateName λ gehörigen, zur Sortierung notwendigen numerischen Anfangs- und Endzeitpunkte in der Form +/-JJJJ:MM: TT (= Jahr : Monat : Tag) .

, lstArtist λ enthält z.B. die erste mit dem Dokument verbundene Person unter der Bedingung , Künstler'. (Selbstverständlich könnten an dieser Stelle alle verbundenen Künstler oder auch andere Personen stehen.).

, ImgFile' enthält den Verweis auf die dem Datenbankeintrag entsprechende Bilddatei, oder im Fall von nur sekundär re- prographierten Dokumenten den Verweis auf die Bilddatei des ersten abhängigen Dokuments, sofern es sich dabei um eine photographische Kopie handelt.

über die genannten Komponenten hinaus ließe sich der Label- string der Dokumente auch durch weitere zusätzliche Information anreichern - etwa durch GIS-Informationen zur Lokalität.

Labeistring Klassifikation:

RecnoSelf I RecnoParent | RecnoMain | RecnoEntity2 | LabelSelf | Label

Der Labeistring der Klassifikationskriterien entspricht bezüglich der Grunddaten dem der (Bild) Dokumente. Handelt es sich bei den Klassifikationen um komplexere Gebilde wie im Beispielfall um antike Monumente oder wiederum um Dokumente, so kann der entsprechende Labeistring ähnlich reich an Information sein, wie der Labeistring zum Dokument. Im vorliegenden Fall sind keine zusätzlichen Anreicherungen zur Sortie-

rung enthalten. Die Funktion der enthaltenen Felder entspricht den Erklärungen zum Labelstirng der Dokumente.

Die dritte Spalte der vier Untergruppen zu den Knoten in der Basisliste (Figur 8) enthält die so genannte ,Occurence' der Knoten. Sie gibt die relative Häufigkeit des entsprechenden Eintrags in der Untergruppe an. Sie wird erhoben durch einfaches Zählen der gleichartigen , Recordnummern λ in der ersten Spalte der Untergruppe. Sie entspricht dem Ausgangsknoten- OUT-Grad beziehungsweise dem Zielknoten-IN-Grad.

Zu beachten ist, dass die , Occurence' im Fall einer Eingrenzung der , Basisliste λ auf eine Teilmenge der Ausgangsdatenmenge neu berechnet werden muss. Ein einfaches Auslesen der Gesamtzahl der Links zu einem Eintrag aus der Ausgangsdatenmenge macht unter Umständen keinen Sinn, da die Eingrenzung nicht mit den vorhandenen Daten der Ausgangsdatenmenge korrespondieren muss.

Zusätzlich zu , Recordnummer λ , , Labeistring λ und ,Occurence' können die Untergruppen der beiden Spaltengruppen zu den Knoten in der Basisliste noch Information zu Abbildungen und Sortierung enthalten.

Die Felder , Image λ (und , Imgext λ ) in der Spaltenuntergruppe ,DocSelf λ (Figur 8) enthalten den für die Bildmatrix wichtigen Verweis zur jeweiligen Bilddatei bzw. zum jeweiligen Ausschnitt aus einer Bilddatei. Die darin angegebene Recordnummer kann sich von derjenigen des Knotens selbst unterschei- den, etwa wenn die Bilddatei von einer reprographierten Kopie stammt - eine Besonderheit, die in der Bildmatrix durch eine Markierung gekennzeichnet sein kann.

Die , Sort '-Spalten in den Spaltengruppen , DocMain' und ,Do- cEntity2 ' (Figur 8) stammen aus der Sortierung von aus der Basisliste erstellten Matrizen. Die Information wird hierzu ggf. mittels eines Makros zurück in die Basisliste impor- tiert. Dies ist sinnvoll, da die aufwendigen, zum Teil manuellen Sortierungen der Matrizen z.B. so auf einfache Weise nach unten, das heißt von der , globalen λ Zusammenfassung ,Main λ zur , metalokalen ' bzw. , lokalen' Zusammenfassung ,En- tity2 λ bzw. ,Self λ vererbt werden können.

Die dritte Spaltengruppe der Basisliste (Figur 8c) zu den Kanten enthält ausgehend von den drei Zusammenfassungsebenen , Seif, , Main λ und , Entity2 λ bis zu neun Untergruppen (3 Linkausgangspunkte mal 3 Linkziele) . Gezeigt sind davon nur die beiden Verhältnisse , DocMain-MonMain ' sowie ,DocEntity2- MonSelf λ .

Jede Untergruppe enthält in der ersten Spalte die entsprechende Kante, die durch einfache Verkettung der entsprechen- den Recordnummern entsteht. Die zweite Spalte jeder Untergruppe enthält die , Edgeoccurence λ , die genauso berechnet wird wie diejenige der einzelnen Knoten. Die , Edgeoccurence λ kann beispielsweise als Indikator für die Dokumentationsdichte verschiedener Klassifikationskomplexe in einem umfangrei- chen Dokument dienen. Die Aussagequalität ist dabei natürlich variabel, da beispielsweise eine einzelne gute Zeichnung zahlreiche schlechte Skizzen an Bedeutung weit übertreffen kann.

4. Herstellung der Basisliste (Schritt S2)

4.1. Auslesen der rohen Adjazenzliste

Die Rohform der Datenbankausgabe entspricht im Falle von simplen Links zwischen Ausgangs- und Zielknoten beispielsweise der folgenden Form:

Datenbankauslese „Edges" : Linkwurzel Linkziele ...

RecnoDocl RecnoMonl RecnoMon2 RecnoMon3 RecnoDoc2 RecnoMon4 RecnoDoc3 RecnoMon2 RecnoMonδ

Das erforderliche Ergebnis in der Datenbank muss hierzu nur die Ausgangsknoten der Links enthalten. Sie erscheinen in der Ausgabe in der ersten Spalte. In den folgenden Spalten erscheinen die Ziele der Links. Sowohl Linkausgangsknoten wie Linkzielknoten werden ausschließlich durch ihre ID (Record- nummer; Primärschlüssel oder URI...) repräsentiert.

Im nächsten Schritt wird die rohe Datenbankausgabe der Linkverhältnisse in eine zweispaltige Form umgewandelt:

Roh-Edgeliste (Adjazenzliste) : Linkwurzel Linkziel RecnoDocl RecnoMonl RecnoDocl RecnoMon2 RecnoDocl RecnoMon3 RecnoDoc2 RecnoMon4 RecnoDoc3 RecnoMon2 RecnoDoc3 RecnoMon5

Jedem Linkausgangsknoten steht somit ein einziger Linkzielknoten gegenüber. Jede Zeile enthält folglich ein einziges Linkverhältnis, das in dieser Form auch explizit in der Da- tenbank existiert. Werden die Links in der Ausgangsdatenmenge z.B. als selbstständige Ereignisknoten repräsentiert (oder auch als Kreuztabelle im Fall einer relationalen Datenbank) , so kann das Ergebnis dieser Ereignisse auch direkt ausgelesen werden. Die Ausgabe entspricht dann sofort der zweispaltigen Form.

4.2. Anreicherung der rohen Adjazenzliste

Im weiteren Verlauf wird die zweispaltige Adjazenzliste durch zusätzliche Knoteninformation angereichert. Dies erlaubt zum einen die Zusammenfassung der Knoten und Linkverhältnisse zu globalen und metalokalen Einheiten in der Matrix sowie zum anderen die Sortierung der (Bild) Matrix nach Kriterien wie Bezeichnung, örtlichkeit, Datierung oder Künstler der jewei- ligen Knoten.

Die Anreicherung der rohen Adjazenzliste geschieht anhand von einfachen Datenbankauslesen aller relevanten Knoten (z.B. Dokumente und Monumente) in der Form des oben beschriebenen , Labeistrings λ . Hierzu ist es in der Regel nicht nötig ein speziell angepasstes Ergebnis in der Ausgangsdatenmenge zu erstellen; es werden einfach alle Dokumente und Monumente der Ausgangsdatenmenge ausgelesen. Aus den fertigen Ausgaben wird daraufhin ein Makro erzeugt, das die Recordnummern in der ro- hen Adjazenzliste ( , Roh-Edgeliste y ) durch den kompletten ,La- belstring λ ersetzt. Die Auswahl der relevanten Einträge ergibt sich dann automatisch durch die in der rohen Adjazenzliste vorhandenen Recordnummern.

In einem weiteren Schritt werden in der so angereicherten Liste alle vorhandenen Recordnummern, das heißt , RecnoSelf\ , RecnoParent λ , , RecnoMain λ und , RecnoEntity2 λ durch dasselbe Makro erneut mit dem Labeistring angereichert.

Endergebnis ist die Rohform der oben beschriebenen Basisliste (Figur 8) .

5. Herstellung der Matrix (Schritt S3)

Als Matrixvisualisierungswerkzeug kann zweckmäßig eine gute herkömmliche Tabellenkalulation dienen. Es ist jedoch auch möglich, das beschriebene Verfahren in einer genuinen Matrixapplikation zu implementieren (zum Fehlen einer solchen siehe Daru, Myriam: Jacques Bertin and the graphic essence of data. Information Design Journal 10(1) 2001 S. 20-25). Die einzige wirkliche Einschränkung der Tabellenkalkulation gegenüber einem wünschenswerten Matrixwerkzeug ist die existierende Beschränkung der Spaltenanzahl auf 256. Alle anderen Einschrän- kungen betreffen in erster Linie die Bequemlichkeit des User- Interface sowie die Rechengeschwindigkeit, die sich bei Anpassung der Applikation an den gewünschten Zweck sicher erheblich verbessern ließe.

Ein Schema des prinzipiellen Vorgehens bei der Herstellung einer Matrix aus der Basisliste gibt Figur 10 (Detail aus Figur 7) :

Zunächst wird für die Mengen der Linkausgangsknoten und Link- zielknoten je ein Nodeset aus der Basisliste extrahiert. Das Klassifikationskriterien-Nodeset ergibt in der Regel zweckmäßig die Spalten der Matrix, das Gegenstands-Nodeset die Zeilen. Beide Nodesets setzen sich dabei aus der Information zusammen, die in der jeweiligen Untergruppe der Basisliste vor-

handen ist. Primär ist nur die Recordnummer (d.h. die ID) der entsprechenden Knoten nötig. Alle weiteren Informationen dienen der späteren Sortierung der Matrix oder dem schnellen In- dentifizieren der Einträge.

Werden global bzw. metalokal zusammengefasste Main- und Enti- ty2-Nodesets aus der Basisliste extrahiert, so werden vor dem Einsetzen in die Matrix gegebenenfalls vorhandene Redundanzen herausgefiltert, so dass jeder Klassifikationskriterien- oder Gegenstandskomplex nur einmal im entsprechenden Nodeset vorkommt. Nach dem Filtern und einer eventuellen Vorsortierung werden die Nodesets in eine leere Tabelle kopiert (vgl. Figur H) •

Bei metalokalen Entity2- und lokalen Self-Matrizen wird das im , Labeistring λ enthaltene , Label λ der Knoten eventuell auf verschiedene Zellen aufgeteilt - entsprechend

„Buch" I "Kapitel" I "Abbildung" statt „Buch/Kapitel/Abbildung" - um polyhierarchisch sortieren zu können.

Das Edgeset muss in der Regel im Fall der Matrixherstellung (im Gegensatz zur klassischen Netzvisualisierung) nicht aus der Basisliste extrahiert werden. Die entsprechende Untergruppe in der dortigen dritten Spaltengruppe (Figur 8c) ist trotz ihrer vorhandenen Redundanzen ausreichend.

Das Ausfüllen der Matrix geschieht durch einfaches überprüfen, ob die entsprechende Recordnummernkombination von Ausgangs- und Zielknoten in der jeweiligen Untergruppe der Kan- ten in der Basisliste vorhanden ist. In jeder auszufüllenden Zelle der Matrixtabelle dient dazu ein Befehl entsprechend dem folgenden Beispiel (im Format von Excel 2002™) :

=WENN( (ZäHLENWENN(e; (VERKETTEN (x; "$"; y) ) )>0) ; (VERKETTEN (x; "$"

;y));0)

e bezeichnet die entsprechende Edge-Spalte in der Basisliste (z.B. , [Basisliste.xls] edges x ! $AP: $AP) ; x und y sind variablen, die den jeweiligen Ausgangs- beziehungsweise Zielknoten bezeichnen. Im gezeigten Beispiel steht die Linkausgangskno- tenrecordnummer in der Zelle x (z.B. $EU22), die Linkzielkno- tenrecordnummer in der Zelle y (z.B. ET$20).

Nachdem die Matrix fertig errechnet ist, werden in der Tabellenkalkulation ggf. die dynamischen Werte in feste Werte umgewandelt, Nullen entfernt und eine passende bedingte Zellenformatierung vergeben (z.B. Hintergrund schwarz falls Zellen- inhalt ungleich 0) . Eine fertige Matrix 5 ist beispielhaft in Figur 11 illustriert.

6. Herstellung der Bildmatrix (Schritt S4)

6.1. Hauptschritte

Ist die Matrix 5 fertig erstellt, gliedert sich die Herstellung der Bildmatrix 6 technisch in zwei Abschnitte.

Zunächst werden die so genannten , Edgelabel λ erstellt, die entweder aus dem jeweiligen Linkausgangsknoten, d.h. dem Dokument (teil) bestehen, oder falls die , Edge-Occurence λ einen höheren Wert als eins besitzt aus mehreren derselben.

Der zweite Abschnitt, nach der Erstellung der Edgelabel, betrifft die tatsächliche Visualisierung der Bildmatrix. Hierzu wird die Matrix zunächst sinnvoll sortiert, gefiltert und bei Bedarf transponiert. In einem automatischen Schritt wird schließlich die tatsächliche Bildtafel generiert (Figur 12) .

Figur 12 zeigt beispielhaft einen Ausschnitt der Bildmatrix, die in der Praxis erheblich größer sein und zum Beispiel 200 Spalten und 2000 Zeilen umfassen kann.

Das vollständige generelle Vorgehen folgt der Darstellung in Figur 7. Aufgrund der Komplexität der Darstellung ist wichtig anzumerken, dass alle gezeigten Umwege automatisierbar sind. Für den Nutzer (z. B. Forscher) bedeutet dies, dass er nach entsprechender Implementierung des Verfahrens bei Bedarf auf Knopfdruck eine Bildmatrix aus einer Matrix erzeugen kann.

6.2. Generation der , Edgelabel'

Im Folgenden wird zunächst die Generation der , Edgelabel' er- klärt. Sie werden hier wie die Basisliste nur einmal für alle möglichen Kanten erstellt. Alternativ wäre es auch möglich nur die notwendigen ,Edgelabel' zum Zeitpunkt der Visualisierung ,on the fly' zu erstellen. Letztere Variante ist bei Anwendung der Erfindung in einem Computernetzwerk, z. B. im In- ternet, von Vorteil, um den Datenverarbeitungsaufwand auf die Verarbeitung der aktuell gewünschten Informationen zu beschränken. Anzumerken ist dabei generell, dass die , Edgelabel λ für alle Knotenzusammenfassungen globaler, metalokaler wie lokaler Art separat erstellt werden müssen. Dies ist not- wendig, da die , Edgeoccurence λ gleichnamiger Kanten in den unterschiedlichen Zusammenfassungen differieren kann (vgl. Figur 13) :

Der Inhalt einer Zelle, d.h. einer Kante in der Matrix ent- spricht ja wie erwähnt nicht unbedingt dem direkten Linkverhältnis zwischen den jeweiligen zusammengefassten Gegenständen und Klassifikationskriterien in der Datenbank. Vielmehr können, besonders bei global oder metalokal zusammengefassten

Matrixzeilen oder Matrixspalten, in einer Kante mehrere Links zusammengefasst sein.

Die Kante zwischen Folio und Monument in Figur 13 repräsen- tiert beispielsweise in einer lokal zusammengefassten Matrix (, DocSelf-Matrix * ) nur den direkten, auch in der Datenmenge existenten (einwertigen) Link zwischen Folio und Monument. In einer metalokal zusammengefassten Matrix ( , DocEntity2- Matrix λ ) repräsentiert dieselbe Kante zwischen Folio und Mo- nument insgesamt drei in der Datenmenge existente Links: Den Link Folio-Monument, sowie zwei weitere Links zwischen den Quadranten und den Monumentteilen.

Daraus folgt, dass die Matrix vor allem in der zusammenge- fassten Form ein x eigenständiges Produkt ist, das in ihrer

Aussagekraft den Inhalt der Datenmenge in seiner herkömmlichen Zugänglichkeit übertreffen kann.

Die Bildmatrix wird im Folgenden beispielhaft in HTML ko- diert. Der Inhalt der , Edgelabels λ wird daher als HTML- Tabellenzelle definiert:

Inhalt der Tabellenzelle (allgemein) : <a href="Edgelink"> <img src="EdgeImage" border="0" alt="EdgeAltText"> <br>EdgeLabel</a>

Inhalt der Tabellenzelle für Occurence = 1: <a href="... /Database?RecNo"> <img src=" ... /RecNoDocument . jpg bzw. ... /RecnNoArchetyp. jpg" border="0" alt="Labelstring von RecNoDocument sowie EdgeLa- bel"> <br>node Recno</a>

Inhalt der Tabellenzelle für Occurence > 1: <a href="DetailMatrix.htm bzw. Detailüberblick. htm λX > <img src="Detailmatrix . jpg bzw. DetailUberblick.jpg" bor- der="0" alt="Labelstring von RecNo (Parent) Document sowie Edgeθccurence">

<br>Edge RecNoDocument$RecNoMonument</a>

Der Inhalt der Tabellenzelle einer jeden Kante erhält in der Bildmatrix neben der Bezeichnung (EdgeName) drei Bestandtei- Ie: eine Abbildung (EdgeImage ), einen erklärenden Text

(EdgeAltText) , der ggf. erscheinen kann, wenn man in der Online-Version mit der Maus darüber fährt sowie einen Link (EdgeLink) , der die Navigation zurück in die Datenbank ermöglicht.

Ist die , Edge-Occurence λ gleich 1 so ist das Ausfüllen der entsprechenden Teile sehr simpel, da alle Informationen aus dem Nodeset bzw. Edgeset der Basisliste entnommen werden können :

Das , EdgeLabel λ entspricht dem Label des zugehörigen Linkausgangsknoten, d.h. beispielsweise des Dokument (teil) s .

Das , EdgeImage λ entspricht der jeweiligen Abbildung oder der- jenigen der reprographierten Vorlage (eventuell kenntlich gemacht durch einen Rahmen oder ähnliches) .

Der , EdgeAltText λ enthält beliebige Informationen aus dem jeweiligen Labeistring sowie zur besseren Kontrolle den Namen der Edge (Recno$Recno) .

Der , EdgeLink' öffnet den Linkausgangsknoten, d.h. Dokument (teil) in der Datenbank.

übersteigt die , Edge-Occurence λ den Wert 1, so tritt an die Stelle des einzelnen Linkausgangsknoten in der Tabellenzelle idealerweise eine Detailmatrix, die ihrerseits die relevanten Linkausgangsknoten enthält. Da die Abbildungen so aber in der Regel noch schneller zu klein werden, ist es ratsam an Stelle der Detailmatrix eine überblicksabbildung zu zeigen, die nur die gefüllten Zellen der Detailmatrix enthält (Figur 14) .

Die überblicksabbildung tritt an Stelle der Einzelabbildung im , Edgeimg' der Tabellenzelle. Sie muss für alle Kanten mehrfacher Occurence eigens erstellt werden, wozu aus der Basisliste eine Konkordanz erstellt wird, in der alle Record- nummern der Linkausgangsknoten, sowie deren Abbildungsverweis bei der mehrfach vorkommenden Kante gesammelt werden. Aus der Konkordanz wird anschließend pro Kante je eine HTML-Datei erzeugt. Sie trägt den Namen der Kante und erlaubt die Navigation von den einzelnen enthaltenen Knoten zurück in die Ausgangsdatenmenge. Die HTML-Fassung der überblicksabbildung wird schließlich mit Hilfe eines Spezialwerkzeugs (z.B. Html2jpg™) in eine Bilddatei umgewandelt, um sie in die HTML- Version der Bildmatrix einfügen zu können.

Das fertige , Edgelabel' für Werte größer 1 enthält als Bezeichnung den ursprünglichen Namen der Kante in der Form , recno$recno \ als , Edgeimg λ die überblicksabbildung sowie als , Edgealttext λ den Wert der , Edge-Occurence λ der Kante und das , Label λ des übergeordneten Dokumentkomplexes . Der , Edge- link λ verweist zweckmäßig nicht direkt in die Ausgangsdatenmenge, da die entsprechende Kante nicht immer eine real exis- tierende Beziehung, sondern eine Zusammenfassung mehrerer solcher Beziehungen darstellt. Der Link öffnet daher zweck- mässig die interaktive HTML-Fassung der überblicksabbildung, von deren Einzelquadranten man dann in die Ausgangsdatenmenge navigieren kann.

6.3. Erzeugung der Bildmatrix

Sind die , Edgelabels' für Kantenwerte gleich eins sowie grö- ßer als eins fertig erstellt, erfolgt die Anreicherung der Matrizen mit den , Edgelabels' mit Hilfe von mehreren Makros. Die ersten beiden Makros ersetzen den Namen der Kante in der Matrixzelle durch die HTML-Tabellenzelle. Das dritte Makro erzeugt die HTML-überblickstafeln und das vierte erzeugt die entsprechenden Bilddateien.

Die angereicherte Matrix kann in der Folge aus der Tabellenkalkulation z.B. mit einem guten HTML-Editor (wie z. B. Adobe Dreamweaver™) in eine HTML Datei importiert werden und im Browser als Bildmatrix angezeigt werden.

Ein Vorteil des beschriebenen Vorgehens ist, dass die Matrix nach der Anreicherung in der Tabellenkalkulation ihre ursprüngliche Form behält, das heißt dass jede gefüllte Zelle auch nach der Anreicherung mit den Edgelabels als schwarzes

Kästchen erscheint. Dadurch lässt sich die Matrix auch in angereicherter Form leicht bearbeiten und schnell in eine Bildmatrix umwandeln.

Alternativ zu dieser relativ statischen Kodierung der Matrix in einer Tabellenkalkulation sowie der Bildmatrix in HTML ist es mit möglich, die überblicksabbildungen oder die entsprechenden Detailmatrizen mehrfacher Kanten innerhalb der (Bild) Matrix in interaktiver Form vorzuhalten. Dadurch wäre nicht nur eine komfortablere Verbindung zur Ausgangsdatenmenge garantiert; möglich wird dadurch auch eine komfortablere Bearbeitung der Datenmenge wie z.B. das Mergen doppelter Einträge sowie die Vergabe von Links zwischen den einzelnen an-

gezeigten Knoten durch , klicken und ziehen λ bzw. , zeigen und klicken" .

6.4. Zoomen der Matrix (skalieren)

Ein wichtiges Problem bei der Herstellung passender Bildmatrizen zur Analyse von Netzwerken klassifizierter Bilddokumente ist die Auswahl von sinnvollen Zusammenfassungen der ggf. hierarchischen bzw. gruppierten Klassifikationen sowie der ggf. entsprechend unterteilten Bilddokumente selbst. Die Wahl der jeweiligen Zusammenfassung bestimmt dabei die mögliche Größe der Matrix (Figur 15) :

Stehen in einer Matrix alle direkt verlinkten Knoten der Klassifikation bzw. der Dokumente (lokal) für sich, so beanspruchen große Knotenkomplexe mit zahlreichen verlinkten Einzelknoten gegebenenfalls mehrere hundert oder gar tausend Spalten oder Zeilen. Fasst man die Klassifikationskriterienbzw. Dokumentkomplexe hingegen jeweils auf die größtmögliche (globale) Einheit zusammen, so nimmt jeder Komplex nur eine einzige Zeile ein.

Eine Matrix, in der die Dokumente ausschließlich lokal abgebildet werden, würde im Fall einer Datenmenge mit 10 OOO Klassifikationslinks bis zu 10 λ 000 Dokumentzeilen umfassen und wäre daher für eine direkte menschliche Interaktion nicht nützlich. Darüber hinaus wäre es in einer solchen Matrix unmöglich, Bereiche sinnvoller Dichte für eine Bildmatrix zu erzeugen, da ein Großteil der Zeilen in der Regel nur eine einzige oder sehr wenige gefüllte Zellen enthalten würde. Eine Matrix in der die Dokumente ausschließlich global abgebildet werden verhindert andererseits zahlreiche Detailfragen, da in vielen Zellen so viele Links zusammengefasst werden,

dass ein sinnvoller Vergleich durch ein zu viel an Dichte verhindert wird.

Problematisch erscheint die globale Zusammenfassung vor allem bei überblickswerken wie Ausstellungskatalogen oder kunstwissenschaftlichen Corpuswerken, in denen beispielsweise nicht nur ein Dokument (z.B. ein Stadtplan) mit verschiedenen Klassifikationen (z.B. verschiedenen Monumentdarstellungen) enthalten ist, sondern mehrere hundert derselben. In einer ent- sprechend global zusammengefassten Zeile, würden hier hunderte gleichartig klassifizierte Darstellungen (z.B. eines einzigen Monuments) in einer einzigen Matrixzelle versammelt - ein Faktum, das aus übersichtsgründen genauso wenig sinnvoll erscheint wie die Aufspreizung auf die lokalen Knoten.

Eine mögliche Lösung beider Probleme liegt, sofern Dokumente und Klassifikationen mehrstufig hierarchisch unterteilt sind, in der Einführung von metalokalen Einheiten (d.h. z.B. Buch/Kapitel/Stelle statt Buch/Stelle) . Die metalokale Ein- heit, und damit die mehrstufig-hierarchische Unterteilung von Dokumenten in geisteswissenschaftlichen Datenbanken als Ganzes, findet hier ihren primären Zweck.

Die metalokale Einheit begegnet in der Bildmatrix (wie in je- der anderen Anzeigeform der Daten) sowohl der zu starken globalen Zusammenfassung, wie auch der zu starken lokalen Fragmentierung.

Im Fall von umfangreichen Katalogen oder Corpuswerken können so beispielsweise die einzelnen Katalogeinträge innerhalb der Publikation zusammengefasst werden: Folglich sind auch detailliertere Fragen, wie etwa die nach der Klassifikation einzelner Katalogeinträge im direkten visuellen Vergleich möglich.

Im großen Stil angewendet führt die Einführung entsprechender metalokaler Einheiten zu Bildmatrizen, deren Umfang sich einerseits für das menschliche Auge im erträglichen Rahmen hält, in denen aber andererseits auch dokumentinterne Detailfragen im Rahmen der weiteren Analyse möglich sind. Zu Beginn der Analyse erscheint es in der Regel sinnvoll, die lokale Abbildung der Klassifikation, einer soweit sinnvollen metalokalen Zusammenfassung der Dokumente gegenüber zu stellen.

Prinzipiell gilt die Faustregel, dass man im Zweifelsfall eher auf die vorträgliche Zusammenfassung zu metalokalen Einheiten verzichten sollte, da einzelne zusammengehörige Einträge auch später in der Matrix sinnvoll gruppiert werden können. Es reicht daher aus, nur so viele metalokale Zusammenfassungen zu hinterlegen, dass eine sinnvolle Ausgangs- grösse der Matrix entsteht. Weitere sinnvolle metalokale Einheiten werden eventuell später, im Rahmen der Analyse erkannt und hinterlegt.

Das Zoomen der Matrix geschieht diesem Vorgehen folgend in diskreten Schritten:

Zunächst werden sinnvolle Gruppierungen und Fragmentierungen im Rahmen der Analyse in der Ausgangsdatenmenge hinterlegt.

Zugänglich werden die neuen metalokalen Einheiten in der folgenden Generation von Matrizen (refresh) .

Alternativ ist es möglich, diesen diskreten, schrittweisen Ablauf zu verflüssigen, in dem man am Rand der Matrix die ggf. vorhandene Baumstruktur der Klassifikation wie der Dokumente vollständig dynamisch zugänglich macht, ähnlich wie die Verzeichnisstruktur im Dateiexplorer eines Betriebssystems (vgl. Figur 16, die in Figur 16 verwendeten Bildzeichen kön-

nen Gegenstand registrierter Marken sein.). Wie im Windows Explorer™ oder im Mac Finder™ ist es so möglich, durch auffalten und schließen auch in ausgewählten Bereichen der Matrix zu zoomen.

Sinnvoll ist eine Implementierung in dieser Form vor allem dann, wenn sowohl die Klassifizierungskriterien, wie auch die Unterteilung der klassifizierten Dokumente selbst der Form von strengen Bäumen im Sinne der Graphentheorie entsprechen und diese Bäume nicht durch Permutation der Teile aufgebrochen werden sollen (vgl. Vorteil 1).

7. Weitere Vorteile der Erfindung

Vorteil 1: Erleichterter Umgang mit der Ambivalenz der höheren Einheit:

In der Bildmatrix simultan sichtbare Bildinformation erlaubt das Erkennen und Herstellen sinnvoller Sortierungen bzw. Gruppierungen (Permutationen) mehrerer Einzelknoten und Knotenkomplexe. Dabei ist es möglich mit der mehr oder weniger vorhandenen Subjektivität der Unterteilung der Klassifikationskriterien bzw. der Gegenstände selbst zu spielen. Die Wurzeln der ggf. vorhandenen strengen Knotenbäume werden zu die- sem Zweck virtuell abgeschnitten. Information kann in der

Folge anders sortiert werden und zu alternativen sinnvollen Einheiten zusammengefasst werden. Dabei entstehen neue sinnvolle Gruppierungen von Knoten, die nicht zwingend an der üblichen physikalischen Aufteilung der repräsentierten Gegens- tände orientiert sind (z.B. Zeichnungen eines Künstlers aus verschiedenen Sammlungen, ein anzunehmendes Rekonstruktionsprojekt oder dgl . ) .

Die gefundenen Gruppierungen werden zunächst durch Permutation in der (Bild) Matrix zusammengestellt. Die visuellen Eigenschaften der Bildmatrix wirken sich im Rahmen dieses Vorgangs besonders bei manueller Permutation vorteilhaft aus, da man das Sortierkriterium stets vor Augen hat.

Durch Begrenzungslinien werden die zusammengestellten Gruppierungen direkt in der (Bild) Matrix gekennzeichnet. Alternativ können sie aber auch als , kognitive Konzepte λ (d.h. z.B. als virtuelle Gegenstände) fest in die Ausgangsdatenmenge eingebunden werden. Die , kognitiven Konzepte λ werden als Menge von verlinkten Aliasknoten hinterlegt und repräsentieren im weiteren Gebrauch als virtuelle (Bild) Dokumente die neu gefundenen Gruppierungen. So bieten sie eine Alternative zur gegebenen physikalischen Ordnung ohne diese zu zerstören. Unabhängige , kognitive Konzepte λ nach dieser Definition können auch dazu dienen, die oben besprochenen Montagen in der Ausgangsdatenmenge zu hinterlegen.

Vorteil 2: Einfachere Annäherung an die Begründung der Korrelation von (Bild) Dokumenten:

Mögliche Gründe für die ähnlichkeit von visuellen Gegenständen sind: a) direkte Abhängigkeit, b) indirekte Abhängigkeit, c) äußere Gründe (etwa ein prominenter Aussichtspunkt im Fall von sich gleichenden Landschaftsbildern) oder d) der Zufall.

Der Zufall kann umso leichter ausgeschlossen werden, je stärker die Korrelation der sich gleichenden visuellen Gegenstän- de ist. Alle anderen Ursachen sind in der Regel wesentlich schwerer zu unterscheiden. Die Bildmatrix erweist sich dabei aufgrund der enthaltenen Bildinformation, aufgrund der zweidimensionalen Matrixordnung sowie aufgrund ihrer Permutier- barkeit als extrem nützliches Werkzeug.

Erkannte direkte Abhängigkeiten (Tradierungsereignisse) oder auch andere genauer spezifizierbare Beziehung zwischen zwei Abbildungen können in der Bildmatrix beispielsweise durch Einzeichnen von Linkpfeilen (z.B. durch , klicken und ziehen' mit der Maus) hinterlegt werden. Bei entsprechender Implementierung kann die Bildmatrix so als komfortable Benutzeroberfläche zur Bearbeitung der Ausgangsdatenmenge dienen.

Vorteil 3: Extraktion von zeitgebundenen Phänomenen bezüglich der Gegenstände wie der Klassifizierungskriterien:

Sind Gegenstände wie im oben besprochenen Beispiel nachantike (Bild) dokumente, die Klassifikationskriterien hingengen anti- ke Monumente, so ergibt sich eine vereinheitlichte Herangehensweise an Kunstgeschichte und Klassische Archäologie. Kunstgeschichte widmet sich den zeitgebundenen Phänomenen der (Bild) Dokumente anhand der Klassifikationskriterien. Klassische Archäologie widmet sich den zeitgebundenen Phänomenen der Klassifikationskriterien anhand der (Bild) Dokumente .

Die Bildmatrix dient dabei folgenden Zwecken:

a) Extraktion der Geschichte der Gegenstände bzw. der Klassi- fikationskriterien (Storytelling) . Beispiele sind die Entwicklung von Handskizzenbüchern oder die Mikrogeschichte eines Gebäudeteils.

b) Visuelle Kontrolle, ob die beim Filtern der Matrix ausge- wählten Klassifikationen tatsächlich für die Fragestellung relevant sind (Relevanzkontrolle) .

c) Im Fall der Geschichte der Klassifikationskriterien dient die Bildmatrix dem Ausschluss abhängiger Darstellungen, da

hier nur die jeweils erste Darstellung einer Reihe voneinander kopierten Darstellungen von Relevanz ist. Als Ausschlusskriterium dienen direkte Abhängigkeiten, die u.a. erst in der Bildmatrix zu Tage treten (vgl. Vorteil 4).

d) Verbesserung der relativen Datierung von unscharf oder gar nicht datierten Gegenständen. Vage datierte Knoten (z.B. mit Datierung ,17. Jahrhundert * oder mit terminus ante oder post) können anhand der im überblick vorhandenen Bildinformation genauer eingeordnet werden.

Vorteil 4: Einfachere Beantwortung von impliziten visuellen Detailfragen:

Da in der Bildmatrix mehrere, nach gleichen Kriterien klassifizierte Gegenstände auf einen Blick verglichen werden können, ist es auch möglich, nicht klassifizierte, d.h. implizite, nicht wörtlich in der Klassifikation explizite Details der Gegenstände zu untersuchen.

Bei historischen (Bild) Dokumenten, die nach gezeigtem Monument klassifiziert sind, ist es so z.B. möglich, die Geschichte eines bestimmten Fensters in einer Wand abzulesen, ohne dass das Fenster explizit Teil der Klassifikationskrite- rien ist.

Generell sind visuelle Detailfragen in dieser Form speziell dann sinnvoll, wenn das übergeordnete Klassifikationskriterium ebenfalls von visueller Art ist.

Vorteil 5: Erleichterung von Datenanalyse und -revision:

Die Bildmatrix erleichtert die Datenanalyse und -revision, da beispielsweise doppelte, aber unterschiedlich benannte sowie

unidentifizierte Gegenstände durch Augenschein erkannt und ggf. geraergt oder anderweitig in Beziehung gesetzt werden können. Sind die Klassifizierungskriterien visueller Art, sammeln sich entsprechende Kandidaten automatisch in densel- ben Matrixspalten bzw. -zeilen.

8. Weitere Anwendungen der Erfindung

Als weitere Anwendungen der Erfindung kommen zum Beispiel in Betracht:

(a) Applikationen zur Analyse komplexer Datenmengen;

(b) Verwaltung und Verarbeitung von (visuellen) Zitatedaten (in diesem Zusammenhang erleichtert das Verfahren auch die bibliometrische Qualitätssicherung) ;

(c) Bild- und Kunstwissenschaften, insbesondere im Bereich von Rezeption, Tradierung und Memnosyne. Zusätzlich erweist sich das Verfahren hier auch sehr nützlich bei der relativen Datierung von unscharf eingeordneten Objekten (Barockmalerei, Zeichnungen, Archäologie u. dgl . ) ;

(d) Sicherung des Urheberrechts an Bildern;

(e) Datenverarbeitung bei bildgebenden Verfahren in der Medizin (etwa bei der simultanen Beobachtung der Entwicklung gleichartiger Krebsmetastasen im Kontext mehrerer Patienten und/oder Organe) , der Biologie (Erforschung der Phylogenie der Arten sowie der Evolution im Allgemeinen) , der Kunstwissenschaft (Erschließung visueller ähnlichkeit von Einzelgegenständen) oder in anderen technischen Bereichen, z. B. der Luftaufklärung (simultane Darstellung von Luftbildsequenzen mehrerer Lokationen) ; und

(f) Verwaltung von implizit oder explizit klassifizierten Bilddatenmengen (implizit: Bildsuchmaschinen; explizit z.B. mit Tags und Clustern) .

Die in der vorstehenden Beschreibung, den Zeichnungen und den Ansprüchen offenbarten Merkmale der Erfindung können einzeln oder auch in Kombination für die Verwirklichung der Erfindung in ihren verschiedenen Ausgestaltungen von Bedeutung sein.