Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SYSTEM FOR PROCESSING, ANALYSING AND DOCUMENTING LABORATORY DATA
Document Type and Number:
WIPO Patent Application WO/2002/071302
Kind Code:
A2
Abstract:
The invention relates to a system for processing, analysing and documenting molecular biological laboratory processes, comprising the following: an editing programme (E) with text, table and graphic functions, a process and database interface (tool integration layer, TIL) for connecting the editing tool to pre-engineered electronic processing and analysis tools (T1 to TN) and/or laboratory equipment and/or selected databases (DB¿pub?, DB¿priv?) comprising a molecular biological data stock and an encryption and authentication mechanism (CAM) for encoding the unprocessed laboratory data and/or processed and analysed laboratory data to produce final, legally compliant documentation.

Inventors:
MEHMANECHE HOMAYOUN (DE)
STEIPE BORIS (CA)
ZENDLER ANDREAS (DE)
MEHMANESH HAMARZ (DE)
Application Number:
PCT/EP2002/002472
Publication Date:
September 12, 2002
Filing Date:
March 06, 2002
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
HELIX INFORMATICS AG (DE)
MEHMANECHE HOMAYOUN (DE)
STEIPE BORIS (CA)
ZENDLER ANDREAS (DE)
MEHMANESH HAMARZ (DE)
International Classes:
G16B50/40; G16B45/00; G06F19/00; G16B50/30; (IPC1-7): G06F19/00
Foreign References:
US5859972A1999-01-12
Other References:
MYERS J D ET AL: "Electronic laboratory notebooks for collaborative research" ENABLING TECHNOLOGIES: INFRASTRUCTURE FOR COLLABORATIVE ENTERPRISES, 1996. PROCEEDINGS OF THE 5TH WORKSHOP ON STANFORD, CA, USA 19-21 JUNE 1996, LOS ALAMITOS, CA, USA,IEEE COMPUT. SOC, US, 19. Juni 1996 (1996-06-19), Seiten 47-51, XP010199809 ISBN: 0-8186-7446-6
QUARDOKUS E: "SOFTWARE: Keeping Track of Bases" SCIENCE, Bd. 287, 18. Februar 2000 (2000-02-18), Seiten 1224-1225, XP002259968
COZZA S. ET AL: "System Design of the Genome Topographer" 1996 DOE HUMAN GENOME PROGRAM CONTRACTOR-GRANTEE WORKSHOP V, [Online] 1. Februar 1996 (1996-02-01), XP002259969 New Mexico Gefunden im Internet: [gefunden am 2003-10-31]
SCHEETZ T E ET AL: "GenoMap: A distributed system for unifying genotyping and genetic linkage analysis" PARALLEL COMPUTING, ELSEVIER PUBLISHERS, AMSTERDAM, NL, Bd. 24, Nr. 9-10, 1. September 1998 (1998-09-01), Seiten 1567-1592, XP004148111 ISSN: 0167-8191
JASON WANG ET AL: "Pattern Discovery in Biomolecular Data" PATTERN DISCOVERY IN BIOMOLECULAR DATA: TOOLS, TECHNIQUES, AND APPLICATIONS, NEW YORK: OXFORD UNIVERSITY PRESS, US, 1999, Seite 161,165,172,175 XP002168720 ISBN: 0-19-511940-1
Attorney, Agent or Firm:
Heinze, Ekkehard (Bolte & Partner Postfach 86 06 24, München, DE)
Download PDF:
Claims:
Patentansprüche
1. System zur Labordatenbearbeitung, analyse unddokumenta tion molekularbiologischer Laborprozesse, welches umfaßt : ein Editierprogramm (E) mit Text, Tabellenund Grafik Funktionalität, eine Prozeßund DatenbasisSchnittstelle (TIL) zur Ver bindung des Editierwerkzeuges mit vorgefertigten elektro nischen Bearbeitungsund Analysewerkzeugen (T1 bis Tn) und/oder Laborgeräten und/oder ausgewählten Datenbanken (DBpUt, DBpriv) mit molekularbiologischem Datenbestand und einen Verschlüsselungsund Authentisierungsmechanismus (CAM) zur Codierung der RohLabordaten und/oder bearbeite ten und analysierten Labordaten zur endgültigen, gerichts festen Dokumentation.
2. System nach Anspruch 1, dadurch gekennzeichnet, daß das Editierprogramm (E) als auf InternetProtokoll, insbe sondere HTTP/HTML oder XML, basierendes LaborjournalWerk zeug mit den Grundfunktionen Speicherung von Texten und Grafiken, Herstellung von Querverweisen zu molekularbiologischen Ex perimenten und deren Bestandteilen, Einbindung von molekularbiologischen Daten als Querverwei se und Prüfung der Konsistenz von gleichartigen Daten aus unter schiedlichen Quellen (DBpub/DBpriv) ausgebildet ist.
3. System nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Prozeßund DatenbasisSchnittstelle (TIL) zum Mapping von Softwareschemata auf einer gemeinsamen Datenmodellba sis und zur Anbindung von fremdfabrizierter Software an das Editierwerkzeug (E) ausgebildet ist.
4. System nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß die Prozeßund DatenbasisSchnittstelle (TIL) gemäß dem InternetProtokoll zur Verknüpfung des Editierprogramms (E) mit einer vorbestimmten Auswahl von Datenbasen (DBpub, DBpriv) im Internet und/oder mindestens einem Intranet und zur mindestens indirekten Verknüpfung mit LabordatenEr zeugungseinrichtungen (LDG), insbesondere Labormeß/aus wertungsgeräten in Echtzeit oder QuasiEchtzeitDatenüber tragung, ausgebildet ist.
5. System nach Anspruch 4, dadurch gekennzeichnet, daß die Prozeßund DatenbasisSchnittstelle (TIL) eine Zu griffssteuerung zur haltautomatischen Generierung von, insbesondere wahlweise wiederholten, Datenbankabfragen aufweist.
6. System nach einem der vorangehenden Ansprüche dadurch gekennzeichnet, daß der Verschlüsselungsund Authentisierungsmechanismus (CAM) zur Realisierung von Zeitstempelund/oder elektro nischen Signaturfunktionen ausgebildet ist.
7. System nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß der Verschlüsselungsund Authentisierungsmechanismus (CAM) mit Mitteln zur Authentisierungsprüfung der System nutzer, insbesondere aufgrund biometrischer Daten und/oder auf Paßwortbasis, und wahlweise vorbestimmter Nutzergrup pen auf Paßwortbasis aufweist.
8. System nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß der Verschlüsselungsund Authentisierungsmechanismus (CAM) zur Realisierung von Testierungen durch ausgewählte, spezifisch berechtigte Systemnutzer unter Prüfung von de ren Authentisierungen ausgebildet ist.
9. System nach einem der vorangehenden Ansprüche, gekennzeichnet durch eine mit dem Editierprogramm (E) und der Datenbasis Schnittstelle (IFD) verbundene, auf bioinformatische Pro blemstellungen adaptierte DatenbankManagementeinrichtung (DBMS) zur Bereitstellung folgender Datenmodelle : biologisches Metamodell für Daten aus öffentlichen Da tenbasen, insbesondere über das Sequenz Retrival System, Datenmodell für die Verwaltung von internen Labordaten der Systemnutzer, gemeinsames Datenmodell für die Integration von bioin formatischen Werkzeugen, Datenmodell für Zugriffsrechte.
10. System nach Anspruch 9, dadurch gekennzeichnet, daß die DatenbankManagementeinrichtung (DBMS) mit dem Verschlüsselungsund Authentisierungsmechanismus (CAM) verknüpft ist und derart zusammenwirkt, daß durch geeigne te Verschlüsselung der jeweiligen Datenaustauschvorgänge sämtliche Datenbankzugriffe jedes Systemnutzers anderen Systemnutzern verborgen bleiben.
11. System nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß das Editierprogramm (E) zur Registrierung von Einträgen in Zuordnung zu vorab durch Systemnutzer odernutzergruppen spezifizierte molekularbiologische Experimente ausgebildet ist, wobei jeder Eintrag wahlweise Textund/oder Grafik daten und/oder Querverweise aufweisen kann.
12. System nach einem der vorangehenden Ansprüche, gekennzeichnet durch eine zur Lösung molekularbiologischer Probleme ausgebilde te Process Engine (PE) mit mindestens folgenden Funktio nen : Unterstützung von Prozessen, Subprozessen, Prozeßpara llelität und Prozeßverzweigungen sowie Prozeßkontrolle, Unterstützung von Checkin/CheckoutVerfahren, Bereitstellung von molekularbiologischen Protokollen.
13. System nach einem der vorangehenden Ansprüche, gekennzeichnet durch eine Implementierung mit Servletund JSPMitteln und auf SQLDatenbasisGrundlage.
Description:
System zur Labordatenbearbeitung, -analyse und-dokumentation Beschreibung Die Erfindung betrifft ein System zur Labordatenbearbeitung, -analyse und-dokumentation molekularbiologischer Labor-und Bioinformatikprozesse.

In der Life-Science-Branche (Biotechnologie Start-ups, pharma- zeutische Unternehmen, Lebensmitteltechnologie-Unternehmen, me- dizinische und agrarwirtschaftliche Unternehmen spielt die Ge- winnung, Verwaltung und Auswertung (Analyse, Synthese und In- terpretation) von Daten eine zentrale Rolle. Dafür sind eine Vielzahl von Arbeitsschritten notwendig, die oftmals noch ein- zeln, manuell und isoliert von Prozessen durchgeführt werden.

Für die Durchführung der Arbeitsschritte stehen zwar eine Menge von Laborgeräten, eine Masse von Computerprogrammen (Software- programme wie z. B. Such-, Vergleichs-, Vorhersage-, Data Mi- ning-Programme) und eine Vielzahl öffentlicher Datenbanken (z. B. Nukleinsäuren-, Protein-, Strukturdatenbanken) zur Ver- fügung, die allerdings nicht optimal eingesetzt werden und nur ungenügend zusammenarbeiten.

Die Aufgabe der Bioinformatik im engeren Sinne wird meist als "Sequenzannotation"beschrieben-die Kommentierung biologi- scher Sequenzen durch Datenbankinformation. Schon im Ansatz wird dabei der Nachteil der problemorientierten Betrachtungs- weise deutlich. Das Ergebnis der Sequenzannotation ist eine Menge von Daten höchst unterschiedlicher Qualität und Aussage- kraft, mit deren Interpretation der Biowissenschaftler in der Regel allein gelassen wird.

Für die molekularbiologische Forschung steht eine Vielzahl von biologischen Datenbanken zur Verfügung. Die Gesamtzahl dürfte bei etwa 400 liegen. Dabei umfaßt das Spektrum Datenbanken, de- ren Aufgabe die globale, aktuelle, vollständige Erfassung bio-

logischer Sequenzen ist, ebenso wie private Sammlungen, die nur für Spezialisten von Interesse sind. Zu den großen, öffentli- chen Datenbanken gehören die Datenbanken für Nukleinsäurese- quenzen am NCBI (National Centre for Biotechnology Information, USA) und EBI (European Bioinformatics Institute, Cambridge) so- wie die Datenbanken für Proteinsequenzen der Gruppe PIR-Inter- national (NBRF, Washington D. C., MIPS, Martinsried und JIPID, Tokio) und SwissProt (Genf). Diese für die Molekularbiologie grundlegenden Datenbanken bieten Zugriffsmöglichkeiten über das Internet.

Erhebliche Probleme für die Benutzer bereiten allerdings die Heterogenität und die Inkompatibilität von Datenformaten und -typen sowie die inhomogenen Zugriffsmöglichkeiten auf die bio- logischen Datenbanken.

Das Sequence Retrieval System (SRS), dessen Schnittstelle ver- öffentlicht und auch implementiert erhältlich ist, stellt eine gute Alternative dar, um das Problem der inhomogenen Zugriffs- möglichkeiten zu lösen. Allerdings gibt es kein konsequent durchformuliertes Datenmodell, das für die prozeßorientierte Weiterverarbeitung der biologischen Daten bereitstünde.

Für die Durchführung der Arbeitsschritte in einem Labor stehen außerdem eine Vielzahl von Geräten der instrumentellen Analytik wie z. B.

- Chromatographen, - Massenspektrometern, - elektrophoretische Instrumente zur Verfügung, die allerdings nicht in Gesamtprozessen integ- riert sind und nur ungenügend mit anderen Laborgeräten, Soft- wareprogrammen und bioinformatischen Prozessen zusammenarbei- ten.

Für die molekularbiologische Forschung steht außerdem eine fast nicht überschaubare Anzahl von frei zugänglichen Softwarepro- grammen (bioinformatischen Softwarewerkzeugen) bereit, die in folgende Kategorien eingeteilt werden können : - Suchprogramme, - Analyse von DNA-und RNA-Sequenzen, - Analyse von Proteinen, Enzymen und Aminosäuresequenzen, - Vorhersage von Proteinstrukturen, - Analyse von Protein-Interaktionen, - Analyse von Protein-Liganden-Interaktionen, - QSAR-Programme,<BR> - Dockingprogramme.

Die National Biotechnology Information Facility (NBIF) führt mehr als 200 WWW-Links auf, die auf sehr interessante FreeWare- und ShareWare-Softwareprogramme verweisen. Der BioCat-Liste von EBI (European Bioinformatics Institute) zufolge sind es sogar über 500 Softwareprogramme. Diese Programme können zum größten Teil über das Internet kostenlos benutzt und auch bezogen wer- den.

Es ist allerdings darauf hinzuweisen, daß die unüberschaubare Vielfalt und Heterogenität ein Problem darstellt und kein Vor- teil ist : Der Wissenschaftler im Labor hat weder die Zeit, sich mit den Softwareprogrammen im einzelnen zu beschäftigen, noch sich überhaupt einen Überblick zu erarbeiten. Und bei dem Tem- po, mit dem neue Datenbanken und Analyseverfahren hinzukommen, kann sich nur der Spezialist sicher sein, daß ein bestimmtes Verfahren überhaupt noch"state-of-the-art"ist.

Den frei zugänglichen Softwareprogrammen stehen Programme ge- genüber, die kommerziell von Unternehmen als Produkte vertrie- ben werden.

Die Benutzung von bioinformatischen Softwareprogrammen, sei es in der kommerziellen molekularbiologischen Forschung oder in universitären Forschungseinrichtungen, leidet nicht nur unter

der mangelnden Interoperabilität der Programme untereinander, sondern auch an mangelnder Integration mit Laborgeräten und Programmen für die Zugriffe auf genomische Datenbanken.

Folgende Unzulänglichkeiten sind festzustellen : Fehlende Integration, Ablaufsteuerung und Dokumentation von Bioinformatik-und Laborprozessen, Mangelhafte Daten-und Prozeßintegration von Geräten der instrumentellen Analytik, * Mangelhafte Daten-und Prozeßintegration von Computerpro- grammen, Mangelhafte Daten-und Prozeßintegration von Geräten und Computerprogrammen, Umständliche und zeitaufwändige Recherchemöglichkeiten, Schwer zu bedienende Benutzungsoberflächen, Ungenügende Sicherheit (Authentifizierung, Verschlüsselung), Manuelle Führung von Laborjournalen.

Im molekularbiologischen Laboralltag spielt das Führen von so- genannten Laborjournalen eine besonders wichtige Rolle. In sol- chen Laborjournalen werden alle wesentlichen Bestandteile (Ver- suchsplan, Ausgangsdaten, Materialien, Methoden, Probenzusam- mensetzungen, Durchführung, Ergebnisse, Schlußfolgerungen) von molekularbiologischen Experimenten dokumentiert. Die Protokol- lierung dient dem Experimentator nicht nur als Gedächtnisstüt- ze ; sie kann wichtig sein, um den Ursachen unerwarteter Ergeb- nisse nachzuspüren, und sie gilt sogar als Urkunde bei Priori- tätsfragen vor dem Patentgericht. Labor-Journale werden heute noch von Hand geführt. Weniger geeignet sind solche Journale für den Austausch von Daten oder zur Verwaltung von Daten. Häu- fig wird auf elektronische Dateien Bezug genommen, die dann aber an unterschiedlichen Orten abgelegt sind. In den manuell

geführten Labor-Journalen kann folglich auch nicht nach Begrif- fen elektronisch gesucht werden.

Molekularbiologische Laborprozesse können aus wenigen, einfa- chen Arbeitsschritten bestehen oder basieren auf komplexen Pro- tokollen mit vielen, unterschiedlichen Arbeitsschritten. Zum Teil werden diese Arbeitsschritte von bioinformatischen Softwa- reprogrammen unterstützt. Für die effiziente und effektive Pro- jektplanung und-abwicklung im molekularbiologischen Labor wer- den folgende Aspekte allerdings nur ungenügend softwaremäßig unterstützt : * Bereitstellung einer Integrationsplattform mit elektroni- schem Laborjournal, Integration der von Laborgeräten und Computerprogramme er- zeugten Daten über Prozesse der Bioinformatik und der Labor- automatisierung, Integration der Bioinformatik-und Laborprozesse, Einfache Recherche-und Wiederauffindungsmöglichkeiten auf externe und interne Datenbanken, Einfach zu bedienende Benutzungsoberfläche über das inte- grierte Laborjournal, Mechanismen für Sicherheit (Authentifizierung, Verschlüsse- lung), Bereitstellung von vordefinierten und qualitätsgesicherten Bioinformatikprozessen, Dokumentation von Arbeitsschritten zum Zwecke der Nachvoll- ziehbarkeit, Rückverfolgung (Tracking) von einzelnen Arbeitsschritten/Me- thoden, Versionierung von Ergebnissen aus Bioinformatik-und Labor- prozessen, Unterstützung von Teamarbeit.

Mit Hilfe von Fig. 1 lassen sich die bisherigen Feststellungen zusammenfassen : 1. Es gibt eine Vielzahl biologischer Datenbanken (öffentliche und private Datenbanken), deren Daten über das Internet zu- gänglich sind. Das Sequence Retrieval System (SRS) bietet die Möglichkeit, auf die Vielzahl der Datenbanken über eine einheitliche Oberfläche zuzugreifen.

2. Es gibt eine Vielzahl von Laborgeräten, deren Integration in Laborprozessen eine wichtige Voraussetzung für die La- borautomatisierung ist.

3. Es gibt eine Vielzahl von bioinformatischen Softwarepro- grammen, die als FreeWare, ShareWare oder kommerzielle Pro- dukte zur Verfügung stehen.

4. ungelöste Probleme sind : die Integration molekularbiologischer Daten, das Fehlen von Software für das Führen von Laborjourna- len, die Herstellung der Interoperabilität zwischen Laborgerä- ten, bioinformatischen Softwareprogrammen und Zugriffe auf bioinformatische Datenbanken, die Integration, Automatisierung und Dokumentation von Laborprozessen.

Der Erfindung liegt nach obigem die Aufgabe zugrunde, ein ver- bessertes System zur Labordatenbearbeitung, -analyse und - dokumentation molekularbiologischer Laborprozesse anzugeben, welches dem Wissenschaftler den Umgang mit seinen Labordaten erleichtert und die effiziente Nutzung der zahlreichen verfüg- baren Datenbasen, Laborgeräte und Softwareprogramme im Kontext einer verläßlichen und gerichtsfesten Datendokumenation si- chert.

Diese Aufgabe wird durch ein System mit dem Merkmalen des An- spruchs 1 gelöst.

Die Erfindung schließt den wesentlichen Gedanken ein, als uni- verselles Hilfsmittel für die molekularbiologische Forschung und in deren Kontext stehende Produktentwicklung ein modular aufgebautes Bioinformatiksystem mit integrierten Softwarepro- gramm (Tool)- und Schnittstellen (Interface) -Funktionen bereitzu- stellen. Sie schließt weiter den Gedanken ein, mindestens eine Prozeß-sowie eine Datenbasis-Schnittstelle an ein elektroni- sches Editierprogramm als Basisprogramm zur Erstellung von an- forderungsgerechten Laborjournalen anzubinden. Letztlich gehört zu diesem System ein Verschlüsselungs-und Authentisierungsme- chanismus, der die Erfüllung der bestehenden Sicherheitsanfor- derungen beim Umgang mit den Roh-Labordaten und bei der ge- richtsfesten Dokumentation der Arbeitsergebnisse sicherstellt.

Das elektronische Editierprogramm bzw.-werkzeug hat neben den Grundfunktionen der Speicherung von Texten und Grafiken insbe- sondere die Funktion der Herstellung von Querverweisen zu mole- kularbiologischen Experimenten und deren Bestandteilen, der Einbindung von molekularbiologischen Daten als Querverweise und der Prüfung der Konsistenz von gleichartigen Daten aus unter- schiedlichen Quellen. Es sichert somit eine einfache Einbindung von extern bereitgestelltem Wissen in die Labordokumentation konkreter Arbeitsergebnisse auf einer einheitlichen Plattform.

Besonders vorteilhaft ist angesichts der überragenden Bedeutung des Internet (und daneben auch von auf IP-Protokoll basierenden Intranets) eine IP-konforme Ausgestaltung unter Einsatz der entsprechenden etablierten Programmiersprachen Java, HTML (Hy- perText Markup Language) bzw. XML (Extensible Markup Language).

Das Editierprogramm ist weiterhin bevorzugt zur Registrierung von Einträgen in ein Laborjournal in Zuordnung zu definierten Experimenten ausgebildet, welche vorab durch Systemnutzer oder - nutzergruppen spezifiziert wurden. Die experimentbezogenen Einträge können wahlweise Text-und/oder Grafikdaten und/oder

die oben erwähnten Querverweise umfassen. Das Editierprogramm ist derart ausgebildet, daß die Software plattformunabhängig wird und für den Nutzer minimaler Konfigurationsaufwand ent- steht.

In der Funktion als Prozeß-Schnittstelle ist das vorgeschlagene System zum Mapping von Tool-Schemata auf einer gemeinsamen Da- tenmodellbasis (Common Data Modell) ausgebildet. Es sichert die Anbindung von Laborgeräten und eigenen, sowie fremdfabrizierten (3rd Party) Softwareprogrammen (FreeWare, ShareWare, kommer- zielle Produkte) an das Editierprogramm. Diese Funktionalität ist als Tool Integration Layer zu bezeichnen.

In der Funktion als Datenbasis-Schnittstelle ist das vorge- schlagene System einerseits zur Verknüpfung des Editierprogram- mes mit einer vorbestimmten Auswahl fachlich geeigneter Daten- basen im Internet (öffentlichen Datenbasen) und/oder mindestens einem Intranet (privaten Datenbasen) ausgebildet. Andererseits sichert es die Verknüpfung zur Labordatenerzeugung, insbesonde- re Labormeß-bzw. -auswertungsgeräten. In ihrer Funktion der Verknüpfung zu molekularbiologischen Datenbasen ist der Schnittstelle insbesondere eine Zugriffssteuerung zur halbauto- matischen Generierung von-insbesondere wahlweise wiederholten - Datenbankabfragen zugeordnet. Hierdurch wird dem Nutzer auf- wendige Routinearbeit bei der Einbindung von Datenbasis-Wissen in die Auswertung und Dokumentation der Laborergebnisse abge- nommen.

Der Verschlüsselungs-und Authentisierungsmechanismus des vor- geschlagenen Systems ist in einer bevorzugten Ausführung zur Realisierung von Zeitstempel (Time Stamp) -sowie elektronischen Signaturfunktionen ausgebildet. Die Einbindung dieser (an sich bekannten) Funktionalität in ein System zur Erstellung von mo- lekularbiologischen Laborjournalen sichert in effizienter Weise einerseits die flexible Bearbeitbarkeit der Rohdaten und ande-

rerseits die verläßliche, gerichtsfeste Fixierung der bearbei- teten Daten.

Praktisch obligatorisch sind Mittel zur Authentisierungsprüfung der Systemnutzer, wozu insbesondere Paßworte oder PINs oder ge- gebenenfalls auch biometrische Nutzerdaten eingesetzt werden können. Die Authentisierung und Authentisierungsprüfung ist so- wohl bezogen auf Einzelpersonen als auch auf Nutzergruppen (Forschungsteams, Abteilungen einer Firma oder Belegschaften ganzer Firmen) in differenzierter Weise möglich, wobei das vor- geschlagene System insbesondere ausdrücklich die Vergabe spezi- fischer Berechtigungen vorsieht. Hierzu gehört insbesondere die Berechtigung zur Testierung von Laborjournaleinträgen.

In einer bevorzugten Ausgestaltung der Erfindung umfaßt das System eine mit dem Editierprogramm einerseits und der Datenba- sis-Schnittstelle andererseits verbundene, auf bioinformatische Problemstellungen adaptierte Datenbank-Managementeinrichtung (DBMS) zur Bereitstellung folgender Datenmodelle : - biologisches Metamodell für Daten aus öffentlichen Datenba- sen, insbesondere über das Sequenz Retrival System, - Datenmodell für die Verwaltung von internen Labordaten der Systemnutzer, - gemeinsames Datenmodell für die Integration von Laborgeräten und bioinformatischen Softwareprogrammen, - Datenmodell für Zugriffsrechte.

Diese Datenbank-Managementeinrichtung ist insbesondere mit dem Verschlüsselungs-und Authentisierungsmechanismus verknüpft und wirkt mit diesem in vielfältiger Weise zusammen. Hierzu gehört insbesondere die geeignete Verschlüsselung der jeweiligen Da- tenaustauschvorgänge mit den angesprochenen Datenbanken derart, daß sämtliche Daten jedes Systemnutzers vor ungewollten oder unbefugten Zugriffen geschützt werden. Die Grundfunktionalität ist eine (an sich bekannte) DBMS-Funktionalität, und ein wich-

tiger weiterer Aspekt ist die Verwaltung von Versionen und Va- rianten von Auswertungsergebnissen und anderen Datensätzen. Bei diesem Aspekt handelt es sich mithin im Grunde um ein bioinfor- matisches Repository.

In einer weiter bevorzugten Ausführung hat das System eine so- genannte Process Engine, die speziell an laborspezifische und bioinformatische Problemstellungen adaptiert ist und in ihrer Grundfunktionalität der Unterstützung von Prozessen bzw. Sub- prozessen und der Organisierung von Parallelität und Verzwei- gung von Prozessen sowie von parallelen Ein-und Ausgabevorgän- gen (Multiple Inputs/Outputs) dient. Hierzu gehört auch die Prozeßüberwachung-und-kontrolle typischer molekularbiologi- scher Laborabläufe, ebenso wie die Unterstützung von Check- In/Check-Out-Verfahren. Schließlich leistet die Process Engine die Bereitstellung von spezifisch molekularbiologischen und bioinformatischen Protokollen.

Im folgenden wird ein Prototyp vorgestellt, mit dem einige we- sentliche Funktionen der Erfindung auf Machbarkeit geprüft wur- den. Der Prototyp wird in der Produktversion auf der Basis ei- ner J2EE-Architektur entwickelt, die folgende Vorteile auf- weist : - Plattformunabhängigkeit - Komponentenarchitektur - Verbesserte Kommunikation mit Software Clients - Hohe Performanz und Skalierbarkeit - Investitionsschutz unter Zugrundelegung einer einheitli- chen Komponentenarchitektur - Möglichkeit der verteilten Verarbeitung - Möglichkeit der asynchronen Verarbeitung.

Vorteile und Zweckmäßigkeiten der Erfindung ergeben sich im üb- rigen aus den Unteransprüchen sowie der nachfolgenden Erläute-

rung eines (vorläufigen) Ausführungsbeispiels anhand der Figu- ren. Von diesen zeigen : Fig. 1 eine schematische Darstellung zur Verdeutli- chung des Standes der Technik und der sich daraus ergebenden Probleme, Fig. 2 eine schematische Darstellung zur Illustrati- on des erfindungsgemäßen Systems, Fig. 3 eine schematische Darstellung eines Datenmo- dells eines Prototypen des zum System gehöri- gen Editors und Fig. 4 bis 6 für den Benutzer im Rahmen der Anwendung ei- ner Ausführungsform der Erfindung erscheinen- de Schirmbilder.

In Fig. 1 ist symbolisch der bereits weiter oben erörterte Sachverhalt dargestellt, daß für molekularbiologische Laborpro- zesse bzw. Experimente heute sowohl einschlägige öffentliche Datenbanken DBpub als auch private Datenbanken DBpriv zur Da- tenverarbeitung und Interpretation der Ergebnisse zur Verfügung stehen, auf die über das Sequence Retrival System SRS als ein- heitliche Oberfläche zugegriffen werden kann. Weiterhin stehen für die Forschung auf diesem Gebiet verschiedenartige und nach verschiedenen Formaten bzw. Protokollen aufgebaute Komponenten <BR> <BR> Tl, T2,. .. Tn in Form von FreeWare (T1), ShareWare (T2), kom- merziellen Softwareprodukten (T3), Laborgeräten (T4), Standard Komponenten für alle Anwender (T5), oder Komponenten für einen speziellen Kunden (Tn) zur Verfügung. Diese Komponenten können mit Hilfe von TIL (Tool Integration Layer) in einer einheitli- chen Art und Weise angesprochen werden (siehe auch Fig. 2).

Mit TIL können alle bestehenden Probleme, insbesondere hin- sichtlich der Integration der verfügbaren molekularbiologischen Daten in die Labordateninterpretation und-dokumentation, der Gewährleistung der Interoperatibilität der Softwareprogramme, der Integration molekularbiologischer Laborprozesse mit der Be- reitstellung einer den zahlreichen Anforderungen genügenden Software zur Führung eines Laborbuches (Laborjournals) und Do- kumentation gelöst werden.

In Fig. 2 ist (in einer an Fig. 1 angepaßten Darstellungsweise) eine bevorzugte Struktur des vorgeschlagenen Systems symbolisch dargestellt, dessen Kernstück ein Editierprogramm E zur Erstel- lung eines Laborjournals ist. Diesem ist-worauf weiter oben bereits ausführlicher eingegangen wurde-eine Softwareschicht (Prozeß-Schnittstelle) TIL zur Verknüpfung mit der DB-Zugriffs- schicht SRS und den Softwaretools und Laborgeräten T1 bis Tn zugeordnet. Um diese Komponenten in die Prozesse einbeziehen und mit dem Editierprogramm E bearbeiten zu können, umfaßt das System die Process Engine PE. Letztere ist neben dem Editier- programm E mit der Datenbasis-, Programm-bzw. Geräte-Schnitt- stelle TIL verbunden. Als das Editierprogramm E umgebender "Rahmen"ist symbolisch ein dem gesamten Datenverkehr unterleg- ter Verschlüsselungs-und Authentisierungsmechanismus CAM dar- gestellt. Zu den wesentlichen Funktionen der einzelnen Kompo- nenten wird auf die entsprechende Beschreibung weiter oben ver- wiesen.

Fig. 3 zeigt eine schematische Darstellung wesentlicher Aspekte des einem System-Prototypen gemäß der vorliegenden Erfindung zugrundeliegenden Datenmodells. Der Prototyp realisiert die lo- gische Zielarchitektur und soll wesentliche Funktionen und die prinzipielle Möglichkeit der Dokumentation von Experimenten im Laborbereich darstellen. Hierzu stellt er eine Oberfläche zum Führen sogenannter Laborjournale bereit. Der hier vorgestellte Prototyp soll es ermöglichen, mit Hilfe von Standardtechnolo-

gien elektronisch Laborjournale zu führen. Er hat folgende we- sentliche Funktionen und Vorteile : - Grundfunktionalität : Speicherung von Texten, Tabellen und Graphiken.

- Querverweise : Herstellung von Querverweisen zu molekularbio- logischen Experimenten und deren Bestandteilen.

- Bioinformatikdaten : Einbindung von molekularbiologischen Da- ten als Querverweise, Abfragen von Datenbanken im Internet, Konsistenzchecks von Daten.

- Bioinformatikprotokolle : Zugriffe auf Datenbanken und Unter- stützung bei der prozeßgesteuerten Durchführung von Analysen.

- Plattformunabhängigkeit.

- Keine weiteren Softwareinvestitionen für die Automatisierung beim Kunden sind notwendig.

- Minimaler Konfigurierungsaufwand für die Client-Installation.

- Funktion einer Integrationsschnittstelle.

- Hilfsfunktionen : Timestamp und Testatfunktion, automatische Wiederholung von Datenbankanfragen.

- Multiuserfähigkeit : Es sollen unterschiedliche User das Sys- tem benutzen können. Jeder Benutzer sieht nur seine eigenen Dokumente.

- Authentifizierung : Vor der Benutzung müssen sich User anmel- den.

Die Realisierung des Prototypen erfolgt beispielsweise mit Servlet und JSP-Technologien, im Backend wird die Datenbank Hy- personicSQL eingesetzt und als Webserver dient Tomcat.

Die Hierarchie ist derzeit so aufgebaut, daß jeder User eine Anzahl von Experimenten einsehen kann. Jedem Experiment ist wiederum eine Anzahl von Einträgen untergeordnet. Da ein Ein- trag sowohl Textdaten, als auch Bilder oder Tabellen enthalten kann, werden diese Daten innerhalb eines Binary-Feldes in der Datenbank abgelegt. Der Vorteil liegt darin, daß es nicht nötig

ist, verschiedene Tabellen für unterschiedliche Datentypen an- zulegen.

Sobald ein User einen Laborbucheintrag signiert, wird ein Zeit- stempel generiert und zusammen mit der User-ID in der Tabelle "SIGNATURE"gespeichert. Die Tabelle"Dataentry"enthält die eigentlichen Laborbucheinträge als Binary-Feld. Um die in dem Binary-Feld abgelegten Informationen identifizieren zu können, wird im Feld"TYPE"der Typ der Information abgelegt. Derzeit unterstützt werden TXT für Textdaten, IMG für Bilddaten und TBL für Tabellen.

Das System besteht aus folgenden JSP-Dateien : - addimage. jsp fügt einen Bild-Eintrag ins Laborbuch ein, - addproject. jsp legt ein neues Experiment (Laborbuch) für den User an, - addtable. jsp fügt eine Tabelle zum in das Laborbuch ein, - addtext. jsp fügt einen Texteintrag ins Laborbuch ein, - checklogin. jsp authentifiziert den Benutzer anhand von Login und Paßwort, - delentry. jsp löscht einen Laborbuch-Eintrag aus der Datenbank, - projects. jsp stellt eine Liste aller für einen Benutzer sichtbaren Experi- mente dar, - signentry. jsp das Laborbuch wird hiermit signiert, so daß die bisherigen Einträge nicht mehr verändert werden können, - tableform. jsp stellt das Formular zum erstellen einer Tabelle dar, - textform. jsp stellt das Formular zum anlegen oder ändern eines Texteintrags dar.

Zusätzlich werden folgende Servlets eingesetzt : - ShowImage gibt einen Eintrag der Datenbank als gif-Bild aus, - ShowLabEntry stellt ein Laborbuch mit allen darin enthaltenen Einträgen dar.

Mit den Figuren 4 bis 6 werden Schirmbilder (Screens) für ver- schiedene wesentliche Phasen der Erstellung eines Laborjournals mit einer Ausführungsform des erfindungsgemäßen Systems ge- zeigt. Hierbei zeigt Fig. 4 einen Log-In-Screen, Fig. 5 eine Übersicht über Experimente und Fig. 6 das Schirmbild zum Edi- tieren von Experimenten.

HypersonicSQL muß als Server gestartet werden. Dies geschieht durch einen Aufruf von"C : \hypersonicSQL\demo\runServer. bat".

Nun wird mit % TOMCAT_HOME% \bin\startup. bat der Tomcat-Server gestartet. Das Laborbuch erreicht man unter der Adresse http : //localhost : 8080/examples/bioinf (ACHTUNG : Der Proxy muß abgeschaltet sein).

Im Login-Screen kann sich der Benutzer authentifizieren. In der Testinstallation lautet das Paßwort immer"mgm". Benutzer sind "azendler","pdikant"oder"uschmolka". Nach erfolgreicher Au- thentifizierung sieht der Benutzer eine Übersicht über alle Ex- perimente, die er angelegt hat. Von hier aus kann man ein neues Experiment anlegen (Link"add") oder eines der vorhandenen Ex- perimente bearbeiten (Link"edit").

Soll dagegen ein vorhandenes Experiment editiert werden, er- scheint eine Maske mit allen Einträgen zu diesem Experiment, sowie einer Toolleiste in der rechten oberen Ecke, über die man unterschiedliche Elemente in das Laborbuch einfügen kann, oder aber direkt auf Internet-Datenbanken zugreifen kann.

Die Ausführung der Erfindung ist nicht auf das oben skizzierte Beispiel und die hervorgehobenen Aspekte beschränkt, sondern ebenso in einer Vielzahl von Abwandlungen möglich, die im Rah- men fachgemäßen Handelns liegen.