Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
DEVICE AND METHOD FOR ASSIGNING THE NMR SIGNALS OF POLYPEPTIDES
Document Type and Number:
WIPO Patent Application WO/2003/023384
Kind Code:
A1
Abstract:
NMR spectroscopy is being used increasingly to determine the structure of proteins. According to the invention, cross-signal pattern search masks are used to jointly evaluate 3D triple resonance experiments and the amino acid type-specific 2D spectra. By means of pattern identification, the inventive cross-signal pattern search masks allow all signal peaks caused by one or a group of amino acids, whose exact sequence has previously been derived from the protein sequence and which form the basis for the specific pattern identification, to be jointly detected and evaluated. The invention permits the fully-automated assignment of the signal peaks occurring in the various spectra to the magnetically active nuclei of the protein.

Inventors:
LABUDDE DIRK (DE)
LEITNER DIETMAR (DE)
SCHUBERT MARIO (DE)
WINTER RUEDIGER (DE)
OSCHKINAT HARTMUT (DE)
SCHMIEDER PETER (DE)
Application Number:
PCT/EP2002/009959
Publication Date:
March 20, 2003
Filing Date:
September 05, 2002
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
FORSCHUNGSVERBUND BERLIN EV (DE)
LABUDDE DIRK (DE)
LEITNER DIETMAR (DE)
SCHUBERT MARIO (DE)
WINTER RUEDIGER (DE)
OSCHKINAT HARTMUT (DE)
SCHMIEDER PETER (DE)
International Classes:
G01N24/08; G01R33/32; G01R33/465; (IPC1-7): G01N24/08; G01R33/465
Other References:
CROFT DAVID ET AL: "Tools for the automated assignment of high-resolution three-dimensional protein NMR spectra based on pattern recognition techniques.", JOURNAL OF BIOMOLECULAR NMR, vol. 10, no. 3, October 1997 (1997-10-01), pages 207 - 219, XP009003062, ISSN: 0925-2738
VON-WUN SOO ET AL: "Divide-and-conquer, pattern matching, and relaxation methods in interpretation of 2-D NMR spectra of polypeptides", JOURNAL OF COMPUTATIONAL CHEMISTRY, OCT. 1993, USA, vol. 14, no. 10, pages 1164 - 1171, XP001121440, ISSN: 0192-8651
NEIDIG KLAUS-PETER ET AL: "AURELIA, a program for computer-aided analysis of multidimensional NMR spectra.", JOURNAL OF BIOMOLECULAR NMR, vol. 6, no. 3, 1995, pages 255 - 270, XP009002952, ISSN: 0925-2738
SCHUBERT M ET AL: "MUSIC in triple-resonance experiments: amino acid type-selective /sup 1/H-/sup 15/N correlations", JOURNAL OF MAGNETIC RESONANCE, NOV. 1999, ACADEMIC PRESS, USA, vol. 141, no. 1, pages 34 - 43, XP002225670, ISSN: 1090-7807
MOSELEY HUNTER N B ET AL: "Automated analysis of NMR assignments and structures for proteins.", CURRENT OPINION IN STRUCTURAL BIOLOGY, vol. 9, no. 5, October 1999 (1999-10-01), pages 635 - 642, XP002225671, ISSN: 0959-440X
Attorney, Agent or Firm:
Von Stosch, Andreas (Graf von Stosch Jehl, Flüggenstr. 13 München, DE)
Download PDF:
Claims:
Patentansprüche
1. Analysesystem zur automatisierten Analyse eines Satzes von NMRSpektren, welcher für eine n Aminosäuren umfassende Polypeptidkette aufgezeichnet wurde, mit einer Bibliothek von KreuzsignalmusterSuchmasken, wobei eine Kreuzsignalmuster Suchmaske zur spezifischen Erfassung der NMRSignale eines Fragments der untersuchten Polypeptidkette vorgesehen ist, Mitteln zur Auswahl der zur Analyse benötigten KreuzsignalmusterSuchmasken aus der Bi bliothek von KreuzsignalmusterSuchmasken entsprechend der Primärsequenz der Polypep tidkette, welche für jedes in der Ptimätsequenz enthaltene Fragment die zugehörige Kreuzsi gnalmusterSuchmaske auswählen, Mitteln zur Mustererkennung, welche die verschiedenen Ergebnisse der entsprechend der <BR> <BR> <BR> Primärsequenz der Polypeptidkette ausgewählten KreuzsignslmusterSuchmasken verbinden und mit dem Satz von NMRSpektren kortelieren, Mitteln zur Zuordnung der NMRSignale zu den verschiedenen Spinsystemen der Polypep tidkette entsprechend dem Ergebnis der Mustererkennung.
2. Analysesystem nach Anspruch 1, dadurch gekennzeichnet, dass die Fragmente der untersuchten Polypeptidkette jeweils zwei bzw. drei bestimmte aufeinan drfolgende Aminosäuren umfassen.
3. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Satz von NMRSpektten sowohl NMRExperimente zur Analyse der Hauptkettensignale als auch NMRExperimente zur Analyse der Seitenkettensignale umfasst.
4. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Analyse der Hauptkettensignale verwendeten NMRExperimente 3DExperimente, und insbesondere 3DExperimenten der Typen CBCA (CO) NNH, CBCANNH, HA (CO) NNH, HANNH, HAHB (CO) NNH, HAHBNNH, HN (CA) CO, HNCO, HN (CO) CA, HNCA umfassen.
5. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Analyse der Seitenkettensignale verwendeten NMRExperimente Experimente der Typen HCCHCOSY, HCCHTOCSY, HCC (CO) NHTOCSY umfassen.
6. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Analyse der Hauptund Seitenkettensignale verwendeten NMRExperimente amino säuretypspezifische 2DExperimente umfassen, welche selektiv sind tut einen Aminosäure typ oder für eine Gruppe von Aminosäuretypen.
7. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Analyse der Hauptund Seitenkettensignale erforderlichen aminosäutetyp spezifischen 2DExperimente entsprechend der Primäxsequenz der Polypeptidkette festgelegt werden.
8. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Analyse der Hauptund Seitenkettensignale verwendeten NMRExperimente eine Kombination von 2Dund 3DExperimenten umfassen.
9. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ausgehend von der Zuordnung der NMRSignale zu den verschiedenen Spinsystemen der Polypeptidkette eine Auswertung der NMRSpektten zur Ermittlung von chemischen Ver schiebungen und Kopplungskonstanten erfolgt.
10. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ausgehend von der Zuordnung der NMRSignale zu den verschiedenen Spinsystemen der Polypeptidkette die chemischen Verschiebungen zusammengefasst und auf ihre Richtigkeit überprüft werden.
11. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Satz von NMRSpektien Spektren des Typs NOESY umfasst, deren Auswertung insbe sondere Informationen über die Abstände der verschiedenen Kerne der Polypeptidkette von einander liefert.
12. Analysesystem nach Anspruch 11, dadurch gekennzeichnet, dass die Zuordnung der NMRSpektren des Typs NOESY zu den verschiedenen Kernen der Po lypeptidkette anhand der für die Kerne ermittelten chemischen Verschiebungen erfolgt.
13. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die bei der Auswertung der NMRSpektren erhaltenen Größen als Eingangsgtößen für Struk turberechnungsProgramme dienen.
14. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die KreuzsignalmusterSuchmasken jeweils eine Anzahl von vordefinierten Signalsuchberei chen umfassen, wobei durch das Auftreten von NMRSignalen innerhalb der Bereichsgrenzen eines Signalsuchbereichs die Wahrscheinlichkeit erhöht wird, dass das durch die Kreuzsi gnalmusterSuchmaske definierte Signalmuster vorliegt.
15. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die KreuzsignalmusterSuchmasken jeweils eine Anzahl von vordefinierten Leerbereichen umfassen, wobei durch das Fehlen von NMRSignalen innerhalb der Bereichsgrenzen eines Leerbereichs die Wahrscheinlichkeit erhöht wird, dass das durch die Kreuzsignahnuster Suchmaske definierte Signalmuster vorliegt.
16. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ausgehend von der erwarteten Anzahl der NMRSignale in den Spektren durch Iteration die Schwellwerte und Suchbereiche für die KreuzsignalmusterSuchmasken ermittelt werden.
17. Analysesystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass eine KreuzsignalmusterSuchmaske eine Vielzahl von UnterSuchmasken zur Analyse der verschiedenen NMRSpektren des aufgezeichneten Satzes von NMRSpektren umfassen kann.
18. Verfahren zur automatisierten Analyse eines Satzes von NMRSpektren, welcher für eine n Aminosäuren umfassende Polypeptidkette aufgezeichnet wurde, gekennzeichnet durch fol gende Schritte : a) Auswählen der zur Analyse benötigten KreuzsignalmusterSuchmasken aus einer Biblio thek von KreuzsignalmusterSuchmasken, wobei eine KreuzsignalmusterSuchmaske zur spe zifischen Erfassung der NMRSignale eines Fragments der untersuchten Polypeptidkette vor gesehen ist, und wobei das Auswählen der benötigten KteuzsignaImustetSuchmasken ent sprechend den in der Primärsequenz enthaltenen Fragmenten, erfolgt ; b) Durchfahren einer Mustererkennung durch Kortelieren der verschiedenen ausgewähten I<reuzsignalmusterSuchmasken mit dem Satz von NMRSpektten ; c) Zuordnen der NMRSignale zu den verschiedenen Spinsystemen der Polypeptidkette ent sprechend dem Ergebnis der in Schritt b) durchgeführten Musteterkennung.
19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass die Fragmente der untersuchten Polypeptidkette jeweils zwei bzw. drei bestimmte aufeinan derfolgende Aminosäuren umfassen.
20. Verfahren nach Anspruch 18 oder Anspruch 19, dadurch gekennzeichnet, dass der Satz von NMRSpektren sowohl NMRExperimente zur Analyse der Hauptkettensignale als auch NMRExpenmente zur Analyse der Seitenkettensignale umfasst.
21. Verfahren nach einem der Ansprüche 18 bis 20, dadurch gekennzeichnet, dass die zur Analyse der Hauptkettensignale verwendeten NMRExpenmente 3DExperimente, und insbesondere 3DExperimenten der Typen CBCA (CO) NNH, CBCANNH, HA (CO) NNH, HANNH, HAHB (CO) NNH, HAHBNNH, HN (CA) CO, HNCO, HN (CO) CA, HNCA umfassen.
22. Verfahren nach einem der Ansprüche 18 bis 21, dadurch gekennzeichnet, dass die zur Analyse der Seitenkettensignale verwendeten NMRExperimente Experimente der Typen HCCHCOSY, HCCHTOCSY, HCC (CO) NHTOCSY umfassen.
23. Verfahren nach einem der Ansprüche 18 bis 22, dadurch gekennzeichnet, dass die zur Analyse der Hauptund Seitenkettensignale verwendeten NMRExperimente amino säuxetypspezifische 2DExperimente umfassen, welche selektiv sind für einen Aminosäure typ oder für eine Gruppe von Aminosäuretypen.
24. Verfahren nach einem der Ansprüche 18 bis 23, dadurch gekennzeichnet, dass die zur Analyse der Hauptund Seitenkettensignale erforderlichen aminosäuretyp spezifischen 2DExperimente entsprechend der Primärsequenz der Polypeptidkette festgelegt werden.
25. Verfahren nach einem der Ansprüche 18 bis 24, dadurch gekennzeichnet, dass zur Analyse der Hauptund Seitenkettensignale eine Kombination von 2Dund 3D Experimenten verwendet wird.
26. Verfahren nach einem der Ansprüche 18 bis 25, dadurch gekennzeichnet, dass ausgehend von der Zuordnung der NMR Signale zu den verschiedenen Spinsystemen der Polypeptidkette eine Auswertung der NMRSpektren zur Ermittlung von chemischen Ver schiebungen und Kopplungskonstanten durchgeführt wird.
27. Verfahren nach einem der Ansprüche 18 bis 26, dadurch gekennzeichnet, dass ausgehend von der Zuordnung der NMRSignale zu den verschiedenen Spinsystemen der Polypeptidkette die chemischen Verschiebungen zusammengefasst und auf ihre Richtigkeit überprüft werden.
28. Verfahren nach einem der Ansprüche 18 bis 27, dadurch gekennzeichnet, dass der Satz von NMRSpektren Spektren des Typs NOESY umfasst, und dass die Zuordnung der NMRSpektten des Typs NOESY zu den verschiedenen Kernen der Polypeptidkette aus gehend von den für die verschiedenen Kerne ermittelten chemischen Verschiebungen durch geführt wird.
29. Verfahren nach einem der Ansprüche 18 bis 28, dadurch gekennzeichnet, dass die bei der Auswertung der NMRSpektren erhaltenen Größen als Eingangsgrößen für Sttuk tutberechnungsPxogramme verwendet werden.
Description:
Vorrichtung und Verfahren zur Zuordnung der NMR Signale von Polypeptiden Die Erfindung betrifft ein Analysesystem zur automatisierten Analyse eines Satzes von NMR- Spektren, welcher für eine n Aminosäuren umfassende Polypeptidkette aufgezeichnet wurde sowie ein Verfahren zu automatisierten Analyse eines Satzes von NMR-Spektren.

Die NMR-Spektroskopie hat sich in den vergangenen Jahren als Methode für die Struktur- aufklärung von kleinen Proteinen und DNA-Fragmenten etabliert Sie erlaubt die Untersu- chung von biologischen Makromolekülen in Lösung-unter besonderer Berücksichtigung dynamischer Phänomene-und stellt damit eine zur Röntgenkristallographie komplementäte Methode dar.

Die NMR-spektroskopische Untersuchung von Proteinen blieb zunächst-mit wenigen Aus- nahmen-auf relativ kleine Vertreter mit einer Größe von bis zu 80 Aminosäuren beschränkt, da sich für größere Proteine Signalüberlagerungen in den 2D-Spektren als limitierend erwie- sen. Erst die Einführung von dreidimensionalen und vierdimensionalen NMR-Techniken (3D-und 4D-NMR) ermöglichte die Überwindung dieser Barriere. In Verbindung mit einer Markierung der Proteine mit 2H, 13C und SN lassen sich heute Systeme mit einen Molekular- gewicht von bis zu 50 kD untersuchen. Die Größe der noch untersuchbaren Proteine wird im wesentlichen durch die mit zunehmender Masse kürzer werdende transversale Relaxationszeit bestimmt.

Die Vielzahl der existierenden mehrdimensionalen NMR-Techniken werden im Rahmen von Strukturbestimmungsprojekten für zwei unterschiedliche Teilschritte benötigt. In einem er- sten Schritt müssen alle'H,"C und'SN-Signale eines Proteins zugeordnet werden. Bei die- sem Zuordnungsschritt muss zu diesen magnetisch aktiven Kernen im Protein das entspre- chende Signal im Spektrum gefunden werden. Für diese Aufgabe der Zuordnung gibt es spe- zielle Pulssequenzen. In dem Artikel"Protein Structute Detemmination with Three-and Four- Dimensional NMR Spectroscopy"von H. Oschkinat et aL, Angew. Chem. Int. Ed. Engl.

1994,33, Seiten 277-293 wird ein Überblick über die verschiedenen zur Proteinsttuktarbe- stimmung verwendeten Experimente und Pulssequenzen gegeben.

In dem Attikel"MUSIC, Selective Pulses, and Tuned Delays : Amino Acid Type-Selective zsN Correlations, II"von M. Schubert et al., Journal of Magnetic Resonance 148, 2001, Seiten 61-72 sind eine Anzahl von aminosäutetyp-spezifischen'H/'5N-Experitnenten beschrieben, in denen unter Ausnutzung der Seitenkettentopologie die Signale eines bestimmten Typs von Aminosäure (z. B. Ser) oder einer bestimmten Gruppe von Aminosäuren (z. B. Ile/Val) ent- halten sind. Die zur Durchführung dieser aminosäuretyp-spezifischen 2D-Experimente benö- tigten Pulssequenzen lassen sich auf einfache Weise aus den zur Bestimmung der Hauptket- tenstruktur verwendeten Tripelresonanz-Experimenten ableiten.

Nachdem die Zuordnung vollständig durchgeführt ist, können mit Hilfe anderer NMR- Techniken Stcukturparameter des Proteins gesammelt werden. Dieser zweite Schritt baut auf der im ersten Schritt erhaltenen Zuordnung auf. Beispielsweise lassen sich mit Hilfe der ver- schiedenen mehrditnensionalen Versionen des NOESY-Experiments Abstände zwischen verschiedenen magnetisch aktiven Kernen ermitteln. Die so erhaltenen Stukturparameter dienen als Eingangsgrößen für Strukturbestimmungs-Softwarepakete. Derartige Strukturbe- rechnungs-Programtne erzeugen aus den zugeführten Strukturinfortnationen ein dreidimcn- sionales Modell des Polypeptids.

Gegenwärtig werden die verschiedenen Schritte der Proteinstrukturanalyse mit semiautomati- schen Prozeduren und meist hauseigener Software in den verschiedenen NMR- Forschungsgruppen durchgeführt Die vielen Versuche, insbesondere den Prozeß der Zuord- nung zu erleichtern, haben unter anderem zu sog. elektronischen Zeichentischen geführt, in denen die Spektren auf dem Bildschirm dargestellt und mit vom Programm zur Verfügung

gestellten Hilfsmitteln, wie automatischem Peakpicking und der Möglichkeit zur Spektren- überlagerung, zugeordnet werden.

Viele Verfahren zur automatischen Zuordnung von NMR-Signalen basieren auf der Verwen- dung von Kreuzsignallisten, mit denen die Frequenzkoordinaten der Kreuzsignale erfasst werden. Diese Kreuzsignallisten lassen sich mit Hilfe von kombinatorischen Ansätzen aus- werten, die Vergleiche zwischen den in den Kreuzsignallisten enthaltenen Frequenzen vorse- hen. Wenn die Zuordnung mit Hilfe von Kreuzsignallisten vorgenommen wird, muss eine Reihe von Nachteilen in Kauf genommen werden. So treten bei Spektren mit niedrigem Si- gnal-Rausch-Verhältnis oder starkem Tl-Rauschen spektrale Artefakte auf, welche uner- wünschte zusätzliche Einträge in die Kreuzsignallisten verursachen und eine erfolgreiche An- wendung der kombinatorischen Verfahren erschweren. Wenn die Kreuzsignale des Spek- trums sehr dicht liegen, können die einzelnen Kreuzsignale nicht mehr gegeneinander aufge- löst werden. In diesem Fall ergibt sich eine Kreuzsignalliste, in der verschiedene Einträge fehlen oder verfälscht sind.

Aus diesen Gründen ist man von der Verwendung von Kteuzsignallisten abgekommen und versucht statt dessen, die in den NMR-Spektren enthaltenen Signalmuster mit Hilfe von al- ternativen Verfahren zu erfassen. Ein derartiger Ansatz ist in dem Artikel Tools fbr the au- tomated assignment of high-resolution three-dimensional protein NMR spectra based on pattern recognition tecliniques"von D. Croft et al., Journal of Biomolecular NMR, 10, 1997, Seiten 207-219 beschrieben. In diesem Artikel wird speziell auf die Signalmuster- Erkennungssoftware CATCH23 eingegangen. Diese Software verwendet Suchmasken zur Analyse der NMR-Spektren und führt mit Hilfe einer Kombination von Suchmasken eine Mustersuche durch. Eine solche Kreuzsignalmuster-Suchmaske erfasst eine Vielzahl von Süchbereichen für die zu erwartenden Kreuzsignale eines bestimmten Hauptketten-bzw.

Seitenkettenfragments. Beispielsweise können mit einer Kreuzsignalmuster-Suchmaske sämt- liche von der Aminosäure Threonin verursachten Kreuzsignale erfasst werden. Falls die Kreuzsignalmuster-Suchmaske die entsprechenden Peaks identifiziert, kann eine Zuordnung zwischen diesen Peaks und der Aminosäure Threonin vorgenommen werden.

Häufig existieren jedoch mehrere Möglichkeiten, eine Zuordnung zwischen den Kreuzsigna- len einerseits und der Molekülstruktur andererseits zu treffen. Diese Vieldeutigkeit bei der

Zuordnung macht oftmals ein manuelles Eingreifen erforderlich. Die in der publizierten Ver- sion der Software CATCH23 definierten Kreuzsignalmuster-Suchmasken ermöglicht noch keine hinreichende Stabilität und Sicherheit für eine vollautomatische Zuordnung der Signal- peaks.

Es ist daher Aufgabe der Erfindung, eine Vorrichtung sowie ein Verfahren zur automatisier- ten Zuordnung der NMR-Signale eines Satzes von NMR-Spektren zur Verfügung zu stellen, welche eine sichere und eindeutige Zuordnung der NMR-Signale zu den verschiedenen ma- gnetisch aktiven Kernen ermöglicht und welche die Zahl der notwendigen manuellen Eingrif- fe verringert Diese Aufgabe der Erfindung wird durch ein Analysesystem zur automatisierten Analyse ei- nes Satzes von NMR-Spektren gemäß Anspruch 1 sowie durch ein Verfahren zur automat- sierten Analyse eines Satzes von NMR-Spektren gemäß Anspruch 18 gelöst.

Das erfindungsgemäße Analysesystem dient zur automatisierten Analyse eines Satzes von NMR-Spektren, welcher für eine n Aminosäuren umfassende Polypeptidkette aufgezeichnet wurde, und umfasst eine Bibliothek von Kreuzsignalmuster-Suchmasken, wobei eine Kreuz- signalmuster-Suchraaske zur spezifischen Erfassung der NMR-Signale eines Fragments der untersuchten Polypeptidkette vorgesehen ist Es können dabei Kreuzsignale eines Fragments einer Aminosäure, oder von Fragmenten mehrerer sequentiell folgender, oder alle Kreuzsi- gnale einer oder mehrerer Aminosäuren, die sequentiell in der Polypeptidkette verknüpft sind, erfasst werden. Die Fragmente können damit aus verbundenen Hauptkettenatomen, eventuell einschließlich der ß-Itohlenstoffe, oder nur aus Seitenkettenatomen der einzelnen oder ver- knüpfter Aminosäuren bestehen. Des weiteren umfasst das Analysesystem Mittel zur Auswahl der zur Analyse benötigten Ireuzsignalmuster-Suchmasken der Bibliothek entsprechend der Primärsequenz der Polypeptidkette, welche für jedes in der Primärsequenz enthaltene Frag- ment die zugehörigen Kreuzsignalmuster-Suchmasken auswählen. Außerdem weist das Ana- lysesystem Mittel zur Mustererkennung auf, welche die verschiedenen Ergebnisse der ent- sprechend der Primärsequenz der Polypeptidkette ausgewählten Kreuzsignalmuster- Suchmasken verbinden und mit dem Satz von NMR-Spektren korrelieten. Darüber hinaus umfaßt das Analysesystem Mittel zur Zuordnung der NMR-Signale zu den verschiedenen Spinsystemen der Polypeptidkette entsprechend dem Ergebnis der Mustererkennung.

Die erfindungsgemäße Lösung erlaubt insbesondere dann eine sehr zuverlässige Zuordnung, wenn für ein Protein ein Satz von NMR-Spektren aufgezeichnet wird, der neben 3D- Experimenten zur Zuordnung der Haupt-und Seitenkettensignale auch aminosäuretyp- spezifische 2D-Experimente enthält. Diese aminosäuretyp-spezifischen NMR-Experimente enthalten nur Kreuzsignale einer oder mehrerer Aminosäuretypen, die entweder Korrelatio- nen zwischen Signalen von Atomen in der Proteinhauptkette oder von Seitenkettensignalen darstellen.

Die erfindungsgemäßen Kreuzsignalmuster-Suchmasken sind so gestaltet, dass Signalmuster von Fragmenten, welche zu bestimmten Aninosäutetypen oder Verknüpfungen davon gehö- ren, durch eine kombinierte Anwendung auf aminosäutetyp-spezifische NMR-Expeiimente und 3D-Ttipeltesonanzexpetimente etkannt werden können. Diese Erkennung der in den Fragmenten enthaltenen Signale bestimmter Aminosäucetypen wird insbesondere dann er- folgreich sein, wenn diese zu Beginn der Suche in Form von zweidimensionalen Kotrelatio- nen von Signalen der Proteinhauptkette, oder von Signalen der Seitenketten als Ausgangs- punkt verwendet werden.

Mit den erfindungsgemäßen Kceuzsignahnustet-Suchmasken lassen sich damit insbesondere die Muster abfragen bzw. die Fragmente suchen, die von bestimmten Zweier-und Dreier- Kombinationen von Aminosäuren, wie z. B. dem Paar Valin-Threonin hervorgerufen werden.

Solche Kombinationen kommen in der Polypeptidkette nur einmal oder wenige Male vor, so dass sich eine dementsprechend kurze Trefferliste ergibt. Diese hohe Selektivität einer fur Zweier-bzw. Dreiergruppen von Aminosäuren spezifischen Kreuzsignalmuster-Suchmaske ermöglicht in der überwiegenden Zahl der Fälle eine eindeutige Zuordnung zwischen den erfassten Kreuzsignalen und dem zugehörigen Fragment der Polypeptidkette. Vieldeutigkei- ten bei der Zuordnung können so reduziert werden.

Nachdem mit Hilfe der Kreuzsignalmuster-Suchmasken Zuordnungen zwischen den Kreuz- signalen und den verschiedenen gefundenen Fragmenten andererseits vorgenommen wurden, müssen diese verschiedenen Teilzuordnungen in einem zweiten Schritt verbunden werden.

Durch Verbinden der verschiedenen Teil-Zuordnungen gelangt man zu einer Zuordnung von allen Signalen des Spektrums zu den zugehörigen magnetisch aktiven Kernen der Polypeptid-

kette. Bei Verwendung der erfindungsgemäßen Kreuzsignalmuster-Suchmasken zur Erfas- sung von Fragmenten der untersuchten Polypeptidkette ergibt sich jeweils ein Überlapp der verschiedenen auszuwertenden Fragmente. Für die magnetisch aktiven Kerne itn Übetlappbe- reich müssen die jeweils mit verschiedenen Kreuzsignalmuster-Suchmasken ermittelten che- mischen Verschiebungen übereinstimmen. Mit Hilfe dieser Randbedingung lassen sich die verschiedenen Teil-Zuordnungen verbinden, wobei insbesondere auf die chemischen Ver- schiebungen von HN sowie N abgestellt wird. Wegen des Überlapps zwischen den Kreuzsi- gnalrnuster-Suchmasken lässt sich mit den erfindungsgemäßen Kreuzsignalmuster- Suchmasken die Verbindung der aus selektiven Suchen erhaltenen Teil-Zuordnungen zu einer Gesamt-Zuordnung wesentlich einfacher und sicherer bewerkstelligen, als dies im Stand der Technik möglich war. Die erfindungsgemäßen Kteuzsignalmuster-Suchmasken bieten inso- fern sowohl bei der eigentlichen Peakzuotdnung als auch bei der nachfolgenden Verbindung der Teil-Zuordnungen Vorteile gegenüber den einfachen Kreuzsignalmuster-Suchmasken des Stands der Technik.

Insgesamt wird durch den Einsatz der erfindungsgemäßen Kreuzsignalmuster-Suchmasken, mit denen sich die NMR-Signale eines Ftagments der untersuchten Polypeptidkette spezifisch erfassen lassen, eine höhere Sicherheit bei der Zuordnung sowie eine bessere Erkennungsrate ermöglicht. Da die Zahl der bei der Zuordnung auftretenden Vieldeutigkeiten verringert wird, muss im Verlauf der Zuordnung weniger häufig manuell eingegriffen werden. Insofern stellt die Erfindung einen wichtigen Schritt beim Übergang von der semiautomatischen zur vollau- tomatischen Zuordnung von NMR-Signalpeaks dar. Sobald eine verlässliche, vollautomati- sche Zuordnung möglich ist, lässt sich der Durchsatz bei der Bestimmung von Proteinstruk- turen signifikant erhöhen. Außerdem steigt die Verlässlichkeit der so erhaltenen Strukturda- ten an.

Mit Hilfe der erfindungsgemäßen Kreuzsignalmuster-Suchmasken wird darüber hinaus eine geschickte und instruktive Kapselung der Analysetools für die Zuordnung der Kreuzsignal- muster erreicht. Dadurch können die Ergebnisse der Zuordnung auch besser nachvollzogen werden.

Es ist von Vorteil, wenn die Fragmente der untersuchten Polypeptidkette jeweils zwei bzw. drei bestimmte aufeinanderfolgende Aminosäuten umfassen. Mit einet etfindungsgemäßen

Kreuzsignalmuster-Suchmaske kann ein bestimmtes Fragment von zwei (oder drei) Amino- säuren eindeutig anhand seiner NMR-Signale identifiziert werden. Mit den erfindungsgemä- ßen Kreuzsignalmuster-Suchmasken lassen sich damit insbesondere die Muster abfragen bzw. die Fragmente suchen, die von bestimmten Zweier-und Dreier-Kombinationen von Amino- säuren, wie z. B. dem Paar Valin-Threonin hervorgerufen werden. Solche Kombinationen kommen in der Polypeptidkette nur einmal oder wenige Male vor, so dass sich eine dement- sprechend kurze Trefferliste ergibt. Diese hohe Selektivität einer für Zweier-bzw. Dreier- gruppen von Aminosäuren spezifischen Kreuzsignalmuster-Suchmaske ermöglicht in der überwiegenden Zahl der Fälle eine eindeutige Zuordnung zwischen den erfassten Kreuzsigna- len und dem zugehörigen Fragment der Polypeptidkette. Vieldeutigkeiten bei der Zuordnung können so reduziert werden.

Es ist von Vorteil, wenn der Satz von NMR-Spektren sowohl NMR-Experimente zur Analyse der Hauptkettensignale als auch NMR-Experimente zur Analyse der Seitenkettensignale um- fasst Die Verknüpfung zwischen den Seitenketten und der Hauptkette wird insbesondere über die chemische Verschiebung der Ca-sowie der Cß-Keme hergestellt. Mit Hilfe der erfin- dungsgemäßen Kreuzsignalmuster-Suchmasken, welche zur spezifischen Erfassung der NMR-Signale eines Fragments der untersuchten Polypeptidkette vorgesehen sind, können die Haupt-und Seitenkettensignale gemeinsam ausgewertet werden.

Es ist von Vorteil, wenn die zur Analyse der Hauptkettensignale verwendeten NMR- Experimente 3D-Experimente, und insbesondere 3D-Experimente der Typen CBCA (CO) NNH, CBCANNH, HA (CO) NNH, HANNH, HAHB (CO) NNH, HAHBNNH, HN (CA) CO, HNCO, HN (CO) CA, HNCA umfassen. Bei den angeführten Experimenten handelt es sich um 3D-Experimente, mit denen sich die chemischen Verschiebungen der ma- gnetisch aktiven Kerne der Hauptkette erfassen lassen. Die Vielfalt der verfügbaren 3D- Experimente erlaubt aber auch eine mehrfache Absicherung der Ergebnisse.

Es ist von Vorteil, wenn die zur Analyse der Seitenkettensignale verwendeten NMR- Experimente Experimente der Typen HCCH-COSY, HCCH-TOCSY, HCC (CO) NH- TOCSY umfassen.

Es ist von Vorteil, wenn die zur Analyse der Haupt-und Seitenkettensignale verwendeten NMR-Experimente aminosäuretyp-spezifische 1H/15N-Experimente umfassen, welche selek- tiv sind für einen Aminosäuretyp oder für eine Gruppe von Aminosäutetypen. Für ein Ptote- in wird ein Satz von NMR-Spektren aufgezeichnet, der neben den 3D-Experimenten zur Er- fassung der Hauptkettenstruktur auch aminosäutetyp-spezifische 2D-Experimente enthält.

Diese aminosäuretyp-spezifischen NMR-Experimente enthalten nur Kreuzsignale einer oder mehrerer Aminosäuretypen, die entweder Korrelationen zwischen Signalen von Atomen in der Proteinhauptkette oder von Seitenkettensignalen darstellen. Aminosäutetyp-spezifische 2D-Experimente ermöglichen die selektive Anregung der Seitenketten eines Aminosäutetyps bzw. einer Gruppe von Amtnosäuretypen. Anschließend wird die Magnetisierung über die Seitenkette zu den Hauptketten-Stickstoffen und Amidptotonen transferiert. Mit Hilfe von aminosäuretyp-spezifischen 1H/15N-Experimenten lassen sich die von einem bestimmten Aminosäuretyp bzw. einer Gruppe von Aminosäutetypen verursachten NMR-Signale, die eine Art"Fingerabdruck"eines bestimmten Aminosäuxetyps bzw. einer Gruppe von Amino- säuren darstellen, hochspezifisch erfassen. Mit einer erfindungsgemäßen Kreuzsignalmuster- Suchmaske können dann gezielt die NMR-Signale eines Fragments der untersuchten Polypep- tidkette abgefragt werden. Dadurch wird eine höhere Sicherheit bei der Zuordnung sowie eine bessere Erkennungsrate ermöglicht.

Die zur Durchführung der aminosäuretyp-spezifischen 2D-Experimente benötigten Pulsse- quenzen lassen sich auf einfache Weise aus den vor allem zur Bestimmung der Hauptketten- struktur verwendeten Tripelresonanz-Experimenten ableiten.

Es ist von Vorteil, wenn die zur Analyse der Haupt-und Seitenkettensignale erforderlichen aminosäutetyp-spezifischen 2D-Experimente entsprechend der Primärsequenz der Polype- tiakette festgelegt werden. Diese Primärsequenz ist vorher bekannt. Die zur Durchführung der NMR-Messungen erforderliche Menge an Protein wird nämlich unter einer entsprechenden DNS-Sequenz mit Hilfe von biotechnologischen Methoden erzeugt. Wenn nun beispielsweise in der Primärsequenz der Polypeptidkette die Aminosäure Cystein nicht vorkommt, so ist es auch nicht notwendig, das aminosäutetyp-spezifische 2D-Experiment für Cystein durchzuführen. Anhand der Primätsequenz lässt sich also der minimal erforderliche Datensatz für die NMR-Experimente festlegen.

Es ist von Vorteil, wenn die zur Analyse der Haupt-und Seitenkettensignale verwendeten NMR-Experimente eine Kombination von 2D-und 3D-Experimenten umfassen. Die kom- binierte Verwendung von Hauptkettenexperimenten und aminosäuretyp-spezifischen 2D- Experimenten, zusammen mit die Auswertung der NMR-Signale mit Hilfe von Kreuzsignal- muster-Suchmasken, ermöglicht eine erhebliche Performancesteigerung bei der automatisier- ten Auswertung von NMR-Spektren. Die erfindungsgemäßen Kreuzsignalmuster- Suchmasken sind so gestaltet, dass Signalmuster von Fragmenten, welche zu bestimmten Aminosäuretypen oder Verknüpfungen davon gehören, durch eine kombinierte Anwendung auf aminosäuretyp-spezifische NMR-Experimente und 3D-Tripelresonanzexperimente er- kannt werden können. Da insbesondere mit Hilfe von aminosäuretyp-spezifischen 2D- Experimenten die Zahl der bei der Zuordnung auftretenden Vieldeutigkeiten verringert wer- den kann, muss im Verlauf der Zuordnung weniger häufig manuell eingegriffen werden. Die Erfindung stellt daher einen wichtigen Schritt beim Übergang von der semiautomatischen zur vollautomatischen Auswertung von NMR-Spektren dar.

Gemäß einer vorteilhaften Ausfìihrungsform der Erfindung werden ausgehend von der Zu- ordnung der NMR-Signale zu den verschiedenen Spinsystemen der Polypeptidkette die che- mischen Verschiebungen zusammengefasst und auf ihre Richtigkeit überprüft. Ausgehend von der Zuordnung der NMR-Signale können beispielsweise die für die verschiedenen ma- gnetisch aktiven Kerne einer Aminosäure ermittelten chemischen Verschiebungen in Form eines Vektors zusammengefasst werden. Hinsichtlich der Hauptkette kann dann insbesondere mittels der chemischen Verschiebung von HN und N, welche in verschiedenen Experimenten unabhängig voneinander ermittelt werden, eine Konsistenzüberprüfung durchgeführt werden.

Für die in verschiedenen Experimenten ermittelten chemischen Verschiebungen müssen sich übereinstimmende bzw. nahe beieinander liegende Werte ergeben. Entsprechend erlauben die chemischen Verschiebungen der Kerne Ca und Cß, welche sowohl in Hauptkettenexperimen- ten als auch in Seitenkettenexperimenten ermittelt werden, eine derartige Konsistenzüberprü- fung für die Haupt-und Seitenketten.

Gemäß einer weiteren Ausführungsform der Erfindung umfasst der Satz von NMR-Spektren Spektren des Typs NOESY, deren Auswertung insbesondere Informationen über die Ab- stände der verschiedenen Kerne der Polypeptidkette voneinander liefert. In Experimenten des Typs NOESY wird die durch den Kern-Overhauser-Effekt verursachte Kreuzrelaxation

erfasst Aus den Amplituden der NOE-Kreuzsignale lassen sich Rückschlüsse auf die Ab- stände zwischen den beteiligten Kernen ziehen. Für die Ermittlung der Proteinstruktur sind Spektren des Typs NOESY daher von besonderer Bedeutung.

Gemäß einer weiteren Ausführungsform der Erfindung erfolgt die Zuordnung der NMR- Spektren des Typs NOESY zu den verschiedenen Kernen der Polypeptidkette anhand der für die Kerne ermittelten chemischen Verschiebungen. Die Zuordnung der Kreuzsignale in den NOESY-Spektren zu den verschiedenen magnetisch aktiven Kernen wird insbesondere an- hand der protonenchemischen Verschiebungen vorgenommen. Aber auch wenn die proto- nencheinischen Verschiebungen mit zufriedenstellender Genauigkeit vorab bestimmt wurden und daher vorbekannt sind, bleiben wegen der Mehtfachbedeutung der einzelnen Kreuzsigna- le noch Vieldeutigkeiten bestehen. Aus diesem Grund ist es um so wichtiger, anhand von möglichst genau erfassten protonenchemischen Verschiebungen einen möglichst großen An- teil der NOESY-Spektren eindeutig zuordnen zu können.

Gemäß einer weiteren vorteilhaften Ausführungsform der Erfindung dienen die bei der Aus- wertung der NMR-Spektren erhaltenen Größen als Eingangsgrößen für Strukturberechnungs- Software. Wichtige Eingangsgrößen für Stiuktmbeiechnungs-Plogiamme sind vor allem die aus den zugeordneten NOESY-Spektren erhaltenen Kernabstände. Dem Strukturberech- nungs-Programm kann hierzu eine Liste der Amplituden der NOE-Kreuzsignale und der Frequenzkoordinaten der Peaks sowie die Resonanzzuordnung übergeben werden. Weitere Eingangsgrößen können die Kopplungskonstanten zwischen verschiedenen Kernen sein, denn aus diesen Kopplungskonstanten lassen sich die Diederwinkel zwischen verschiedenen Kernen ermitteln.

Es ist von Vorteil, wenn die Kreuzsignalmuster-Suchmasken jeweils eine Anzahl von vordefi- nierten Signalsuchbereichen umfassen, wobei durch das Auftreten von NMR-Signalen inner- halb der Bereichsgrenzen eines Signalsuchbeieichs die Wahrscheinlichkeit erhöht wird, dass das durch die Kreuzsignalmuster-Suchmaske definierte Signalmuster vorliegt. Auf diese Weise lässt sich das zu suchende Peakinuster exakt mittels einer Anzahl von Suchbereichen definie- xen. Dadurch wird eine echte Mustererkennung möglich. Jeder innerhalb der Grenzen eines Suchbereichs auftretende Signalpeak erhöht die Be vertungszahl für die Kreuzsignalmuster- Suchmaske. Dabei ist es insbesondere von Vorteil, dass auch bei Fehlen einzelner Peaks des

Signalmusters ein Signalmuster noch erkannt werden kann, wenn es ansonsten hinreichend gut mit der Kreuzsignalmuster-SuchmasLe übereinstimmt Bei der Bewertung, ob ein Peak- muster mit der Kreuzsignalmuster-Suchmaske übereinstimmt, kommt es auf die insgesamt festgestellten Übereinstimmungen an.

Dabei ist es von Vorteil, wenn die Kreuzsignalmuster-Suchmasken jeweils eine Anzahl von voxdefinietten Leerbereichen umfassen, wobei durch das Fehlen von NMR-Signalen inner- halb det Bereichsgrenzen eines Leerbereichs die Wahrscheinlichkeit erhöht wird, dass das durch die Kreuzsignalmuster-Suchmaske definierte Signalmuster vorliegt. Die Definition von Leerbereichen ist beispielsweise dann sinnvoll, wenn zwei verschiedene Seitenkettensttuktu- ren zu zwei einander ähnlichen Signalmustern führen, wobei das zweite Signalmuster einige zusätzliche Peaks aufweist, welche im ersten Signalmuster nicht enthalten sind. Das Fehlen dieser Signalpeaks ist dann genau das typische an dem ersten Signalmuster, so dass es sich zur Erfassung des ersten Signalmusters empfiehlt, an den entsprechenden Stellen Leerbeteiche zu definieren. Wenn dann innerhalb der Grenzen der Leerbereiche keine Peaks auftreten, so wird die Bewertungszahl für das Vorliegen des ersten Signahnusters erhöht. Durch die Defi- nition von Leerbereichen können die beiden Signalmuster deshalb besser unterschieden wer- den.

Es ist von Vorteil, wenn ausgehend von der erwarteten Anzahl der NMR-Signale in den Spektren durch Iteration die Schwellwerte und Suchbereiche für die Kreuzsignalmuster- Suchmasken ermittelt werden. Bei dieser Vorgehensweise werden die Suchbereiche anfangs durch weit gesteckte Grenzen definiert, während die Schwellwerte relativ niedrig gewählt werden. Die Auswertung der beim ersten Durchlauf aufgefundenen Signalpeaks liefert erste Aussagen darüber, welches bzw. welche Kreuzisgnalmuster voraussichtlich vorliegen. In einer zweiten, modifizierten Suche kann dann speziell nach diesen wahrscheinlichsten Kandidaten gesucht werden, dabei können die Suchbereiche in Abhängigkeit von den chemischen Ver- schiebungen der bei der ersten Suche aufgefundenen Peaks verkleinert bzw. verschoben wer- den, um die Suche zu verfeinern. Außerdem ist es möglich, bei der zweiten Suche mit erhöh- ten Schwellwerten zu arbeiten. Mit Hilfe dieser iterativen Vorgehensweise lässt sich erreichen, dass die Kreuzsignalmuster-Suche schrittweise in Richtung des tatsächlich vorliegenden Kreuzsignalmusters konvergiert

Gemäß einer weiteren vorteilhaften Ausführungsform der Erfindung umfasst die Kreuzsi- gnalmuster-Suchmaske eine Vielzahl von Unter-Suchmasken zur Analyse der verschiedenen NMR-Spektren des aufgezeichneten Satzes von NMR-Spektten. Die eigenliche Kreuzsignal- muster-Suchmaske ergibt sich insofern als Gesamtheit verschiedener Unter-Suchmasken, welche jeweils verschiedene zwei-, drei-oder höherdimensionale Spektren absuchen. Der Satz von NMR-Spektten wird also mit einem entsprechenden Satz von Unter-Suchmasken analy- siert Dies hat insbesondere den Vorteil, dass sich die Modifikation von Suchbereichsgtenzen simultan auf alle Unter-Suchmasken auswirkt. Dadurch wird die Handhabung des Satzes von Suchmasken vereinfacht Bei dem erfindungsgemäßen Verfahren zur automatisierten Analyse eines Satzes von NMR- Spektren, welcher für eine n Aminosäuren umfassende Polypeptidkette aufgezeichnet wurde, werden zunächst die zur Analyse benötigten Kreuzsignalmuster-Suchmasken aus einer Biblio- thek von Kreuzsignalmuster-Suchmasken ausgewählt, wobei eine Kreuzsignalmuster- Suchmaske zur spezifischen Erfassung der NMR-Signale eines Fragments der untersuchten Polypeptidkette vorgesehen ist, und wobei das Auswählen der benötigten Kreuzsignalmuster- Suchmasken entsprechend den in der Ptimätsequenz enthaltenen Fragmenten erfolgt. An- schließend wird eine Mustererkennung durchgeführt, indem die verschiedenen ausgewählten Kreuzsignalmuster-Suchmasken mit dem Satz von NMR-Spektren korreliert werden. Ent- sprechend dem Ergebnis dieser Mustererkennung werden die NMR-Signale zu den verschie- denen Spinsystemen der Polypeptidkette zugeordnet Da die erfindungsgemäßen Kteuzsignalmuster-Suchmasken jeweils sämtliche NMR-Signale eines Fragments der untersuchten Polypeptidkette zusammen auswerten, können mit dem erfindungsgemäßen Verfahren die NMR-Signale eines Fragments, insbesondere eines zwei bzw. drei Aminosäuren umfassenden Fragments, hochselektiv erfasst werden. Wenn dann für die einzelnen Fragmente der Polypeptidkette verlässliche Signalzuordnungen vorliegen, kann wegen des Überlapps zwischen den Analyseergebnissen eine Gesamtzuordnung der NMR- Signale der Polypeptidkette hergeleitet werden. Gegenüber den Verfahren des Stands der Technik wird die Eindeutigkeit und Sicherheit der Zuordnungen verbessert. Manuelle Ein- griffe des Benutzers sind weniger häufig erforderlich und deshalb eignet sich das Verfahren insbesondere zur vollautomatischen Auswertung von NMR-Spektren. Dadurch kann der

Zeit-und Geldbedarf bei der Ermittlung von Proteinstrukturen durch NMR-Spektroskopie weiter abgesenkt werden.

Nachfolgend wird die Erfindung anhand eines in der Zeichnung dargestellten Ausführungs- beispiels weiter beschrieben. Es zeigen : Fig. 1 einen Ablaufplan für die Aufzeichnung der benötigten NMR-Spektren ; Fig. 2 eine Tabelle, aus der die in der Aminosäuresequenz enthaltenen Paare von Aminosäuren ausgelesen werden können ; Fig. 3 eine Reihe von Beispielen fiir aminosäutetyp-spezifische 2D-Experimente, mit denen gezielt das Vorliegen oder Nichtvotliegen bestimmter Seitenketten- strukturen abgefragt werden kann ; Fig. 4 eine Kreuzsignalmuster-Suchmaske, mit der die in den Spektren enthaltenen Signalmuster erkannt und ausgewertet werden können ; sowie Fig. 5A, Fig. 5B einen Ablaufplan für die Auswertung der aufgezeichneten NMR-Spektten, wobei eine Zuordnung zwischen den auftretenden Signalpeaks und den Spin- systemen des Proteins hergestellt wird.

In Fig. 1 ist der Ablauf bei der Aufzeichnung der benötigten NMR-Spektten dargestellt Aus- gangspunkt für die Festlegung der erforderlichen Experimente ist die Ptimätsttuktut des Pro- teins. Meist werden die benötigten Proteine mit Hilfe von biotechnologischen Methoden un- ter Zuhilfenahme von entsprechenden DNS-Abschnitten synthetisiert, da sich auf diese Wei- se die benötigten Proteinmengen einfach herstellen lassen. Es ist dabei im folgenden davon auszugehen, dass die Primärs des Proteins vorbekannt ist, und dass die NMR- spektroskopischen Experimente lediglich zur Strukturermitdung des Proteins eingesetzt wer- den sollen.

Im Schritt 1 werden die in der Primärsequenz enthaltenen Paare von aufeinanderfolgenden Aminosäuren ermittelt und aufgelistet Da die Primärstruktur bekannt ist, kann dies auf sehr einfache Weise von einem selbstgeschriebenen Computerprogramm namens"selma"durch- geführt werden. In Fig. 2 ist das von dem Programm"selma"für das Protein OPR gelieferte Ergebnis dargestellt. Die entlang der x-und der y-Achse aufgetragenen Buchstaben bezeich- nen jeweils die 20 möglichen Aminosäuren. Die entlang der y-Achse aufgelisteten Aminosäu- ren bezeichnen die in der ersten Position des betrachtenen Aminosäure-Paars vorkommende Aminosäure, während die entlang der x-Achse aufgelisteten Aminosäuren die Aminosäure an der zweiten Stelle des Aminosäure-Paars bezeichnen.

In der sich ergebenden Matrix sind die verschiedenen in der Aminosäuresequenz des Proteins OPR auftretenden Aminosäure-Paare eingetragen. Der Tabelle kann entnommen werden, dass das Aminosäure-Paar AE genau einmal in der Sequenz vorkommt, während das Amino- säure-Paar EA nicht in der Sequenz enthalten ist. Falls die Ziffer 2 oder 3 an einer bestimm- ten Matrixposition eingetragen ist, so bedeutet dies, dass das entsprechende Aminosäure-Paar ; in der Sequenz mehrfach auftritt. Dies ist z. B. beim Aminosäure-Paar ED der FalL Die so erhaltenen Informationen über die in der Primärsequenz enthaltenen Aminosäure- Paare dienen im Schritt 2 zur Festlegung eines Satzes von NMR-Experimenten, welche zur Ermittlung der Proteinstruktur durchgeführt werden müssen. Das Ziel ist, möglichst keine überflüssigen Experimente durchzuführen, welche nur unnötig die Messzeit verlängern wür- den. So lässt sich beispielsweise anhand der in Fig. 2 gezeigten Ergebnisse des Programms "selma"erkennen, dass die Aminosäure Cystein im Protein OPR nicht vorkommt. Die Auf- zeichnung eines Cystein-selektiven 2D-Experiments ist nicht notwendig, und das Cystein- selektive 2D-Experiment wird daher auch nicht Bestandteil des in Schritt 2 festgelegten Sat- zes von NMR-Experimenten.

In Schritt 3 werden die zwei-bzw mehrdimensionalen NMR-Spektren des Satzes in einem NMR-Spektrometer aufgezeichnet. Das Spektrometer umfasst eine Spektrometersteuerung, welche anfangs die Betriebsparameter des Spektrometers, wie beispielsweise die Protonenträ- gerfrequenz sowie die Länge von 90°-Pulsen ermittelt und einstellt Anschließend werden die in Schritt 2 festgelegten Spektren der Reihe nach aufgezeichnet. Hierzu enthält die Spektro- metersteuerung eine Auswahl an standardisierten NMR-Pulssequenzen.

Die Aufzeichnung der fut ein Protein benötigten NMR-Spektten erfordert eine Messzeit von einigen Wochen. Danach stehen die aufgezeichneten Spektren als Dateien eines Projektord- ners 4 zur Verfügung und können im Schritt 5 weiter ausgewertet werden. Als Ergebnis erhält man 2D-Spektren"2tx"sowie 3D-Spektren"3rrr". Aus den im Ptojektotdner 4 enthaltenen Dateien ermittelt das Programm"gnat"verschiedene für die weitere Auswertung benötigte statistische Parameter 6, die beispielsweise für die Festlegung von Schwellwerten benötigt werden. Mit Hilfe derartiger Schwellwerte können die in den Spektren enthaltenen Peaks vom Untergrundrauschen unterschieden werden.

Zur Erfassung der chemischen Verschiebungen der magnetisch aktiven Keine der Hauptkette werden typischerweise 3D-Tripeltesonanzexperimente sowie aminosäuretyp-spezifische 2D- Experimente verwendet, mit denen sich insbesondere auch die Resonanzen von"C und"N- Kernen erfassen lassen. Hierzu dienen insbesondere folgende Paare von 3D-Experimenten : CBCA (CO) NNH und CBCANNH, HA (CO) NNH und HANNH, HAHB (CO) NNH und HAHBNNH, HN (CA) CO und HNCO sowie HN (CO) CA und HNCA. In Kmmem ange- gebene Kerne (z. B. 3D-HN (CO) CA) werden nicht detektiert, sind aber bei einem Kohärenz- transfer involviert.

Zur Ermittlung der benötigten chemischen Verschiebungen würde bereits die Durchführung einer geringen Zahl von Tripelresonanzexperimenten ausreichen. Um verläßliche Ergebnisse zu erzielen, ist es allerdings von Vorteil, die verschiedenen im Protein auftretenden Korrela- tionen jeweils durch mehrere Experimente zu erfassen, so dass die Ergebnisse auf ihre Konsi- stenz überprüft werden können.

Mit Hilfe des Experiments CACBNNH erhält man die Frequenzen der Kerne HN, N, Ca und Cß der i-ten Aminosäure sowie die Frequenzen der Kerne Ca und Cß der Aminosäure i-1. Das CACB (CO) NH-Spekttum enthält die Korrelationen der Kerne HN und N der Aminosäute i , mit den Kernen Ca und Cß der Aminosäure i-1.

Mit dem 3D-Experiment des Typs HNCA werden die Frequenzen der Kerne N, HN und Ca der i-ten Aminosäure erfasst. Entsprechend können mittels des Experiments HNCA auch die

Frequenzen der Kerne N, HN sowie Ca der Aminosäure i+1 erfasst werden. Mit dem Expe- riment HNCA ist es darüber hinaus auch möglich, den Kern Ca der Aminosäure i mit den Kernen N und HN der Aminosäure i+1 zu korrelieren.

Der wesentliche Vorteil der Tripekesonanzexperimente ist die verhältnismäßig geringe An- zahl von Signalpeaks in den Spektren. Tripelresonanzexperimente enthalten pro Aminosäure nur ein oder maximal zwei Kreuzsignale. Dadurch wird eine weitgehende Automatisierung der Auswertung möglich.

Die frequenzspezfische Zuordnung erfolgt somit durch die Kombination einzelner"Baustei- ne", welche sich in Teilen überschneiden. Besonders wichtig sind solche Experimente, die eine Erfassung der chemischen Verschiebungen der ß-Kohlenstoffe erlauben.

Als besonders vorteilhaft für die Aufklärung der Resonanzzuordnung hat sich die Verwen- dung der Pulssequenz MUSIC (Multiplicity Selective In-Phase Coherence Transfer) erwiesen.

MUSIC-Pulssequenzen zur gezielten Anregung der Seitenketten einer Gruppe von Amino- säuren bzw. eines bestimmten Aminosäuretyps können durch Abwandlung der Pulssequen- zen von 3D-Tripelresonanzexperimenten (wie beispielsweise CBCA (CO) NNH) erhalten werden.

In Fig. 3 ist der jeweilige Magnetisierungstransfer für eine Reihe von aminosäuretyp- spezifischen 2D-Experimenten dargestellt. Zunächst wird eine bestimmte in der Seitenkette befindliche Gruppe durch die MUSIC-Sequenz angeregt Bei den gezeigten Beispielen wird jeweils die durch eine rechteckige Umrandung hervorgehobene CH2-bzw. CH3-Gruppe ange- regt. Von dort wird die Magnetisierung entlang der Seitenkette zu dem Ca-Atom und von dort weiter zum Amidproton N transferiert. Der Unterschied zwischen den in der linken und in der rechten Spalte gezeigten Experimenten besteht in der Art des Transfers von dem Ca- Atom zu dem Stickstoff N. Bei den in der linken Spalte gezeigten Experimenten gelangt die Magnetisierung von dem Ca-Kern zu der Carbonylgruppe und von dort weiter zum Stickstoff N und zum Amidproton HN der Aminosäure i+1. Wegen dieses Magnetisierungstransfers zur nächstfolgenden Aminosäure werden diese Experimente als (i+l)-HSQCs bezeichnet. Bei den in der rechten Spalte gezeigten (i, i+l)-HSQCs dagegen gelangt die Magnetisierung von

dem Ca-Kem aus entweder zum Stickstoff N derselben Aminosäure i oder zum Stickstoff N der benachbarten Aminosäure i+1. Mit Hilfe der in Fig. 3 gezeigten Experimente lassen sich 2D-Spektren selektiv für einen bestimmten Typ von Aminosäure (z. B. für Ser, 1. Zeile ; Leu, 3. Zeile) oder selektiv tut bestimmte Gruppen von Aminosäuren (vgl. Ile/Val, 2. Zeile ; Asp/Asn, 4. Zeile sowie Glu/Gln, 5. Zeile) erfassen.

Die aufgezeichneten 2D-sowie 3D-Spektren werden anschließend einer Mustererkennung unterzogen, um die in den Spektren auftretenden Signalpeaks den einzelnen Spinsystemen des Proteins zuordnen zu können. Bei den Lösungen des Stands der Technik wurde diese Zuord- nung meist mit Hilfe von Peaksignallisten vorgenommen. Gegenüber derartigen Lösungsan- sätzen bietet die Verwendung von Mustererkennungs-Routinen insofern Vorteile, als hier die gemessenen Kreuzsignalmuster in ihrer Gesamtheit beurteilt werden können.

In Fig. 4 ist eine zur Analyse von Kreuzsignalmustern verwendete Kreuzsignalmuster- Suchmaske dargestellt. An den Positionen 8,10, 12 sowie den hierzu spiegelbildlichen Posi- tionen 14,16 und 18 des zweidimensionalen Spektrums werden Signalpeaks erwartet Um die erwarteten Peakpositionen herum sind xechteckige Signalsuchbereiche 9,11, 13 sowie 15,17, 19 definiert Innerhalb der so definierten Bereiche auftretende Signalpeaks werden von der Musteterkennungs-Software erfasst, während außerhalb der Signalsuchbereiche auftretende Peaks nicht erfasst werden. Die Kreuzsignalmuster-Suchmaske umfasst also die votdefinier- ten Signalsuchbereichen 9,11, 13,15, 17,19, wobei die Software innerhalb dieser Signalsuch- bereiche nach den erwarteten Signalpeaks sucht Der Ablauf der Mustetetkennung und Zuordnung ist in den Fig. 5A und 5B dargestellt Zur Analyse der Kreuzsignahnuster dient eine Bibliothek 19 von erfindungsgemäßen Kreuzsi- gnalmuster-Suchmasken, welche der Mustererkennungssoftware 20 zur Verfügung steht Mit jeder der etfindungsgemäßen Kieuzsignaltnustet-Suchmasken lassen sich die Signalpeaks ei- nes Fragments von zwei (oder drei) aufeinanderfolgenden Aminosäuren erfassen und zuord- nen. Die Auswahl der für die Mustererkennung benötigten Kreuzsignalmuster-Suchmasken erfolgt dabei entsprechend der durch das Pxogramm"selma"vorgenommenen Zerlegung der Aminosäutesequenz in Zweierfragmente. Die zur Zuordnung der Signalpeaks des Proteins benötigten Kreuzsignalmuster-Suchmasken werden entsprechend den in der Primärsequenz

enthaltenen Zweiergruppen aus der Bibliothek 19 ausgewählt und der Mustererkennungs- Software 20 zur Verfügung gestellt Mit Hilfe einer vordefinierten Kreuzsignalmuster-Suchsmaske lassen sich sämtliche Signal- peaks, die von einer Zweietgtuppe von aufeinanderfolgend angeordneten Aminosäuren ver- ursacht werden, also sowohl die von dem beiden Seitenketten verursachten Signalpeaks als auch die vom Hauptkettenfragment verursachten Signalpeaks, gemeinsam auswerten.

Es soll im folgenden davon ausgegangen werden, dass zur Zuordnung der Hauptkettensignale drei verschiedene Paare von Tripelresonanzexperimente, nämlich die Paare CBCANNH/CBCA (CO) NNH, HNCO/HN (CA) CO sowie HANNH/HA (CO) NNH, und die aminosäutetyp-spezifischen 2D-Experimente herangezogen werden. In diesem Fall ent- hält die Bibliothek 19 von Kreuzsignalmuster-Suchasken insgesamt 3 x 20 x 20 = 3 x 400 = 1200 verschiedene Kreuzsignalmuster-Suchmasken, nsmlich 400 Kreuzisgnalmuster-Scuhmasken zur Analyse von : CBCANNH + CBCA (CO) NNH + zwei aminosäuretyp-spezifische 2D-Experimente, o 400 Kreuzsignalmuster-Suchmasken zur Analyse von : HNCO + HN (CA) CO + zwei aminosäuretyp-spezifische 2D-Experimente, sowie 400 Kreuzsignalmuster-Suchmasken zur Analyse von : HANNH + HA (CO) NNH + zwei aminosäuretyp-spezifische 2D-Experimente.

Jede der erfindungsgemäßen Kreuzsignalmuster-Suchmasken dient zur Auswertung von zwei aminosäuretyp-spezifischen 2D-Experimenten sowie von einem Paar von 3D- Tripelresonanzexperimenten. Um die verschiedenen Spektren mit einer Kteuzsignalmustet- Suchmaske auswerten zu können, umfasst die Kreuzsignahnustet-Suchmaske einen Satz von Unter-Suchmasken, wobei mit jeder Unter-Suchmaske ein bestimmter Typ von Spektten aus- gewertet werden kann. Programmtechnisch präsentiert sich die Kreuzsignalmuster- Suchmaske jedoch als eine Einheit. Es ist daher möglich für die gesamte Kreuzsignalmustet- Suchmaske mit all ihren Untet-Suchmasken einen bestimmten Auswertungsparameter, bei- spielsweise eine Suchbereichsgrenze, zu verändern. Die Veränderung wirkt sich dann in selbstkonsistenter Art und Weise auf die Suchbereichsgtenzen in sämtlichen Unter- Suchmasken aus.

Die in der Bibliothek 19 enthaltenen, vordefinierten Kreuzsignalmuste-rSuchmasken legen den suchalgorithmus für das Auffinden bestimmter Signalmuster fest Allerdings sind die Kreuzsignalmuster-Suchmasken in parameterunabhängiger Form niedergelegt. Die benötigten Suchbereichsgrenzen 22 sowie die zur Unterscheidung der Signalpeaks vom Rauschunter- grund benötigten Schwellwerte 23 werden den Kreuzisgnalmuster-Suchmasken extern zun Verfügung gestellt.

Diese Vorgehensweise bietet die Möglichkeit, die bei der Durchführung einer Kteuzsignal- mustersuche verwendeten Parameter und Suchbereiche im Laufe der Suche zu verändern und an neu gewonnene Informationen anzupassen. Insbesondere ist es von Vorteil, die Suchbe- reichsgrenzen anfangs sehr breit zu wählen und in Abhängigkeit von den innerhalb der Such- bereiche auftretenden Peaks iterativ zu verkleinern, um so das gesuchte Kteuzsignahnustet mit höherer Sicherheit erfassen zu können. Entsprechend können die Schwellwerte 23 von einem anfangs niedrigen Wert im Laufe der Suche auf immer höhere Werte angehoben wer- den, um so die Kteuzsignaltnustet mit den höchsten Bewertungszahlen herauszufiltern.

Die im folgenden aufgefuhtten Programmroutine stellt eine Implementierung einer Kreuzsi- gnalmuster-Suchmaske dar, welche die zwei seitenkettenspezfischen 2D-Experimente "sHSQCcoN"sowie"sHSQCcaS"sowie das Paar von 3D-Tripeltesonanzexperimenten "HNcoCACB"sowie"HNCACB"auswertet. Diese tut ein Paar von Aminosäuren spezifi- sche Kteuzsignalmustet-Suchmaske umfasst also vier Untet-Suchmasken zur Auswertung der verschiedenen 2D-sowie 3D-Spektten. Die Verbindung der durch Auswertung der vetschie- denen Spektten gefundenen Ergebnisse erfolgt durch die chemischen Verschiebungen der Kerne im Überlappbereich, also insbesondere über die chemischen Verschiebungen von HN, N, Ca und Cß.

(-------------Appendix1-----------) Aus dem Programmcode ist insbesondere erkennbar, dass die Kreuzsignalmuster-Suchmaske in ihrer abstrakt festgelegten Form noch keine numerisch festgelegten Suchbereiche und Schwellwerte aufweist. Die entsprechenden Variablen #submatrix_sizes#,#sweep_widths#, "ppm_offsets"sowie"nucleus_species"sind lediglich in abstrakter Form definiert.

Das folgende Programmlisting zeigt die Kreuzsignalmuster-Suchmaske für die 2D-Spektren #sHSQCcoN",#sHSQCcaS" sowie der 3D-Spektren #HNcoCACB",#HNCACB", wobei inzwischen die Suchbereichsgrenzen 22 sowie die Schwellwerte 23 bereitgestellt wurden : (------------- Appendix 2 --------------) Insbesondere hinsichtlich der Parameter #matrix_sizes", #submatrix_sizes", #sweep_widths", #ppm_offsets", #nucleus_species" sowie #mask_lower_threshold" ist nun jeweils der numeri- sche Wertebereich festgelegt Sobald die Suchbereichsgtenzen 22 sowie die Schwellwerte 23 festgelegt sind, kann die Mu- stererkennungs-Software 20 mit der eigentlichen Musteterkennung beginnen. Hierzu werden die aufgezeichneten 2D-Spektren #2rr" sowie die 3D-Spektren #3rrr" mit den Suchbereichen der Kreuzsignalmuster-Suchmaske (bzw. einer ihrer Unter-Suchmasken) korreliert, um eine Bewertungszahl für das Vorliegen des durch die Kreuzsignalmuster-Suchmaske etfassten Kreuzsignalmusters zu erhalten.

Bei dem in Fig. 4 gezeigten Beispiel werden die Werte des Spektrums, die innerhalb der Si- gnalsuchbereiche 9,11, 13,15, 17,19 liegen, aufsummiert, um so die Bewertungszahl für das Vorliegen des Kreuzsignalmusters zu erhalten. Wenn die erwarteten Signalpeaks innerhalb der Signalsuchbereiche 9,11, 13,15, 17,19 auftreten, dann ergibt sich eine hohe Bewertungszahl für das gesuchte Kteuzsignahnustet. Dies bedeutet, dass das gesuchte Kteuzsignalmustet mit hoher Wahrscheinlichkeit vorliegt. Wenn die erwarteten Peaks in den Signalsuchbeteichen 9, 11,13, 15,17, 19 dagegen ganz oder teilweise fehlen, dann ergibt sich eine dementsprechend niedrige Bewettungszahl. In diesem Fall ist es unwahtscheinlich, dass das gesuchte Kteuzsi- gnalmustet vorliegt.

Zut Berechnung der Bewertungszahl wird ein sog. Masken-Scan 24 durchgeführt, bei dem die Koordinaten der chemischen Verschiebung in den verschiedenen Raumrichtungen nachein- ander hochgezählt werden, um so das gesamte Spektrum abzutastem. Der so erzeugte Koor- dinatenwert wird mit den Maskendaten 25 verglichen. Wenn der Kootdinatenwert außerhalb von sämtlichen Signalsuchbereichen der Kreuzsignalmuster-Suchmasken liegt, so bleibt die Bewettungszahl unverändert. Wenn der neu generiert Koordinatenwert dagegen innerhalb

eines Suchbereichs liegt, so wird der zu diesem Koordinatenwert gehörige Spekttenwert zu der Bewertungszahl addiert. Mit Hilfe eines derartigen Masken-Scans 24 lässt sich die Bewer- tungszahl für eine bestimmte Kreuzsignalmuster-Suchmaske bzw. für eine bestimmte Unter- Suchmaske der Kreuzsignahnuster-Suchmaske schnell und einfach ermitteln.

Bisher war davon ausgegangen worden, dass die Kreuzsignalmuster-Suchmaske lediglich eine Anzahl von Signalsuchbereichen umfasst, wobei innerhalb der Suchbereichsgrenzen das Auf- treten von Signalpeaks erwartet wird. Entsprechend können aber auch Leerbereiche definiert werden, wobei das Auftreten eines Signalpeaks innerhalb der Leerbereichs-Grenzen zu einer Verringerung der Bewertungszahl fühtt Derartige Leerbereiche stellen also gewissermaßen "verbotene"Bereiche dar, in denen keine Signalpeaks auftreten dürfen.

Zur Verbesserung der Erkennungsgenauigkeit kann versucht werden, die Qualität der 2D- bzw. 3D-Spektren vor der Durchführung der Mustererkennung mittels einer Faltungsoperati- on zu verbessern. Hierzu kann ein ideales Gauß-Signal, dessen Größe und Ausdehnung in etwa der Größe und Ausdehnung der erwarteten NMR-Signalpeaks entspricht, mit dem Spek- trum gefaltet werden. Auf diese Weise können Artefakte unterdrückt und verschmierte Peaks besser aufgelöst werden.

In Fig. 5A ist dargestellt, dass die Auswertung von zwei aminosäuretyp-spezifischen 2D- Spektren sowie von einem Paar von Tripelresonanzexperimenten vier Teilergebnisse 26,27, 28,29 liefert. Zur Auswertung der zwei aminosäuretyp-spezifischen 2D-Spektren können zwei hierfür geeignete Unter-Suchmasken vorgesehen sein, und zur Auswertung der zwei Ttipeliesonanzexpeiimente können zwei weitere Unter-Suchmasken der Kxeuzsignalmuster- Suchmaske definiert sein. Jede Unter-Suchmaske der betrachteten Kreuzsignalmuster- Suchmaske erzeugt ein Teilergebnis 26,27, 28,29. Beispielsweise enthält ein Teilergebnis tut ein bestimmtes 2D-Spektrum die chemischen Verschiebungen der innerhalb der Signalsuch- bereiche aufgefundenen Peaks zusammen mit der Bewertungszahl für die Unter-Suchmaske.

Die vier Teilergebnisse 26,27, 28,29, die bei der Auswertung der zwei aminosäuretyp- spezifischen 2D-Spektren sowie des Paars von Tripeltesonanzexperimenten entstehen, wer- den der Merging-Einheit 30 zugeführt. Aufgabe der Merging-Einheit 30 ist es, die unter- schiedlichen Teilergebnisse zu einer Ergebnisliste 31 zusammenzufassen. Hierzu werden die

chemischen Verschiebungen in den Überlappbereichen der einzelnen Teilergebnisse vergli- chen. Insbesondere auf der Grundlage der chemischen Verschiebungen der Keine HN sowie N kann dann über ein Intervall von HN AHN sowie von N AN das Metging, also eine Zusammenfassung der Teilergebnisse zur Ergebnisliste 31, vorgenommen werden. Ein Ein- trag in der Ergebnisliste 31 umfasst einen sog. Shift-Vektor, in dem die innerhalb von zwei aufeinanderfolgenden Aminosäuren auftretenden chemischen Verschiebungen aufgelistet sind, sowie die insgesamt für das Vorliegen der Zweiergtuppe von Aminosäuren ermittelte Bewerhmgszahl.

Im Anschluß wird die so entstandene Ergebnisliste gewichtet Der Wichtungsvorgang wird von der Cleaning-Einheit 32 vorgenommen. Die Cleaning-Einheit 32 überprüft die Plausibili- tät des gefundenen Ergebnisses, indem sie mit einer Wichtungsfunktion die Shift-Vektoren auf ihre Richtigkeit überprüft.

Im folgenden ist die Ergebnisliste einer Kreuzsignalmuster-Suchmaske aufgeführt, welche nach den von dem Aminosäurepaar N-S hervorgerufenen Kteuzsignalmustet sucht. Wie auf- grund der durch das Progtamm"selma"durchgefühtten Fragmentierung der Primärsequenz nicht anders zu erwarten, wurde lediglich ein Eintrag gefunden, da die Zweiergtuppe von aufeinanderfolgenden Aminosäuren N-S in der Pximäxsequenz des betrachteten Proteins OPR nur einmal vorkommt Der Eintrag in die Ergebnisliste enthält eine Auflistung von chemischen Verschiebungen sowie eine Bewettungszahl, die unter der Rubrik"Resp"aufge- führt ist (------Appendix 3------) Zur Überprüfung der Plausibilität des für das Aminosäurepaar N-S aufgefundenen Ergebnis- ses wird außerdem eine Mustersuche in den für die komplette Proteinhauptkette aufgezeich- neten 3D-Experimenten durchgeführt. Hierbei erhält man eine umfangreichere Ergebnisliste, deren Einträge wiederum eine Anzahl von chemischen Verschiebungen sowie eine Bewer- tungszahl umfassen : (------Appendix 4------)

Anhand der übereinstimmenden chemischen Verschiebungen kann erkannt werden, dass es sich bei dem Eintrag &num 53 um den Eintrag für das Aminosäurepaar N-S handelt Dies bestätigt die Konsistenz der bei den beiden Mustersuchen aufgefundenen Ergebnisse.

Nachdem für die einzelnen in der Proteinsequenz enthaltenen Aminosäurepaare Teilzuord- nungen vorgenommen worden sind, müssen diese Teilzuordnungen auf die Primärsequenz abgebildet werden. Dieser Schritt wird als Sequenz-Mapping 33 bezeichnet. Auf der Grundla- ge der Primärsequenz werden die Aminosäurepaare in den Ergebnislisten gesucht und mit der höchsten Wichtung beginnend auf die Sequenz abgebildet Nach jeder Iteration wird die Ver- kettung der einzelnen Paare überprüft und es werden so Fragmente von 2,3, 4 etc. Amino- säuren gebildet Nach Abschluß der Iterationsroutine werden die fehlenden Fragmente in den Ergebnislisten der Mustersuche für die 3D-Experimentepaare gesucht und auf die Sequenz abgebildet. Nach Abschluß der Hauptkettensuche erfolgt eine gezielte Suche in den Ergebnis- listen aller Seitenkettenexperimente.

Als Ergebnis des Sequenz-Mappings 33 erhält man eine vollständige sequenzielle Zuordnung 34 der in den verschiedenen Spektren auftretenden Signalpeaks zu den verschiedenen Amino- säuren der Sequenz. Damit ist die Aufgabe, eine möglichst automatisierbare Zuordnung der Spektralpeaks durchzuführen, ausgeführt Diese Zuordnung sowie die für die verschiedenen magnetisch aktiven Kerne des Proteins aufgefundenen chemischen Verschiebungen können als Ausgangspunkt für die automatische Zuordnung von NOESY-Spektren 36 herangezogen werden. Diese Zuordnung der NOESY- Spektren 36 zu den verschiedenen magnetisch aktiven Kernen des Proteins wird durch das Programm ARIA 35 durchgeführt Die Bezeichnung ARIA steht für Ambiguous Restraints for Iterative Assignment". Der Startpunkt für ARIA ist eine nahezu vollständige Zuordnung der protonenchemischen Verschiebungen, welche zusammen mit einer Liste der Amplituden der NOE-I<reuzsignale und ihrer Frequenzkoordinaten einem Strukturberechnungs- Programm (im speziellen Fall"Explor'übergeben wird. Die zentrale Aufgabe des Pro- gramms ARIA 35 ist die Zuordnung der NOE während der Strukturrechnung durch die An- nahme einer mehrfachen Bedeutung der einzelnen Kreuzsignale und die Anwendung einer iterativen Zuordnungsstrategie für dieselben. Appendix 1 /* shsgc_cacb_ns. 5. rg. patt */ /* intented to find Sell (C_älpha/C beta)-Sel2 (H/N/C_alpha/Cbeta)-patterns */ /* in related CBCA (CO) NNH/CBCANNH spectra */ /* using 2 selective HSQCs as search space limitation sources */ global t _global /************** GENERAL PARRMETERS *******************/ ************************. *****x***********************r***** spect_dir= ; results_filename= ; amino acidLdb= ; results_list_bin_count=6000 ; softesults count=4000 ; dist_thresh_scale=0. 3 ; /*********************************************************** */ /************ SPECTRUM SPECIFIC PARAMETERS ****************/ /*********************************************************** */ /* Spectrum 0 params */ spect_file="#shsqc-co-n. 2rr"; /* spect_type="suSQCcoN"; *t dimensions= ; matrix-sizes= ; submatrix_sizes= ; sweep widths= ; ppnL-offsets= ; nucleus-Species= ; mask_lower_threshold= ; /* 100% of theoretical results */ /* End of spectrum 0 params */ /* Spectrum 1 params */ spect_file=tEshsqc-ca-s. 2rr ; /* specttype='sHSQCcaS*t */ dimensions= ; matrix-sizes= ; submatrix_sizes= ; sweep ; ppm-offsets= ; nucleus-species= ; mask_Iower_threshold=,- Fortsetzung von Appendix 1 /* 100% of theoretical results */ /* End of Spectrum 1 params */ /* Spectrum 2 params */ spect_file=wthncocacb. 3rrr° ; /* spect_type="HNcoCACB' ; */ dimensions= ; matrix_sizes= ; submatrix_sizes= ; sweep widths= ; ppm_offsets= ; nucleus_species= ; mask-lower-threshold= ; /* 110% of theoretical results */ /* End of spectrum 2 params */ /* Spectrum 3 params */ spect_file="{hncacb. 3rrr ; /* spect_type="ENCACB"; */ dimensions= ; matrix-sizes= ; submatrix_sizes= ; sweep widths= ; ppmoffsets= ; nucleus_species= ; masllower_threshold= ; /* 200% of theoretical results */ /* End of spectrum 3 params */ genericealsize= ["C, 1. 894055] ; genericeak_size= ["H", 0. 120357] ; generic-Peak-size= ["N", 1. 541250] ; genericeak-size= ['c", 1. 397686] ; /* Specify that all peaks of a given type must be present in all spectra in order to generate a valid result. */ multi_spectrumLlogical_op="and"; /* If intermediate results processing is done at all, then do it before results list blending. */ intermediate-results-list-processing=true intermediate-processing-after-blending=tfalsewi /* A more stringent response calculation strategy hoastmaskL-responses='true* : /* Initialise all patches to 0 before mask scarning patch_init_zero="true"; Fortsetzung von Appendix 1 ) NSz_spin_sysl { pattern_group="NSz-; maskresponseptodificatiorLfn='limitingaiidln' ; search-level=0 ; : results_recyele_seareh_level="true" forget natch with_uninstantiated_c, het_shift='false ; /* Look for HN-N (Ser) crosspeaks in sHSQCcoN */ /* sHSQCcoN, HN-N (Ser) */ current_spect="shsqc-co-n. 2rr"; crosspeaksjmultispectruDlist= [shsqc-co-n. 2rr] ; mask_response-modif icationfn-params= [5820, 1001 ; masklowerthresholcLscale=l. 0 ; speetrum_lower_threshold=0 ; mask lorenzian= [1. 000000, 0. 120357, 0. 631352] ; cross-peak= [[Ser, H, [l], tSer, N, {l]] ; spectrum-lower threshold unset=true' ; /* Look for HN-N (Ser) crosspeaks in sHSQCcaS */ /* sHSQCcaS, HN-N (Ser) */ eurrent_spect="shsqe-ea-s. 2rr ; cross_paaks_multi_spectruin, _list= Eshsclc-ca-s. 2rr] maskresponsejnodificationfnparams= [2590, 100] ; masklowerthreshold. scale=l. 0 ; spectrum-lower-threshold=0 ; mask_lorenzian= [l. 000000, 0. 120357, 0. 631352] cross Deak=t [Ser, H, {l], tSer, N, §1]] ; spectriylower_threshold_unset="true" ; maslresponse_modification_fn= thru' ; search level=1 ; resultsrecyclesearcllevel'true' ; forget_pateh_with_uninStantiated-chemLshift="falseti /* Look for C_alpha (Asn)/C_beta (Asn) crosspeaks at HN-N (Ser) values */ /* CBCANNH, c-bota (Asn) */ current_spect='hncacb. 3rrr ; crosspeakspMltispectrumlist : = [hncacb. Srrr] : masklowerthresholdscale=l. 0 ?. . a spectrumupper threshold=0 ; iaaslorenzian= [-2. 000000, 0. 120357, 0. 924750, 0. 631352] ? Fortsetzung von Appendix 1 cross_peak= [lSer, H, til, rAsn, C_beta], lSer, N, lj j ; spectrwa_upper_threshold_unset=true^ ; /* CBCA (CO) NNH, -beta (Asn) */ current_spect=hncocac5. 3rrr";' cross peaks_multi_spectrum_list= [hncocacb. 3rrr] ; mask_lower_threshold_scale=1. 0 spectrum. lower threshold=0 ; masklorenzian= [l. 000000, 0. 120357, 0. 924750, 0. 631352] ; cross-peak= [ [Ser, H, lj ; [Asn, Cetaj, ISer, N, ij] ; spectrum_lower-threshold-unset="truew ; /* CBCRNNH, C_alpha (Asn) */ current_spect="hncacb. 3rrr"; crosspeaks ! nult : ispectrumlist= [hncacb. 3rrr] ; masllower thresholdscale=1. 0 ; spectrum lower-threshold=0 ; mask_lorenzian= [2. 000000, 0. 120357, 0. 924750, 0. 631352] ; cross-peak= [[Ser, H, §1], [Asn, C_alpha], [Ser, N, {1] ; spectra lower_threshold unset="true ; /* CBCA (CO) NNH, Calpha (Asn) */ current_spect=whncocacb. 3rrr" ; cross_peaks_Wult iSPectrum-list=lhncocacb. 3rrrl ; masklowerthresholdscale=l. 0 ; spectrunL-lowerthreshold=0 mask_lorenzian=tl. 000000, 0. 120357, 0. 924750, 0. 631352] ; cross_peak=ttSer, H, b1], [Asn, Calpha], [Ser, N, ill 1 spectrunlowerthresholdunset='true' : search-level=2, results_recycle_searchlevel=true" ; forget natch_with_uninstantiated_chem_shift="falset ; /* Look for C_beta (Ser)/C_alpha (Ser) crosspeak pairs at HN-X (Ser) values */ /* CBCANNH, C beta (Ser) */ current_spect=thncacb. 3rrr"; cross_peaks_multi_sPectrum-list= [hncacb. 3rrr mask-lower-threshold-scale=2. 0 ; spectrum-upper-threshold=0 ; masllorenzian= [-1. 000000, 0. 120357, 0. 924750, 0. 631352] ; cross_peak= [ISer, H, i], (Ser, C, eta, #1], (Ser, N, lj] ; spectrunnpper-threshold-unset= true ; ./* CBCANNH, C_alpha (Ser) */ current_spect=thncacb. 3rrr", crosseaksnulti-spectrunlist= [hncacb. 3rrrj ; mast_lower_threshold_scale=2. 0 ; l Fortsetzung von Appendix 1 spectrutlower_threshold=0 ; mask_lorenzian-tl. 000000, 0. 120357, 0. 924750, 0. 6313521 cross-Peak=E [Ser, H, #1], [Ser, C_alpha, Xll, [Ser, N, 411) ; spectrunlowerthresholdunset='true' : /* Delete results containing false-degeneracy overlapparam=0. 15 ; overlap--pair-- [[Ser, C_alpha§l], [Ser, C_beta, §l]], overlapwair-[[Asn, C_alphal, tAsntc-betal] ; overlap-pair= [ tAsnt C alpha], [Ser, C_alpha, ljj ; overlap. air= IAsn, C alphal, ISer, C, eta, i] ; overlapair= [ [lsn, Ceta], [Ser, C alpha, #i]] ; _ overlapair= [IAsn, C. etaj, [Ser, Ceta, 1) j ; /* The remaining results list processing will only be done at the final processing stage */ intermediatejresultslistprocessing='false't /* Do some clustering on all those nearly identical results */ secondary. _clustering_narrowband, nucleii= [ [Ser, H, ij, [Ser, N. lll ; secondary_clustering= [3, 0. 2, 60. 0l ; Appendix 2 /* shsqc_cacb_ns. 5. rg. patt */ /* intented to find Sell (C alpha/C-beta)-Sel2 (H/N/C alpha/C beta)-patterns */ /* in related CBCA (CO) NNH/CBCANNH spectra */ /* using 2 selective HSQCs as search space limitation sources */ _global ( /************** GESERaL PARAMETERS *******************f /*********************t************************************* */ spect dir=/usr/people/psf/catchwork/opr/spectra' ; results_filename=/usr/people/psf/catchwork/opr/resl/shsgc_ca cbs. 5. rg ; amino_acid_db=tSuSr/people/pSf/catchwork/opr/chem_shift_db/a mino_acid_HCN. c hou ; resultslistMncount=600D ? soft_naxiresults cöunt=4000 ; dist_thresh scale=0. 3 ; SPECTRUM SPECIPIC PAP-UMTERS /************ SPECTRUM SPECIFIC PARAMETERS ****************/ /*************************************t********************* */ /* Spectrum 0 params spect_file= « {shsqc-co-n. 2rrt ; /* spect_type= « sHSQCcoN « ; */ dimensions=2 ; matrix_sizes=t288, 2561i sübmatrixsizes= [288, 256] ; sweep widths= [4. 686, 49. 52 ; ppotfsets= [5. 797, 94. 836j ; nucleus_species=tH, N], maslc_lower_threshold=2320 ; /* 100% of theoretical results */ /* End of spectrum 0 params */ /* Spectrum 1 params */ spect_file=« shsqc-ca-s. 2rr ; /* spect_type=tsHSQCcaSt ; */ dimensions=2 ; matrix_sizes=t288, 256] ; submatrix_sizes= [288, 256j ; sweepwidths= [4. 686, 4P. 5261 ; ppm-offsets= [5. 797, 94. 836]',- nucleus s ? ecies=tz] Fortsetzung von Appendix 2 . mask_lower_threshold=4340 ; /* 100% of theoretical results */ /* End of spectrum 1 params */ /* Spectrum 2 params */ spect_file="{hncocacb. 3rrr"; /* spect_type="HNcoCACB « ; */ dimensions=3 ; matrix_sizes=t288, 256, 2561 ; submatrix-sizes= [16, 16, 16] ; sweep_widths=l4686, 66265S49. 5261 ; pp=eoffsets=t5. 798, 12. 267, 94. 836] ; nucleus_species=lH, C, N] ; mask_lower_threshold-8280, /* 110% of theoretical results */ /* End of spectrum 2 params */ /* Spectrum 3 params */ spect file='hncacb. 3rrr : /* spect_type=tEWCNCB ; */ dimensions=3 ; matrix-sizes= [288, 256, 256] ; submatrix-sizes= 116, 16, 16] ; sweep-widths= (4. 686, 66. 265, 49. 526] ; ppmoffsets= [5. 798, 12. 267, 94. 836l ; nucleus_species= (H, C, Nj : masllower threshold=2960 ; /* 200% of theoretical results */ /* End of spectrum 3 params */ generic_peak_size= ["C', 1. 894055] ; generic ['H*, 0. 120357] ; generic_Peak_sizeit"N", 1. 541250] ; generic_Peaksize= ['c', l. 397686] ; /* Specify that all peaks of a given type must be present in all spectra in order to generate a valid result. */ multi_spectrulogical Op= and' ; /* If intermediate results processing is done at all, then do $t before results list blending. */ intermediate_resultS-list Drocessing="true"; intermediate Drocessing_after_blending="false"; /* A more stringent response calculation strategy */ honest mask_responses="truew /* initialize all patches to 0 before mask scanning * Fortsetzung von Appendix 2 patch_init_zero=true ; . NSz_spinsysl { patternLgroup=NSz": mask_response_modification_fn="limiting_and_lnt ; search-level=0 ; resülts recycle_searchlevel=true ; forget-patch-with-uninstantiated_chexLshif t=Rfalsem ; /* Look for HN-N (Ser) crosspeaks in sHSQCcoN */ /* sHSQCcoN, HN-N (Ser) */ current_spect= « shsqc-co-n. 2rrg ; cross-peaks-multi-spectrwR-list= [shsqc-co-n. 2rr] mask_resPonseJmodification-fn-params= [582 mask_lower_threshold_scale=1. Os spectrum-lower_threshold=0 ; mask_lorenzian=tl. 000000, 0. 120357, 0. 631352 crosspeak= [ [Ser, H, fll, [Ser, N, pull 1 ; spectrumLlower thresholcLunset="true ; /* Look for HN-N (Ser) crosspeaks in sHSQCcaS */ /* sHSQCcaS, HN-N (Ser) */ current_sPect=shsqc ca-s. 2rr"; cross_peaks_multi_sPectrum-list=tshsqc-ca-s. 2rrl maskresponseptodificationfnparams= [2590, 100] ? mask-lower-thresholcl-scale=1. 0 ; spectrum_lower_threshold=0 ; masX lorenzian= [1. 000000, 0. 120357, 0. 6313521 cross_peak= [ [Ser, I-1, #11, (Ser, N, fl] 1 ; spectrunlowerthresholdunset='true' ; mask_response_modification_fn=wthrua ; searchlevel=1 ; results_recycle_search_level=truet ; forget patch with_uninstantiated_chem_shift=tfalse ; /* Look for Calpha (Asn)/CJ ? eta (&sn) crosspeaks at HN-N (Ser) values */ t /* CBCANNH, C beta (Asn) */ current_spect="hncacb. 3rrr-; cross reaks_mu'Li_sPeCtrum_list ;-tbncacb3rrrlv mask_lover_threshold_scale=1. 0, : ; pectrum spper_threshold=Of masklorenzian= [-2. 000000, 0. 120357, 0. 924750, 0. 6313521 ; Fortsetzung von Appendix 2 cross_peak= [ [Ser, H, ill, [Asn, C_beta], tSer, N, tl]] ; spectruupper_thresholcl"unset="true ; /* CBCA (CO) NNH, Cbeta (Asn) */ current_spect="hncocacb. 3rrr-; cross-peaks-multi-spectrwA-list=thncocacb. 3rrr] mast_lower_threshold_scale=1. 0 spectrum_lower_threshold=0 ; mask_lorenzian=tl. 000000, 0. 120357, 0. 924750, 0. 631352] cross-peak= [tSer, H, §1], tAsn, C_beta], tSer, N, {1]] ; spectrumalower_threshold unset=true"; /* CBCANNH, C alpha (Asn) */ currentspect='hncacb. 3rrr* ; cross_peaks_multi_sPectruz ist=thncacb. 3rrr] mask_lower_threshold_scale=1. 0 spectrum-lower-threshold=0 ; mask_lorenzian= [2. 000000, O. 120357, 0. 924750, 0. 631352] cross-Peak= [[Ser, H, #l], [Asn, C alpha], [Ser, N, lj] ; spectrunL. lowerthresholcUunset='true* ? /* CBCA (CO) NNH, C alpha (Asn). */ current_spect"hncocacb. 3rrrZ crosseaks_multitspectrum list= [hncocacb. 3rrr] ; mask_lower_threshold_scale=l. 0 spectrum_lower_threshold=0 ; masklorenzian= [l. 000000, 0. 120357, 0. 924750, 0. 631352] ; cross neak= [[Ser, H, #l], [Asn, C_alpha], [Ser, N, fll ; spectrumLlower_threshold_tulset= « true"; -level=2 ; results_recycle_search_level="true"; forget_patch_with-uninstantiated-chem_shif t="falsen* ; /* Look for C_beta (Ser)/C_alpha (Ser) crosspeak pairs at HN-N (Ser) values */ /* CBCANNFi. Ceta (Ser) */ c'urrent_spect=."hncacb. 3rrr"; cross-peaks-multi-spectrwR t=thncacb. 3rrr mask_lower_threshold_scale=2. 0 ; spectrumLupper_threshold=0 ; mask-lorenzian= t-1-000000, 0. 120357, 0. 924750, 0. 6313521 cross-Peak= [[Ser, H, #1], [Ser, C-beta, #l], [Ser, N, #111 ; spectrunuupperthresholdunset='true'' ; /* CBCAlEE, C_alpha (Ser) */ currer__spect=thncacb. 3*rr", crosäpeakspniltipsctrumlist= [hneacb. 3rrrJ ; Fortsetzung von Appendix 2 mask-lower-thresholcl-scale=2. 0 ; spectrum_lower_threshold=0 ; mask_lorenzian~tl. 000000, 0. 120357, 0. 924750, 0. 631352] ; cross-peak= t [Ser, H, il], tSer, C_alpha, {l], tSer, N, {1]] # spectrunL. lowerthresholdunset='true' ; /* Delete results containing false-degeneracy */ overlapparam=0. 15 ; overlap-Pair= t (Ser, C-alpha, #11, [Ser, C-beta, #111 overlapair= ( [Asn, C alpha], [Asn, Cetaj j ; overlap-pair= [IAsn, C alphaj, [Ser, C alpha, l]] ; overlap_pair--E (Asn, C-alphal, [Ser, C-beta, fll 1 overlap_pair=ttAsn, C_beta], tSer, C_alpha, {1]] ; overlap_pair=ttAsn, C_betalwtSer, C_beta, {1]] ; /* The remaining results list processing will only be done at the final processing stage */ intermediate_results_list_processing="false"; /* Do some clustering on all those nearly identical results */ secondary-clustering-narrow-hand-nucleii= [lsertHtçl] ftsertN secondary_clustering=t3tO. 2, 60. 0] ; Appendix 3 sequence_alloc : WARNING-sequence->residues=7fff2ea8 is non-NULL, this could cause trouble later on ! ip_all_bring : WRNING-cantt open input file-C matrix_hsh set to 0 matrixxtntcheck : WARNING-non-integer number of submatrices along axis 0 matrix_hsh set to 1 matrixxtntcheck : WARNING-non-integer number of submatrices along axis 0 matrix_hsh set to 2 matrix_ctnt_check : WARNING-non-integer number of submatrices along axis 0 matrixhsh set to 3 matrixctnt check : WARNING-non-integer number of submatrices along axis O : special_spect=shsqc-co-n. 2rr, matrix_hsh set to 0 special_spect=shsqc-ca-s. 2rr, matrix_hsh set to 1 special_spect=hncacb. 3rrr, matrixhsh set to 3 special_spect=hncocacb. 3rrr, matrixsh set to 2 special_spect=hncacb. 3rrr, matrix hush set to 3 special_spect=hncocacb. 3rrr, matrix_hsh set to 2 special_spect=Imcacb. 3rrr, matrix_hsh set to 3 special_spect=hncacb. 3rrr, matrix hush set to 3 distribn_data_parse : repeateq_distr_hsh=l after copy to distribn, speeialuninstantiatedreponsesdiminish. diminish_param=-1000000 Outputs list for distribn NSzspinsysl in NS. shsqc_cacb_xy. 5. rg assignmentskeinminkoutpt : sfromfilepeneraltuples : WARNINC-can't open file/usr/people/ psf/catchwork/opr/spectra/chemshift_db/assignments. asg, errno=2 outpts oheclassignements : WARNING-error while trying to read assignments list, giving up !. Outputs status counts : UNCHECKED (f) =1, GOOD (+) =0, PARTIAL (-) =0, BADt-) =0, UNCERTAIN (?) =0 outpts->count=l Fraction of found results which are correct : 0. 000000 Fraction of correct found results compared to assignment list : 0. 000000 iNum H#1 N#1 CB CA CBtl caffi Resp Orig Status S lev tO 8. 04 114. 4 38. 7 56. 5 63. 0 61. 2 307907 307907 ? 2 Appendix 4 sequence alloc : WARNING-sequence->residues=7fff2ea8 is non-NULL, this could cause trouble later on ! ip_all_bring : WARNING-can't open input file-C matrix_hsh set to 0 matrix_xtnt_check : WARNING-non-integer number of submatrices along axis 0 matrix_hsh set to 1 matrix_xtnt_check : WARNING-non-integer number of submatrices along axis 0 special_spect=hncacb. 3rrr, matrix_hsh set to 1 special_spect=hncocacb. 3rrr, matrix-hush set to 0 special_spect=hncacb. 3rrr, matrixsh set to 1 special_spect=hncocacb. 3rrr, matrix-hsh set to 0 specialspect=hncacb. 3rrr, matrixhsh set to 1 special_spect=hncacb. 3rrr, matrixhsh set to 1 distrihndataparse : repeated_distr_hsh=1 after copy to distribn, speciäl_uninstahtiated_reponses_diminish. diminish_param=-1. 000000 Outputs list for distribn ZZz_spin_sysl in cacb_ZZ. 5. rg assignments_kemmink_outpts_from_file_general_tuples: WARNING - can't open file /usr/people/ psf/catchwork/opr/spectra/chem_shift_db/assignements.asg, errno=2 outpts_check_assignements: WARNING - error while trying to read assignements list, giving up ! Outputs status counts: UNCHECKED(#)=68, GOOD(~)=0, PARTIAL(#)=0, BAD(-)=0, UNCERTAIN(?)=0 outputs->count=68 Fraction of found results which are correct : 0. 000000 Fraction of correct found results compared to assignment list : 0.000000 #num HE1 CB N#1 CA CB#1 CA#1 Resp orig Status S lev #0 7.46 40.0 122.3 62.0 40.0 57. 6 91041 91041 t 2 #1 8.45 41. 5. 120.2 63.5 28.8 60.4 96803 96803 t 2 #2 7.47 31.7 121.9 62. 0 30.6 55.2 97104 97104 t 2 #3 7. 99 41.5 121.0 56.8 30. 4 60.2 101023 101023 ? 2 #4 7.88 34.3 117.7 58.6 41.5 54.5 104999 104999 # 2 #5 8.27 41. 8 121.7 61.2 63.3 56.5 111576 111576 t 2 &num 6 7.16 31.9 109.5 58.9 31.9 62.0 140917 140917 # 2 #7 8.79 38.7 118.2 61.2 70.0 62.5 171035 171035 # 2 es 7.73 35.3 120.0 62.5 31.9 62.5 176825 176825 t 2 #9 7. 95 32.7 116.5 62. 5 63.3 59.6 186360 186360 # 2 #10 8.73 41.5 120. 6 60.2 37.9 55.0 189706 189706 # 2 #11 7.85 34.3 117.5 55. 8 41.5 56.5 191219 191219 t 2 #12 8.01 70.0 122.5 62.5 34.5 55.8 200630 200630 t 2 &num 13 8.29 41.8 122.3 56.8 31.4 57.8 223566 223566 f 2 #14 8.89 41.5 121.9 58.6 35.3 54.7 229663 229663 t 2 &num 15 8.99 40. 2 124. 6 57.8 34.3 60.4 231465 231465 # 2 &num 16 8. 48 34.5 119. 0 55.8 41.5 60.2 232651 232651 t 2 #17 8.03 40.0 120.2 53.4 38.9 57.0 237701 237701 &num 2 ? 8. 42 31.9 120. 6 63.5 38.7 61. 2 239183 239183 # 2 #19 8.65 32.7 127. 1 64.6 43.6 53.7 240375 240375 t 2 #20 8.29 34.3 123.5 60.4 32.7 64. 6 241063 241063 t 2 #21 7. 72 40. 0"118. B 57.6 35. 6 62.5 244107 244107 f 2 &num 22 7.64 31.9 124.8 66.6 17.2 55.5 246356 246356 ? 2 &num 23 8.99 41.5 122.1 56.5 47.7 53.2 249523 249523 # 2 ? 24 9.17 70. 8 127. 7 61.7 46. 7 53.7 259105 259105 t 2 #25 9.38 47.7 124. B 52.9 39.2 52.4 263672 263672 &num 2 #26 8. 27 29.1 119.2 56. 0 56.5 53.4 264286 264286 t 2 8. 34 18.7 120. 0 55.0 37.9 65.3 271791 271791 # 2 &num 28 10.04 43.6 111.1 53.7 45. 4 53.7 280601 280601 ? 2 &num 29 9.39 37.9 118.1 54.7 42.8 54.5 280748 280748 ? 2 #30 7.91 32.7 116. 1 57.8 37.9 62.5 280801 280801 t 2 &num 31 9.17 39.7 126.2 60.2 41.3 56.0 282694 282694 # 2 #32 7.44 40. 0 122. 7 56.8 58.1 57.6 284331 284331 # 2 #31 8. 14 42.3 124. 0 54.5 39.7 59.4 288520 288520 # 2 7.95 37.9 116.9 62.5 63.3 59. 6 293788 293788 # #35 8.32 17.2 115.5 55.5 31.7 60. 4 295905 295905 # 2 &num 36 9. 07 66. 4 120.6 56. 5 41.5 58.6 299177 299177 # 2 Fortsetzung von Appendix 4 &num 37 7.56 31.7 120.8 60.4 28.8 58.9 306337 306337 # 2 t38 9.30 39.2 121.0 51.4 41.5 61.2 307877 307877 $ 2 t39 7.96 41.5 108.2 54.2 44.9 54.2 310943 310943 t 2 #40 8.91 30.1 128.9 54.7 40.5 52.1 311042 311042 t 2 #41 8.55 32.7 120.0 55.2 34.3 55.8 312709 312709 # 2 #42 7.67 29.4 115. 0 58.3 39.7 52.9 312872 312872 t 2 #43 7. 31 37.4 120. 8 56.3 31.7 66.6 316592 316592 # 2 #44 8.74 35.3 122.9 54.7 42.3 54.5 317300 317300 # 2 #45 7.70 63.0 121.0 58.9 32.5 57.8 318099 318099 # 2 &num 46 8.61 41.3 117.9 56.0 70.8 61.7 318325 318325 # 2 &num 47 7. 93 40.7 121. 0 57. 8 18.2 54. 5 320419 320419 t 2 #48 8.16 38.9 118.2 61.2 40.0 57.3 328780 328780 t 2 &num 49 8.69 31.4 118.8 57. 8 37. 4 56.3 335766 335766 # 2 #50 8.65 40.5 117.9 52.1 29.1 58.6 336012 336012 t 2 #51 7.91 29.1 117.7 58.6 41.5 54.2 347755 347755 # 2 &num 52 8.27 29.1 118.8 56.0 38.7 53.4 357189 357189 &num 2<BR> <BR> &num 53 8.03 38.7 114.4 56.5 63.0 61.2 367775 367775 &num 2 #54 8.03 39.4 117.7 53.2 37.6 54.5 373377 373377 # 2 #55 7.62 28.8 119. 2 60.4 41.8 57.0 376358 376358 § 2 &num 56 7.98 30.4 121.3 56. 8 39.7 60.2 383991 383991 t 2 &num 57 8.45 41.5 119.6 58.6 28.8 60.4 387741 387741 e 2 #58 8.21 42.8 121. 7 54.5 30.1 54. 7 389791 389791 1 2 #59 8.56 46.7 128.5 53.7 41. 5 55.2 395987 395987 1 2 {60 8.60 41. 8 118.6 53.4 40.2 57. 8 412710 412710 1 2 t61 8.27 38.7 121.1 61. 2 63.3 56.5 435329 435329 4 2 &num 62 8.17 63.5 119.4 59.6 38.9 53.9 465044 465044 #1 2 #63 7.88 38.9 111. 7 53.9 70.0 62.2 480823 480823 e 2 #64 8.50 64.0 122.3 58.3 30.4 56.8 533576 533576 e 2 #65 7. 99 38.9 120.0 53.4 40.7 61.2 654596 654596 # 2 #66 8.39 38.7 117.9 53.4 54.2 52.1 785998 785998 t 2 &num 67 8. 29 38.9 118. 1 53.4 32.7 55.2 996108 996108 1 2