Hoge resolutie NMR spectroscopie is tegenwoordig een routinematig gebruikte techniek voor het bepalen van de structuur van biomoleculen, die in het bijzonder geschikt is voor het bestuderen van dynamische eigenschappen en complementair is aan röntgenkristallografie. Momenteel zijn er meer dan 1500 structuren van biomoleculen met NMR bepaald en vrij toegankelijk in de Protein Data Bank. Dit proefschrift beschrijft de structuurbepaling van één structuur, BRSV-G, en de validatie van de protongeometrie van alle NMR structuren die zijn opgeslagen vóór 1999. Van 97 structuren, waarvan in 1996 ook NOE gegevens beschikbaar waren, worden analyses gepresenteerd van de kwaliteit en de compleetheid van de gegevens.
Het eerste hoofdstuk introduceert de meest gebruikte technieken voor structuurbepaling en vele validatieaspecten. De met NMR meetbare afstanden tussen protonen, afgeleid van de NOEs, vormen de belangrijkste bron van informatie voor de bepaling van structuren in oplossing. De NOEs worden in het algemeen gebruikt in een kunstmatige energiefunctie in een moleculaire dynamica simulatie. Ze zorgen voor de vouwing van een structuur die in het begin nog willekeurig is. Het vouwingsprobleem van een structuur bepaald met NOEs is onderbepaald, er zijn namelijk meer te bepalen parameters dan er gegevens zijn. Om een schatting van de variatie te krijgen, moet de berekening enkele malen herhaald worden. Een hoge variatie in een gedeelte van een structuur kan soms, bijvoorbeeld bij het HU eiwit, de echte flexibiliteit in de oplossing weerspiegelen in plaats van een gebrek aan experimentele data. Onderscheid is allereerst gemaakt tussen de validatie van coördinaten en van experimentele gegevens. Programma's als PROCHECK en WHAT IF werden in het begin van de jaren 90 ontwikkeld voor het vergelijken van de geometrische eigenschappen van kristal en NMR structuren met de standaardwaarden die waren afgeleid van hoge resolutie kristalstructuren. De experimentele NMR data, bijvoorbeeld de chemische verschuiving en NOEs, kunnen gevalideerd worden door vergelijking met de op basis van de berekende modellen verwachte waarden. Voor NOE afstandslimieten wordt het verschil meestal uitgedrukt in een rms van de NOE limietschendingen. Gangbare waarden voor de kwaliteit van de experimentele gegevens en de coördinaten zijn gegeven.
In Hoofdstuk 2 wordt de NMR structuurbepaling van het immunodominante gebied van het aanhechtingseiwit G (BRSV-G) van het bovine respiratoire syncytiale virus (pinkengriepvirus) beschreven. Van het bestudeerde 32 residuen tellende peptide vormen 19 residuen een kleine rigide kern. De kern bestaat uit twee korte helices die verbonden zijn door een type I' bocht en twee disulfide bruggen. Deze unieke vouwing is een van de kleinste stabiele tertiaire structuren die bekend zijn en kan daarom gebruikt worden als een ideale bouwsteen voor het ontwerpen van de novo eiwitten en als testgeval voor modelleringstudies. Een karakteristieke hydrofobe holte die door geconserveerde residuen gevormd wordt, ligt aan de oppervlakte van het peptide en kan een rol spelen bij het binden aan een receptor. Dit werk geeft een structurele onderbouwing voor de verdere ontwikkeling van een peptide vaccine tegen de ernstige ziektes die respiratoire syncytiale virussen bij runderen en mensen veroorzaken.
De Hoofdstukken 3 en 4 bevatten de analyses van de coördinatenkwaliteit en de NOE compleetheid van 97 structuren waarvan de NOE data beschikbaar was in 1996. In Hoofdstuk 3 wordt de kwaliteit van deze structuren bepaald in relatie met de hoeveelheid experimentele informatie. De experimentele afstandslimieten werden met het programma AQUA geanalyseerd. Veel nomenclatuurinconsistenties tussen de opgeslagen files met limieten en met coördinaten zijn opgelost. Een groot gedeelte van deze experimenteel bepaalde afstanden in de bestanden werd als redundant aangemerkt. De procedures voor het analyseren en corrigeren van de inconsistenties en limiettellingen zijn beschreven. De analyse van NOE limiet schendingen (met AQUA) en een verzameling van geometrische kwaliteitsindicatoren (berekend met PROCHECK_NMR en WHAT IF) kunnen als referentie dienen voor andere structuurbepalingen met NMR. De mate van de NOE schending is anti-gecorreleerde met de kwaliteit van de groepering in de Ramachandran diagram. De precisie, zoals gemeten door de circulaire variatie van de tweevlakshoeken van de ruggengraat, neemt toe met de hoeveelheid experimentele data zoals verwacht maar wordt soms overschat. Bindingslengten, bindingshoeken en vlakheid van groepen kunnen behoorlijk afwijken van ideale waarden. Uitbijters lijken gegroepeerd te zijn per laboratorium, wat een indicatie is dat de resultaten afhangen van specifieke onderdelen van het verfijningsprotocol en/of programmatuur. Het probleem van overlappende atomen is in een aantal van de verfijnde structuren vastgesteld. Aanbevelingen die verschillende van deze problemen zouden moeten oplossen, zijn gegeven.
In Hoofdstuk 4 wordt de compleetheid van NOEs gedefinieerd als de verhouding van het aantal experimenteel waargenomen NOEs en het aantal ‘verwachte NOEs’. Een praktische definitie van het aantal verwachte NOEs, die gebaseerd is op die afstanden in de modellen die onder een bepaalde waarde liggen, wordt voorgesteld. De gemiddelde compleetheid van de set van 97 structuren is 68, 48 en 26 % voor afstanden tot respectievelijk 3, 4 en 5 Å. Voor vijf recente ‘state-of-the-art’ structuren zijn deze getallen ongeveer 90, 75 en 45 %. Bijna 20 % van de waargenomen NOEs zijn van atomen die verder dan 5 Å van elkaar af liggen in de uiteindelijke structuren. De compleetheid is onafhankelijk van de relatieve toegankelijke oppervlakte en is niet sterk afhankelijk van het residutype, de secundaire structuur of de lokale precisie, alhoewel het aantal waargenomen NOEs uit deze indelingen behoorlijk varieert. De compleetheid van NOE limieten is een bruikbaar kwaliteitscriterium tijdens de structuurverfijning. De compleetheid per residu is informatiever dan het aantal NOEs per residu waardoor het bruikbaar gereedschap wordt voor het bepalen van de kwaliteit van de NMR gegevens in relatie met de uiteindelijke structuren.
In het laatste hoofdstuk, Hoofdstuk 5, wordt een statistische analyse beschreven van 1.200 van de 1.404 met NMR bepaalde structuren van eiwitten en nucleïnezuren zijn opgeslagen in de PDB vóór 24 december 1998. Meer dan 100 structuren hebben minder dan 95 % van de verwachte protonen aanwezig en zijn, samen met de structuren die de PDB nog niet volledig gevalideerd had, niet in deze studie opgenomen. Het doel is om de protongeometrie van de overige structuren te bestuderen en de nomenclatuur te controleren en corrigeren waar nodig. Afwijkingen in bindingslengten, bindingshoeken, ‘improper’ dihedraalhoeken en vlakheid worden geverifieerd tegen standaard waarden. Bij meer dan 100 structuren zijn anomale protoneringstoestanden van sommige van de aminozuren aangetroffen. Ongeveer 250.000 (1.7 %) atoomnamen verschillen van de naamgeving die de PDB in het algemeen aanhoudt. De meeste inconsistenties zijn te wijten aan een verwisselde prochirale naamgeving. Voor een behoorlijk aantal structuren, waarvan vele gemiddelde structuren zijn, bestaan grote afwijkingen van de verwachte geometrie. De meest voorkomende oorzaken voor deze afwijkingen lijken te zijn: een slechte minimalisering van de gemiddelde structuren en een slechte balans tussen het krachtveld en de experimentele gegevens. Sommige specifieke uitbijters in de geometrie zijn gerelateerd aan de gebruikte verfijningprogramma's. Een aantal aanbevelingen voor biomoleculaire databanken, modelleringsprogramma's en aanleveraars van structuren worden gegeven.