Siden sidst: Julegaver

Publiceret Januar 2003

Siden sidst dækker denne gang perioden fra ca. oktober 2002 til januar 2003. Der har igen været rigeligt at vælge imellem, idet de sædvanlige 8-10 artikler (denne gang 8) fordeler sig meget højt med flere repræsentanter i Cell, Nature tidsskrifterne og EMBO Journal. Enjoy!

Knuder, proteiner og Gauss integraler

Automatic classification of protein structure by using Gauss integrals

PNAS 100 (2003): 119-124.
P Røgen & B Fain. Danmarks Tekniske Universitet og Stanford University.

Sammenligning af protein strukturer er et vigtigt redskab i mange biologiske problemstillinger. For eksempel viser det sig at fjerne homologer ofte er nemmere at detektere ved struktur- end ved sekvenssammenligninger. Denne slags sammenligninger kan ofte give en ide om funktion eller substrat for proteiner med ukendt funktion, og det er ofte i den såkaldte "Twilight Zone" af strukturel lighed at nye struktur biologiske sammenhænge opdages. Det er derfor vigtigt at have effektive redskaber til sammenligning af protein strukturer.

Protein strukturer opbevares i en række databaser. Den mest kendte er protein databanken PDB, hvor de løste proteinstrukturer opbevares. I klassifikation og sammenligning af strukturer viser det sig dog, at det er nemmere at  splitte strukturerne op i individuelle domæner. Der findes mange forsøg på definitioner af domæner, men groft sagt drejer det sig om kompakte dele af protein strukturer, der kan findes gentagne gange som element i forskellige strukturer. Udover PDB findes der derfor også domæne databaser, hvoraf CATH, SCOP og FSSP nok er de mest benyttede. I modsætning til PDB, hvis primære formål er at opbevare de publicerede strukturdata, forsøger domæne databaserne at klassificere og sammenligne strukturerne af de individuelle domæner. Denne hierarkiske klassifikation af strukturer giver for eksempel ophav til navnet CATH idet proteiner inddeles først efter klasse (Class), dernæst Arkitektur, derefter Topologi og endeligt i Homologe superfamilier. Hvis man ønsker at finde ud af om et protein, hvis struktur netop er blevet løst, har strukturelle homologer bør man derfor først splitte det op i domæner og derefter se hvilke lignende domæner der findes i domæne databaserne. Et stort problem både i kategoriseringen og søgningen i disse databaser er dog at der findes meget få automatiske, kvantitative metoder til at sammenligne protein strukturer. Af de ovennævnte databaser er kun FSSP baseret på en fuldt ud automatisk og kvantitativ metode. Denne metode, DALI, og andre lignende metoder lider af en række svagheder. Dels er de ikke altid fuldt ud effektive, selvom DALI nok er noget af det bedste der kendes. Endnu vigtigere er det at de beregninger der ligger til grund for sammenligningen er meget langsomme. Hvis de cirka 36000 domæner der findes i for eksempel CATH skal klassificeres skal der foretages cirka 650 millioner struktur sammenligninger hvilket, hvis hver sammenligning tager 1 sekund, kræver meget lang tid, selv hvis der parallelt benyttes mange computere. Der er derfor brug for nye, effektive og hurtige metoder til kvantitativ sammenligning af protein strukturer. En sådan metode er netop hvad forskerne fra DTU og Stanford præsenterer.

Protein strukturer repræsenteres normalt ved den tre-dimensionelle position af atomerne i alle aminosyre resterne. Sammenligning af atomare positioner viser sig dog at være en meget dårlig metode til at sammenligne strukturer der ikke er meget lig hinanden. Den hidtidige "standard" metode, DALI, benytter i stedet sammenligning af afstandsmatricer, det vil sige matricer hvis elementer er afstanden mellem Alpha-kulstof atomerne i aminosyre resterne. Sådanne matricer er en kvantitativ version af de mere velkendte kontakt kort (contact maps) der ofte benyttes til at give et hurtigt overblik over et proteins struktur uden at gå ned i atomare detaljer. Både sammenligning af afstandsmatricer eller direkte af atomare positioner lider dog af en svaghed at der skal udvælges hvilke atomer eller rester der er ækvivalente i de to proteiner. Er der forlængelser af loops, deletioner eller lignende skal der tages højde for disse. Da der er mange måder hvordan to protein strukturer eller afstandsmatricer kan overlejres giver det anledning til ganske langsomme beregninger. Den nye metode baserer sig på helt andre koncepter og kræver ikke af der udvælges ækvivalente regioner i de to domæner. Beregningerne er derfor meget hurtigere. Det første trin i beregningerne bag den nye metode er de Gauss integraler der henvises til i titlen af artiklen. Integralerne har deres baggrund i den matematiske teori der benyttes til at karakterisere og klassificere kurver og knuder i rummet. I en anden artikel har Røgen videreudviklet denne teori til proteiner. Det primære er derfor hvorledes backbone i kæden snor sig igennem rummet, et koncept der ligger tæt op at den umiddelbare fornemmelse for begrebet topologi. Der kan beregnes en hel række Gauss integraler og de giver hver især deres beskrivelse af protein topologien. De første, for eksempel, giver et middeltal for hvor meget forskellig backbone segmenter krydser (over eller under) hinanden og hvor meget disse kryds giver anledning til snoning (for eksempel mere over end under). Der benyttes 29 sådanne værdier samt længden af domænet til at klassificere. Disse 30 tal udgør til sammen en vektor der repræsenterer domænets topologi og ved at beregne den sædvanlige Euklid afstand (prik produkt) mellem vektorer kan topologisk similaritet kvantificeres. Dette mål kaldes scaled Gauss metric, SGM.

Al denne avancerede matematik kunne være ganske uinteressant hvis ikke den også i praksis viste sig at være effektiv. Røgen og Fain har derfor benyttet det ovennævnte SGM mål til at kategorisere strukturerne i CATH databasen. Metoden viser sig at være både utroligt hurtig og effektiv, og den meget mere tidskrævende manuelle kategorisering i CATH kan eftergøres automatisk med stort set fuld effektivitet. Gauss integralerne og SGM er derfor et stærkt nyt redskab i analyse og klassifikation af protein strukturer. Det kan benyttes til hurtigt at sammenligne nye protein strukturer med domæne databaser og derved måske opnå ny biologisk information. Den høje effektivitet af SGM metoden indikerer også, at de 29 integraler giver en detaljeret kvantitativ beskrivelse af hvorledes proteinkæden snor sig i rummet. Det er derfor muligt at disse tal kan fortælle noget om hvordan proteiner opnår deres struktur, enten ved at forstå hvordan proteiner folder eller til at forstå eller forudsige sammenhængen mellem sekvens og struktur.

Ny planteregulator af nitrogenfiksering

Shoot control of root development and nodulation is mediated by a receptor-like kinase.

Nature 420 (2002): 422-426.
L Krusell, LH Madsen, S Sato, G Aubert, A Genua, K Szczyglowski, G Duc, T Kaneko, S Tabata, F de Bruijn, E Pajuelo, N Sandal, J Stougaard. Aarhus Universitet; Kazusa DNA research Institute, Japan; Institut National de la Recherche Agronomique (Dijon), France; Agriculture & Agri-Food Canada, Canada; Laboratoire de Biologie Moleculaire des Relations Plantes-Microorganismes (Castanet-Tolosan), France.

Trods det store indhold af nitrogen i atmosfæren er nitrogentilgængelighed begænsende for mange både pro- og eukaryote organismers vækst. Baggrunden er naturligvis, at N2-molekylet er så stabilt, at det hverken lader sig let oxidere eller specielt reducere til forbindelser, som er anvendelige i biologiske systemer. Når kemikere skal klare opgaven, gøres det i den såkaldte Haber proces, opkaldt efter den tyske kemiker Fritz Haber, der i 1918 modtog Nobelprisen for sin succes med direkte reduktion af N2 til ammoniak. I denne proces føres nitrogen og hydrogen sammen i tilstedeværelse af en metaloxid katalysator ved ca. 500 atmosfæres tryk og en temperatur på ca. 5008C; betingelser der er vanskeligt forenelige med de fleste former for liv!

Opgaven kan imidlertid også løses i et fællesskab mellem visse planter - fortrinsvis bælgplanter - og Rhizobium-bakterier i jorden i den såkaldte nitrogenfikseringsproces. I dette fællesskab lader plantens rødder sig inficere af stammer af kompatible bakterier under dannelse af rodknolde. Her får bakterien lov til at udfolde sig som uorganisk kemiker mod pænt at aflevere en god gang produkt - reduceret nitrogen - til planten, der så honorerer bakterien med  kulstofforbindelser som malat og succinat. Såvel selve kemien i nitrogenfikseringen som en god del af bakteriens regulatoriske gener involveret i  kommunikationen med planten under etableringen af rodknoldsymbiosen er beskrevet, mens de molekylære kneb planten benytter til at få kontrol over situationen kun i meget ringe grad er forstået.

Det er netop denne side af plante-bakterie kommunikationen, der er fokus for Jens Stougaards gruppe på Aarhus Universitet. De indførte tidligt i 1990erne planten Lotus japonicus (Japansk Kællingetand) som symbiosens genetiske modelsystem på plantesiden, og har haft succes med at opbygge de genetiske redskaber, der skal til for effektivt at kunne bruge moderne molekylær genetik på planten. I 1999 isolerede de ved hjælp af transposon tagging den første planteregulator nødvendig for rodknolddannelse (Schauser et al., 1999, Nature 402:191-195), og i denne artikel beskriver de et andet vigtigt regulatorisk gen, HAR1, hvis proteinprodukt ligner receptor kinaser.

Udover de mekanismer der sørger for kommunikationen med bakterierne, eksisterer der også internt i planten kontrolsystemer, hvis rolle er at begrænse bakterieinfektionen til et rimeligt omfang, så balancen mellem symbiotisk og ikke-symbiotisk rodvæv opretholdes. Et eksempel på et sådant system er autoregulering, der bevirker, at gentagen infektion og rodknolddanelse hæmmes i yngre rodvæv efter etablering af en rodknold. For bedre at forstå denne mekanisme molekylært griber forfatterne sagen genetisk an og går efter at identificere Lotus mutanter, der under symbiosebetingelser laver et umådeholdent antal rodknolde. De identificerer tre sådanne hypernodulation aberrant root (har) mutanter, der alle viser sig at være alleler af det samme locus, HAR1. Med et sæt af elegante transplantationsforsøg viser de, at HAR1 må mediere systemisk signalering fra blad- til rodvæv, idet et vildtype skud transplanteret på en har1 rod giver normal rodknolddannelse, mens et har1 skud transplanteret på vildtype rod giver ukontrolleret rodknolddannelse.

For at isolere HAR1 genet går forfatterne den hårde mappingvej. Det lykkes dem finmappe mutationen til et 22 kb interval - noget af en bedrift i et 400 Mbp genom, hvor der endnu ikke bare ligger tusindvis af markører klar til brug som i andre modelsystemer - og ved fuldstændig sekventering af dette interval i har1-3 allelen identificerer de en 18bp deletion i et af generne. I det samme gen identificeres nonsense mutationer på forskellige positioner i har1-1 og har1-2 allelerne, og det er således lykkedes dem med sikkerhed at identificere HAR1 genet. HAR1 koder for et receptorlignende protein med leucin rige repeats (LRRs) extracellulært og et Ser/Thr kinase domæne intracellulært, og er tæt beslægtet med den velstuderede Arabidopsis receptor CLAVATA1, der regulerer balancen mellem differentiation og proliferering af stamceller i plantevækstcentret (meristemet).

For at udvide deres undersøgelser til et andet symbiosesystem skæver forfatterne nu til ærter, hvor der også kendes mutanter (sym29) defekte i skudmedieret autoregulering af rodknolddannelse. De kloner den nærmeste HAR1 slægtning med PCR og sekventerer den i 13 uafhængige sym29 mutantlinjer. Samtlige indeholder mutationer i HAR1 orthologen, hvilket dels viser værdien af Lotus som et modelsystem, dels hjælper med til en karakterisering af HAR1 proteinet, idet mange af sym29 allelerne indeholder missense mutationer, der udpeger vigtige aminosyrerester i LRR- og kinasedomænerne.

En serie af interessante hypoteser om funktionen af HAR1 kan nu opsættes, hvoraf den mest oplagte må være at den i skuddet virker som receptor for rodafledte signaler, hvis sansning i gangsætter modsatrettede signaler til roden om inhibering af yderligere rodknolddannelse.

Andre "Siden sidst" artikler

The Bacterial Toxin RelE Displays Codon-Specific Cleavage of mRNAs in the Ribosomal A Site

Cell 112 (2003): 131-140.
K Pedersen, AV Zavialov, MY Pavlov, J Elf, K Gerdes, M Ehrenberg. University of Southern Denmark, Odense; Uppsala University, Sverige

Identifying distinct classes of bladder carcinoma using microarrays

Nature Genetics 33 (2003): 90-96.
L Dyrskjøt, T Thykjaer, M Kruhøffer, JL Jensen, N Marcussen, S Hamilton-Dutoit, H Wolf, TF Ørntoft. Aarhus University Hospital; Aros Applied Biotechnology, SciencePark Aarhus; Aarhus University.

Crystal structure of human dipeptidyl peptidase IV/CD26 in complex with a substrate analog

Nature Structural Biology 10 (2003): 19-25.
HB Rasmussen, S Branner, FC Wiberg, N Wagtmann. Novo Nordisk A/S, Bagsværd.

F-actin-like filaments formed by plasmid segregation protein ParM

The EMBO Journal 21 (2002): 6935-6943.
F van den Ent, J Møller-Jensen, LA Amos, K Gerdes, J Löwe. University of Southern Denmark, Odense; MRC Laboratory of Molecular Biology, UK.

Regulation of G2/M events by Cdc25A through phosphorylation-dependent modulation of its stability

The EMBO Journal 21 (2002): 5911-5920.
N Mailand, A Podtelejnikov, A Groth, M Mann, J Bartek, J Lukas. Danish Cancer Society, København; Odense University, Odense.

Resistance to the macrolide antibiotic tylosin is conferred by single methylations at 23S rRNA nucleotides G748 and A2058 acting in synergy

PNAS 99 (2002): 14658-14663.
M Liu, S Douthwaite. University of Southern Denmark, Odense.