Betydningen af functional genomics for moderne bioteknologi

Publiceret April 2001
Biokemisk Forening har indledt et samarbejde med Dansk Bioteknologisk Forum som blev præsenteret i BioZoom vol. 4, no. 1 af Lars Haastrup Pedersen. Samarbejdet gælder afholdelse af videnskabelige symposier indenfor bioteknologi. I BioZoom vil Dansk Bioteknologisk Forum have en fast plads med artikler og nyheder. I dette nummer bringes den første artikel fra Dansk Bioteknologisk Forum, hvor Jens Nielsen skriver om "Betydningen af Functional Genomics for moderne Bioteknologi".

Bioteknologi har fundet anvendelse i århundreder til fremstilling af øl, vin, ost, og brød. Under den 2. verdenskrig blev der udviklet storskala produktion af penicillin, der var den første bioteknologiske produktionsproces til fremstilling af et lægmiddel. Efter krigen førte dette til udbredelse af gæringsprocesser til fremstilling af en lang række forskellige antibiotika. I denne periode blev der hele tiden udviklet nye stammer af produktionsorganismerne der gav højere udbytter, og forbedringer af Penicillium chrysogenum, der anvendes til penicillinproduktion, har ført til mere end en faktor 10.000 forøgelse i penicillinudbyttet. Disse forbedringer blev opnået ved klassisk stammeudvikling der involverede mutagenisering og screening. Klassisk stammeudvikling har tydeligvis været meget succesfyldt, men metoden er dog også meget arbejdskrævende og den er ikke specielt målrettet. Herudover opstår der i mange tilfælde uhensigtsmæssige mutationer der f.eks. giver forandrede egenskaber af produktionsorganismen.

Med Cohen og Boyer's  introduktion af gensplejsning af Escherichia coli i 1973 blev der åbnet op for en ny måde for forbedring af gæringsprocesser og til udvikling af helt nye bioteknologiske processer. Dette førte hurtigt til introduktion af en række nye processer til fremstilling af farmaceutiske proteiner ved anvendelse af gensplejset E. coli. Sådanne proteiner, f.eks.  insulin og human væksthormon, var tidligere blevet produceret ved ekstration fra dyrevæv men med produktion vhj. af gensplejsede mikroorganismer blev der åbnet op for en mere reproducerbar produktionsmetode samt en metode der forhindrede overførsel af f.eks. virus fra dyrevævet til patienter. Anvendelse af gensplejsning har ført til udvikling af produktionsprocesser for en lang række proteiner, og i dag produceres der mere end 55 proteiner der finder anvendelse som lægemidler ved hjælp af gæringsprocesser. Dette repræsenterer et verdensmarked på mere end 20 milliarder US$, og markedet for rekombinante proteiner er i stærk vækst. Til produktion af rekombinante proteiner anvendes ikke kun mikroorganismer men også højere eukaryoter såsom hybridoma celler, CHO celler (chinese hamster ovary celler), insektceller etc. Valg af produktiossystem afhænger af en række faktorer såsom evnen til at foretage komplekse glykosyleringer, stabilitet af det producerede protein, og kravet til volumen af produktet. Således produceres et simpelt ikke-glykosyleret protein som insulin i E. coli og i bagegæren Saccharomyces cerevisiae, idet disse organismer giver mulighed for opnåelse af høje produktiviteter, mens mere komplekse glykosylerede proteiner som tPA (tissue plasminogen activator) og erythropoeitin produceres i mammale celler (ofte CHO celler).

Introduktion af gensplejsning har også ført til muligheden for anvendelse af en mere målrettet forbedring af produktionstammer der anvendes til fremstilling af klassiske bioteknologiske produkter, såsom antibiotika, sprit, mælkesyre etc. Via introduktion af specifikke genetiske ændriger er det således muligt at omdirigere kulstofsstrømmene i cellerne, og hermed dirigere mere kulstof fra substratet (råvaren) til det endelige produkt. Samtidig kan uønskede pathways fjernes, og dannelse af biprodukter kan hermed elimineres eller reduceres. Anvendelse af gensplejsning til forbedring af produktionsstammer er blevet betegnet metabolic engineering, og denne strategi anvendes i dag til forbedring af en lang række "klassiske" fermenteringsprocesser til fremstilling af produkter som antibiotika (penicillin, cephalosporiner, erythromycin, nystatin, vancomycin etc.), primære metabolitter (ethanol, citronsyre, mælkesyre, lysin, glutamat, phenylalanin etc.), polymere (xanthan gum, alginat, polyhydroxybutyrater etc.), og industrielle enzymer (chymosin, detergent enzymer, bageenzymer etc.). Den totale markedsværdi af disse produkter overstiger 45 milliarder US$, og der er en kraftig vækst i markedet. Således er flere stor kemikoncerner ved at etablere nye bioteknologiske processer. Et joint veture imellem Cargil og Dow Chemicals vil ved etablering af en ny fabrik fordoble verdens produktionen af mælkesyre, med henblik på at producere polylaktat der er en attraktiv ny polymer (polylaktat har gode egenskaber som plastmateriale og er samtidig bionedbrydelig). En anden stor amerikansk kemikoncern er ved, at etablere en produktion af 1,3 propandiol, der kan finde anvendelse som udgangsstof for syntese af en række forskellige produkter. I de fleste af disse processer er der foretaget en række genetiske ændringer i produktionsstammerne, og i flere tilfælde er der rekruteret enzymer fra andre organismer med henblik på etablering af helt nye pathways.

Succesfyldt anvendelse af metabolic engineering kræver en detaljeret analyse af cellernes metabolisme for at identificere hvilke genetiske ændringer der skal introduceres og for at evaluere konsekvenserne af introducerede mutationer. Hertil er der udviklet nye metoder, hvor matematiske modeller for cellens metabolske netværk kombineres med målinger af strømme ind og ud af cellen muligør beregning af kulstofstrømmene (eller fluxene) igennem de forskellige grene af det metabolske netværk. Således kan aktiviteten af de forskellige pathways kortlægges, og dette kan give værdifuld information hvis forskellige mutanter sammenlignes, f.eks. sammenligning af en vild-type stamme og en stamme hvor et specifikt gen er deleteret. I denne analyse af cellerne er det vigtigt der foretages en system betragtning, dvs. hele cellens metabolske og regulatoriske netværk betragtes. Dette er vigtigt idet over-udtrykkelse af et bestemt gen ofte ikke har den ønskede effekt fordi regulatoriske netværk i cellen fører til en nedregulering af andre gener der også spiller en vigtig rolle. Anvendelse af en system-betragtning er derfor afgørende for succes i metabolic engineering, og der er derfor en klar interaktion med funktional genomics som diskuteret mere i det følgende.

Inden for de senere år er der sket en revolution inden for biologien. Denne revolution er hovedsagelig drevet af det faktum, at genomerne af en række organismer er blevet fuldstændig sekventeret. På nuværende tidspunkt er genomet af mere end 50 mikroorganismer sekventeret, inklusiv flere sygdomsfremkaldende bakterier såsom Haemophilus influenzae (meningitis), Mycoplasma pneumonia (lungebetændelse) samt mange industrielt vigtige organismer såsom Saccharomyces cerevisiae, Bacillus subtilis og Escherichia coli. For de fleste genomer, der er sekventeret, har kun omtrent 60% af generne en kendt funktion, og dette har resulteret i en række initiativer til at tilskrive gener med ukendt funktion en given funktion i cellen – et forskningsområde der normalt referes til som functional genomics. Forskning inden for functional genomics repræsenterer et paragdigmeskift i biologisk forskning, idet man traditionelt har arbejdet ud fra en given funktion og herefter har identificeret det tilhørende gen, hvorimod adgang til information om hele genomet har ført til en system betragtning af cellers funktion. Functional genomics betegnes derfor også ofte som systems biology, og udfra ovenstående diskussion er det klart der er et stort interessefælleskab med metabolic engineering.

I functional genomics arbejdes der ofte med karakterisering af mutanter hvori de enkelte gener er deleteret. Således er der igennem et stort EU-financieret forskningsprojekt (EUROFAN), som kører i samarbejde med amerikanske, canadiske og japanske universiteter konstrueret et stort antal mutanter af bagegæren S. cerevisiae, hvor hver enkelt mutant er karakteriseret ved at et specifikt gen er blevet deleteret. Målet er herefter at identificere en eventuel fænotype for hver enkel af disse mutanter. Et problem i forbindelse med dette projekt er imidlertid, at der er stor grad af redundans i de sekventerede gener, dvs. mange gener har redundant funktion, og deletion af en lang række gener resulterer ikke i en mutant med en bestemt fænotype. Med udvikling af en række nye eksperimentelle teknikker vil det dog være muligt at anvende en mere holistisk (eller system baseret) angrebsvinkel. Disse eksperimentelle teknikker muliggør analyse på forskellige niveauer i det centrale dogme i biologien (fra gen til mRNA og videre til protein). Blandt disse teknikker kan nævnes:

DNA chips (eller DNA arrays). Med DNA chips er muligt at måle et meget stort antal mRNA, endda måle transkription af samtlige gener i et genom. Teknikken er baseret på, at oligonukleotider fikseres i en meget høj koncentration på enten et filter eller en chip. Oligonucleotider kan enten være baseret på RNA eller DNA. For analyse ekstraheres mRNA fra en celle, og der foretages en revers transkription af alle mRNA der er tilstede i prøven. Dette fører til dannelse af cDNA der kan probes direkte til DNA baserede oligonucleotider på chippen. Alternativt kan cDNA omdannes videre til cRNA, der kan hybridisere til ribonucelotider fikseret på chippen. Ved inkorporering af fluoroscerende nucleotider i det syntetiserede cDNA eller cRNA kan hybridiseringen af de enkelte nukleotid-fragmenter kvantificeres vhj. af en fluorscens scanner. Det er muligt at anvende en høj densistet af prober på chippen, og det er således muligt at måle ekspression af samtlige 6.000 gener i S. cerevisiae ved anvendelse af én chip med et overfladeareal på 1 cm2.

Proteomics, der omfatter metoder til analyse af den samlede protein pool i cellerne. Ved hjælp af 2D-gelelektroforese, hvor proteiner adskilles både efter størrelse og ladning er det muligt at måle et stor antal proteiner på samme tid. Ved kombination af denne teknik med massespektrometri er det muligt at identificere de enkelte proteiner på gelen, samt endvidere fastlægge hvorvidt proteinerne er phosphoryleret eller ej.

Metabolite profiling, hvor et stort antal metabolitter dannet i cellerne måles. Metabolit profilen i cellerne repræsenterer en unik fenotypisk karakterisering, og metabolit niveauerne er et resultat af genekspression, proteinsyntese, proteinaktivering og in vivo aktiviteten af de enkelte enzymer. Ved hjælp af GC-MS og LC-MS er det muligt at måle et meget stort antal metabolitter med en analyse (ved Center for Bioteknologsik Procesforskning arbejder vi med en GC-MS metode der kan analysere mere end 60 metabolitter). Ved kombination af metabolitanalyser og metabolske modeller er det muligt at identificere specifikke mutationer, og endda i nogle tilfælde tilskrive funktion af gener med ukendt funktion.

Generelt for disse teknikker er, at de giver information om interaktionen imellem mange forskellige pathways i cellen, og derfor giver information om hele systemet i cellen. De er derfor centrale eksperimentelle metoder i systems biology. Metoderne giver dog også et meget stort antal data, og det er afgørende for succes i anvendelse af disse teknikker at der anvendes bioinformatik. Der findes en række tilgængelige bioinformatiske metoder til behandling af denne type data, men ofte er det værdifuldt at udvikle nye metoder, f.eks. hvor DNA chip data knyttes sammen med studier af promoter strukturer, i forbindelse med behandling af de eksprementelle data. Moderne bioinformatik spiller derfor en helt central rolle i systems biologi.

De ovenfor beskrevne eksperimentelle metoder finder bred anvendelse indenfor basale studier af cellefunktion. Således anvendes DNA chips og proteomics i stor udstrækning til studier af de grundlæggende mekanismer bag en række sygdomme. Som ovenfor beskrevet er det dog også klart, at disse metoder er meget værdifulde i studier af bioteknologiske processer. Dette illustrerer den tendens der i øjeblikket er indenfor forskning – en tæt interaktion imellem grundforskning i studier af mekanismer og anvendt forskning. Metoder udviklet indenfor det ene felt kan finde anvendelse i det andet felt, og opdagelser i grundforskning omsættes i dag hurtigt til konkrete anvendelser.

Ved etablering af BioCentrum-DTU den 1. januar 2001, blev der skabt en ny sektion ved DTU der har en stor forskningsaktivitet indenfor systems biology. Denne sektion betstår af to store forskningscentre: Center for Bioteknologisk Procesforskning (CBP) og Center for Biologisk Sekvensanalyse (CBS). Sektionen har mere end 75 medarbejdere med omtrent 15 post docs og 35 Ph.D. studerende. CBP har en stor forskningsaktivitet indenfor metabolic engineering, og har i den forbindelse etableret teknikker til metabolite profiling og anvender DNA chips til karakterisering af forskellige mikroorganismer. CBS er den førende bioinformatikgruppe i Danmark, og gruppen har en stor aktivitet indenfor udvikling af metoder til fortolkning af data fra DNA chips, samt anvendelse af DNA chips til analyse af humane celler. Der en tæt interaktion imellem forskningsaktiviteterne i de to forskningscentre, der begge indgår i Danmarks Bioteknologiske Instrument Center. Igennem samarbejde vil de to centre styrke aktiviteterne indenfor systems biology ved DTU og udvikle nye metoder der kan finde anvendelse indenfor functional genomics og bioteknologisk procesforskning.