https://frosthead.com

Værket begynder kun med at forstå det menneskelige genom

For et årti siden afsluttede et internationalt forskerteam en ambitiøs indsats for at læse de 3 milliarder bogstaver med genetisk information, der findes i hver menneskelig celle. Programmet, kendt som Human Genome Project, gav planen for menneskeliv, en præstation, der er blevet sammenlignet med at lande en mand på månen.

Dr. Eric D. Green var involveret helt fra begyndelsen og forbedrede nogle af de nøgleteknologier, der blev brugt i projektet. På det tidspunkt var han postdoktor og bosat i patologi ved Washington University i St. Louis. Han skar ud sine 5 procent af genomet, med fokus på kortlægning af DNA fra kromosom 7. I dag er Green direktør for National Human Genome Research Institute, der fremmer forståelsen af ​​det menneskelige genom gennem genomforskning.

Lad os gå tilbage til midten til slutningen af ​​1980'erne, da ideen til Human Genome Project først blev udtænkt. Hvad var motivationen på det tidspunkt?

Det afhænger af hvem du spørger. Forskellige mennesker havde forskellige motiver. Husk, at 70'erne og begyndelsen af ​​80'erne var molekylærbiologiens revolutionstid. Der var betydelige fremskridt inden for metoder, der gjorde det muligt for os at isolere og studere DNA i laboratoriet.

I USA for eksempel blev Energiministeriet meget interesseret i tanken om at studere genomet på grund af interesse i mutation og mutationsprocessen, der er forbundet med nogle former for energi, såsom kerneenergi.

Hvis du besøger steder som National Institutes of Health, eller du ser på biomedicinske forskere og sundhedsrelaterede forskere, var de meget interesserede i at kunne belyse det genetiske grundlag for sygdom. Blandt de mange genetiske sygdomme, der blev overvejet, var naturligvis kræft.

En masse andre mennesker på tværs af det biomedicinske forskningsspektrum - også dem, der arbejder med modelorganismer, som fluer og orme og gær - erkendte, at hvis vi kunne finde ud af, hvordan vi omfattende kan se på komplekse genomer, der starter med fluer og orme og gær, men derefter arbejder vores vej op til mennesker, ville det give grundlæggende information for at forstå, hvordan genomet fungerede.

Der var en sammenhæng af masser af forskellige ideer, der på baggrund af at have trinvise, men vigtige teknologiske fremskridt, gjorde det tilsyneladende, at mens skræmmende var problemet med at sekventere det menneskelige genom og bestemme rækkefølgen af ​​3 milliarder bogstaver.

Hvor kom materialet til genomprojektet fra? Hvem genom var det?

Da genomprojektet startede, var det stadig temmelig stykke. Forskellige mennesker lavede forskellige samlinger og DNA-fragmenter kaldet biblioteker, som bare er stykker af DNA klonet. De ville gøre det fra hvem som helst: Nogle gange ville det være laboratoriehovedet, nogle gange ville det være postdoktor eller kandidatstuderende. De ville bare få fat i DNA dengang, da der virkelig ikke var nogen implikationer af det.

Men så, da det endelig var tid til at lave bibliotekerne, der skulle bruges til sekventering af det menneskelige genom ved Human Genome Project, var den person, der var den bedste person til at fremstille disse biblioteker, en videnskabsmand, der arbejdede på Roswell Park Cancer Institute i Buffalo, New York. [Holdet] fik informeret samtykke fra ca. 10 eller 20 anonyme blodgivere og valgte derefter en af ​​dem tilfældigt, og det var personen. Cirka 60 procent af det menneskelige genomsekvens genereret af Human Genome Project var fra en blodgiver i Buffalo, New York.

Men du ved hvad, det betyder ikke noget. Hvis du går over det menneskelige genomsekvens, der er genereret af Human Genome Project, er det som en mosaik. Du kan gå for hundrede tusind breve, og det kan være den ene person, fra Buffalo. Det kan ende med, at du går de næste hundrede tusinde, og det vil være en anden. Og de næste hundrede tusinde, nogen anden. Alt, hvad der tjente som, var en henvisning. Og da alle mennesker er 99, 9 procent identiske på sekvensniveau, behøver den første sekvens ikke at være en rigtig person. Det kan bare være en hypotetisk henvisning til en person.

Af alle disse oplysninger, hvorfor valgte du at fokusere på kromosom 7 [det menneskelige genom har 23 kromosomer]?

Det var noget vilkårligt. Vi ønskede at vælge et kromosom, der ikke var for stort. Vi ønskede ikke at vælge en, der var for lille. Vi vidste, at der ville blive meget arbejde, så vi valgte et mellemstort kromosom.

Vi ønskede ikke at vælge en, der allerede havde mange mennesker, der arbejdede på det. På det tidspunkt var det mest berømte gen på kromosom 7 genet fra cystisk fibrose, og det blev opdaget i 1989. Og vi havde faktisk isoleret noget af det område og gjorde nogle undersøgelser på pilotmåde.

Sandheden er, vi valgte den, fordi den ikke var for stor, ikke var for lille og ikke var for overfyldt. Det var en vilkårlig måde at starte på; Da genomprojektet sluttede, blev de fleste af undersøgelserne gennemført genomomfattende.

Hvordan ændrede arbejdet sig i løbet af projektets levetid?

Hele historien om genomik er en teknologiudvikling. Hvis du sporer, hvor de enorme fremskridt blev gjort, var hver enkelt af dem forbundet med kraftige bølger i teknologien. Tidligt i genomprojektet kom bølgen ind, at vi havde bedre måder at isolere store stykker DNA.

Da vi sekventerede mindre organismer genomer - som Drosophila frugtfluer - industrialiserede vi dybest set processen med at udføre sekventering, hvilket gjorde det mere og mere og mere automatiseret.

Da genomprojektet begyndte, var ideen: ”Lad os sekvensere genomerne af fluer og orme og gær, alle disse mindre organismer ved hjælp af dagens metode, ” som var denne metode udviklet af Fred Sanger i 1977. Idéen var de ville ikke skubbe acceleratoren til at starte sekventering af det menneskelige genom, før en revolutionerende ny sekventeringsmetode blev tilgængelig. Så der var mange bestræbelser på at udvikle nye skøre måder til sekventering af DNA.

Da det kom tid, omkring 1997 eller 1998, at faktisk tænke på at begynde at sekvensere det menneskelige genom, sagde alle: ”Måske behøver vi ikke vente på en revolutionerende metode, måske har vi trinvis forbedret den gammeldags metode nok til at det kan bruges, ”og det var faktisk det, der blev besluttet.

Når det er sagt, siden genomprojektet, har det, der har ændret genomikens ansigt, været revolutionerende nye sekventeringsteknologier, der endelig kom på scenen omkring 2005.

Hvordan har disse forbedringer ændret omkostningerne og de tider, det tager for sekventering?

Human Genome-projektet tog seks til otte år med aktiv sekventering, og med hensyn til aktiv sekventering brugte de omkring en milliard dollars til at producere den første humane genomsekvens. Den dag, genomprojektet sluttede, spurgte vi vores sekvenseringsgrupper: ”Okay, hvis du skulle gå i rækkefølge for et andet menneskeligt genom, hypotetisk, hvor lang tid ville det tage, og hvor meget ville det koste?” Med bagenden af ​​konvolutten beregning, sagde de, "Wow, hvis du gav os yderligere 10 til 50 millioner dollars, kunne vi sandsynligvis gøre det om tre til fire måneder."

Men nu, hvis du går hen til det sted, vi er i dag, kan du sekvensere et menneskeligt genom på cirka en dag eller to. Ved udgangen af ​​dette år vil det handle om en dag. Og det vil kun koste omkring $ 3.000 til $ 5.000 dollars.

Hvad var de største fund fra det første genom og dem, der fulgte?

Der er nye fund, der kommer hver dag. I de første 10 år efter at have haft det menneskelige genomsekvens, tror jeg, vi dagligt samler flere og flere oplysninger om, hvordan det menneskelige genom fungerer. Men vi bør erkende, at selv 10 år ind, er vi kun i de tidlige stadier med at fortolke den sekvens. I årtier vil vi stadig fortolke og fortolke det.

Nogle af de tidligste ting, vi lærte, for eksempel: Vi har mange færre gener, end nogle mennesker havde forudsagt. Da genomet begyndte, forudsagde mange mennesker, at mennesker sandsynligvis havde 100.000 gener, og de ville have betydeligt flere gener end andre organismer, især enklere organismer. Det viser sig, at det ikke er sandt. Det viser sig, at vi er et meget lavere genantal. Faktisk er vi sandsynligvis mere som 20.000 gener. Og det er kun et par tusinde mere end fluer og orme. Så vores kompleksitet ligger ikke i vores gennummer. Vores kompleksitet er andre steder.

Den anden overraskelse kom, da vi begyndte at sekventere andre pattedyr - især mus genom, rotte genom, hunde genom og så videre, og nu har vi sekventeret 50, 60, 70 sådanne genomer. Du stiller op på disse genomsekvenser i en computer, og du ser for at se, hvor er sekvenser, der er meget bevaret, med andre ord på tværs af millioner af år med evolutionær tid, hvor har sekvenserne overhovedet ikke ændret sig. Meget evolutionsbeskyttede sekvenser peger næsten med sikkerhed på funktionelle sekvenser. Dette er ting, som livet ikke ønsker at ændre på, og derfor holder de dem de samme, fordi de udfører en vigtig grundlæggende funktion, der er nødvendig for biologien. I forbindelse med genomprojektet troede vi, at størstedelen af ​​de mest konserverede regioner, der var funktionelt vigtige, ville være i generne - de dele af genomet, der direkte koder for proteiner. Det viser sig, at størstedelen af ​​de mest konserverede og uundgåeligt funktionelle sekvenser ikke er i proteinkodende regioner; de er uden for gener.

Så hvad laver de? Vi kender dem ikke alle. Men vi ved, at mange af dem er dybest set kredsløbskontakter, som lysdæmperomskiftere, der bestemmer hvor og hvornår og hvor meget et gen bliver tændt. Det er meget mere kompliceret hos mennesker end det er i lavere organismer som fluer og orme. Så vores biologiske kompleksitet er ikke så meget i vores gennummer. Det er i de komplekse afbrydere, ligesom dimmerafbrydere, der regulerer hvor, hvornår og hvor meget gener der tændes.

Hvad har vi tilbage til at finde ud af?

Når du tænker over, hvordan genomet fungerer, tænker det på, hvordan det fungerer almindeligt for os alle. Men den anden store vægt på genomik - især i de sidste 10 år - er at forstå, hvordan vores genomer er forskellige. Så der kan du understrege 0, 1 procent af vores genomer, der er forskellige sammenlignet med hinanden, og hvordan fører disse forskelle til forskellige biologiske processer. Så der er forståelse af variation meget, meget vigtig, og derefter korrelerer den variation til forskellige konsekvenser, af hvilken sygdom er en vigtig del af den.

Der har været bemærkelsesværdige, bare virkelig bemærkelsesværdige fremskridt. Vi kender nu det genomiske grundlag for næsten 5.000 sjældne genetiske sygdomme. Da genomprojektet begyndte, var der kun et par dusin sygdomme, som vi forstod, hvad mutationen forårsagede denne sygdom. Det er en enorm forskel. Vi kender nu mange, mange hundreder og hundreder af regioner i det menneskelige genom, der indeholder varianter - vi ved ikke hvilke varianter endnu - der giver risiko for mere komplicerede genetiske sygdomme, såsom hypertension og diabetes og astma, hjerte-kar-sygdomme og så videre .

Vi er gået fra at have en fuldstændig mangel på viden om, hvor man kan se i genomet for disse varianter, til nu at have meget diskrete regioner at se i. Så dette er en stor vægt nu i genomik, prøver at forstå, hvilke varianter der er relevante for sygdom og hvad de skal gøre ved dem.

Værket begynder kun med at forstå det menneskelige genom