https://frosthead.com

Kunstig intelligensundersøgelse af det menneskelige genom finder ukendt menneskelig stamfar

Kan sindet i maskiner lære os noget nyt om, hvad det betyder at være menneske? Når det kommer til den komplicerede historie om vores arts komplekse oprindelse og udvikling, ser det ud til, at de kan.

En nylig undersøgelse anvendte maskinlæringsteknologi til at analysere otte førende modeller af menneskelig oprindelse og evolution, og programmet identificerede beviser i det menneskelige genom til en ”spøgelsespopulation” af menneskelige forfædre. Analysen antyder, at en tidligere ukendt og længe-uddød gruppe af homininer blev blandet med Homo sapiens i Asien og Oceanien et eller andet sted langs den lange, snoede vej i menneskets evolutionære historie, hvilket kun efterlader fragmenterede spor i moderne menneskeligt DNA.

Undersøgelsen, der er offentliggjort i Nature Communications, er et af de første eksempler på, hvordan maskinlæring kan hjælpe med at afsløre ledetråde til vores egen oprindelse. Ved at undersøge store mængder genomiske data, der er efterladt i fossiliserede knogler og sammenligne dem med DNA i moderne mennesker, kan forskere begynde at udfylde nogle af hullerne i vores arts evolutionshistorie.

I dette tilfælde ser det ud til, at resultaterne stemmer overens med paleoanthropology teorier, der blev udviklet fra undersøgelse af menneskelige stamfarer fundet i jorden. De nye data antyder, at den mystiske hominin sandsynligvis stammede fra en blanding af neandertalere og Denisovans (som kun blev identificeret som en unik art på det menneskelige slægtstræ i 2010). En sådan art i vores evolutionære fortid ville ligne fossilet fra en 90.000 år gammel teenage-pige fra Siberiens Denisova-hule. Hendes rester blev beskrevet sidste sommer som det eneste kendte eksempel på en første generation af hybrid mellem de to arter med en neandertalermor og en Denisovan-far.

”Det er nøjagtigt den slags individ, vi forventer at finde ved denne befolknings oprindelse, men dette bør ikke kun være et enkelt individ, men en hel befolkning, ” siger studiemedforfatter Jaume Bertranpetit, en evolutionær biolog ved Barcelonas Pompeu Fabra Universitet.

Spredning af slægten Homo De tidlige menneskers evne til at tilpasse sig skiftende forhold gjorde det i sidste ende muligt for de tidligste arter af Homo at variere, overleve og begynde at sprede sig fra Afrika til Eurasia for 1, 85 millioner år siden. (Billedet med tilladelse fra Antón, Potts og Aiello (2014), Science 345 (6192))

Tidligere menneskelige genomundersøgelser har afsløret, at efter at moderne mennesker forlod Afrika, måske for 180.000 år siden, blev de efterfølgende blandet med arter som neandertalere og Denisovans, der sameksisterede med tidlige moderne mennesker, før de uddød. Men det er vanskeligt at tegne om vores slægtstræ til at inkludere disse forskellige grene. Bevis for "spøgelses" -arter kan være sparsom, og der findes mange konkurrerende teorier for at forklare hvornår, hvor og hvor ofte Homo sapiens måske har blandet sig med andre arter.

Spor af disse gamle mellemsnitlige forbindelser, kaldet introgressioner, kan identificeres som steder med divergens i det menneskelige genom. Forskere observerer mere adskillelse mellem to kromosomer, end man kunne forvente, hvis begge kromosomerne kom fra den samme menneskelige art. Da forskere sekventerede neandertalgenomet i 2010, indså de, at nogle af disse divergencer repræsenterede fraktioner af vores genom, der kom fra neandertalerne. Undersøgelser har også afsløret, at nogle levende mennesker kan spore op til 5 procent af deres aner til Denisovans.

”Så vi troede, at vi ville prøve at finde disse steder med stor divergens i genomet, se, hvilke er Neandertaler, og hvilke er Denisovan, og så se, om disse forklarer hele billedet, ” siger Bertranpetit. "Som det sker, hvis du trækker fra Neanderthal og Denisovan, er der stadig noget i genomet, der er meget divergerende."

At identificere og analysere de mange forskellige steder i genomet og beregne de utallige genetiske kombinationer, der kunne have produceret dem, er et for stort job for mennesker til at tackle på egen hånd - men det er en opgave, der kan skræddersys til dyb indlæringsalgoritmer.

Deep learning er en type kunstig intelligens, hvor algoritmer er designet til at fungere som et kunstigt neuralt netværk, eller et program, der kan behandle information på samme måde som en pattedyrshjerne. Disse maskinindlæringssystemer kan registrere mønstre og redegøre for tidligere oplysninger for at "lære", så de kan udføre nye opgaver eller kigge efter nye oplysninger efter at have analyseret enorme mængder data. (Et almindeligt eksempel er Google DeepMinds AlphaZero, som kan lære sig at mestre brætspil.)

”Dyb læring passer en mere kompliceret formet ting til et sæt punkter i et større rum, ” siger Joshua Schraiber, en evolutionær genomikekspert ved Temple University. ”I stedet for at tilpasse en linje mellem Y og X, passer du en krum ting til et sæt punkter i meget større, tusindimensionalt rum. Dyb indlæring siger, 'Jeg ved ikke, hvilken skæve form der skal passe til disse punkter, men lad os se, hvad der sker.' ”

I dette tilfælde blev maskiner indstillet til at arbejde med at analysere det menneskelige genom og forudsige menneskers demografi ved at simulere, hvordan vores DNA muligvis har udviklet sig over mange tusinder af mulige scenarier fra den gamle evolution. Programmet redegjorde for strukturen og udviklingen af ​​DNA såvel som modeller for menneskelig migration og opdræt for at forsøge at passe nogle af stykkerne sammen i et utroligt komplekst puslespil.

Forskerne uddannede computeren til at analysere otte forskellige modeller af de mest plausible teorier om den tidlige menneskelige udvikling i hele Eurasien. Modellerne stammede fra tidligere undersøgelser, der forsøgte at komme med et scenarie, der ville resultere i det aktuelle billede af det menneskelige genom, inklusive dets kendte Neandertaler og Denisovan-komponenter.

”Der kan selvfølgelig være andre modeller, men disse modeller er dem, som andre mennesker har foreslået i den videnskabelige litteratur, ” siger Bertranpetit. Hver model begynder med den accepterede begivenhed uden for Afrika, og indeholder derefter et andet sæt af de mest sandsynlige opdelinger mellem menneskelige afstamninger, herunder forskellige opdræt med både kendte arter og mulige "spøgelses" -arter.

Human family tree Mennesker, eller Homo sapiens, stammer fra et komplekst træ af oprejst vandrende forfædre, herunder arter fra slægterne Ardipithecus, Australopithecus og Paranthropus . (Smithsonians Human Origins-program)

”Med hver af disse otte modeller beregner vi over uges beregninger, hvor godt de er i stand til at nå den faktiske, nuværende genetiske sammensætning af mennesker, ” siger Bertranpetit. "Hver gang vi foretager en simulering, er det en simulering af en mulig sti for menneskelig evolution, og vi har kørt disse simuleringer tusinder af gange, og de dybe indlæringsalgoritmer er i stand til at genkende, hvilke af modellerne der bedst passer til dataene."

Maskinens konklusion? En stamfar findes i vores afstamning, som vi endnu ikke har identificeret. ”Langt nok er de eneste modeller, vi testede, der virkelig understøttes af dataene, de med denne spøgelsespopulationens introgression, ” siger Bertranpetit.

Den spændende undersøgelse og andre, der kan lide den, kan hjælpe med at tegne kortet over, hvordan mennesker vandrede og udviklede sig, men hvad der ser ud til at være en stadig mere kompliceret gammel verden i Eurasia og Oceanien.

”Det er bestemt interessant og konsistent med det nye billede af en kompleks retikuleret fylogeni i menneskelig evolution, ” siger Iain Mathieson, en universitetsgeneralist i Pennsylvania, via e-mail. ”Jeg er ikke engang sikker på, at det er fornuftigt at tale om 'introgressionhændelser', når det ser ud til at være normen.“ Faktisk fordi kun otte modeller blev testet og mange andre kunne være mulige, tilføjer Mathieson, at de nye fund er " bestemt et plausibelt scenario, men virkeligheden er sandsynligvis endnu mere kompliceret. ”

Når nye fossile fund bliver gjort i marken, kan opdaterede modeller nu testes mod det menneskelige genom ved hjælp af disse typer programmer. Schraiber siger, at kraften ved dyb læring til at studere menneskelig oprindelse ligger netop i dens evne til at analysere komplekse modeller.

"Hvis du vil lave en ekstremt detaljeret model, fordi du er en antropolog, og du vil vide, om denne introgression skete for 80.000 år siden eller for 40.000 år siden, er det kraften i en dyb læringsmetode som denne."

Kompleks, som de er, er opdræt i det gamle Eurasia stadig kun en del af vores menneskelige historie. Bertranpetit mener, at fremtidige fremskridt inden for dyb læring kan hjælpe med at afdække andre nye kapitler.

”Denne form for analysemetode vil få alle slags nye resultater, ” siger han. ”Jeg er sikker på, at folk, der arbejder i Afrika, finder uddøde grupper, der endnu ikke er anerkendt. Afrika vil uden tvivl vise os overraskende ting i fremtiden. ”

Kunstig intelligensundersøgelse af det menneskelige genom finder ukendt menneskelig stamfar