https://frosthead.com

Dette kan være verdens største slægtstræ

Stigningen af ​​DNA-test gennem tjenester som 23andme viser, at der er et stort marked derude for familiehistorie.

Nu har forskere bygget videre på disse data ved at offentliggøre, hvad de mener er den største slægtsdatabase i verden med et slægtstræ, der forbinder 13 millioner mennesker og strækker sig mere end fem århundreder tilbage.

Som Jocelyn Kaiser rapporterer til videnskabsmagasinet, tænkte Yaniv Erlich, en beregningsgenetiker ved Columbia University, projektet for syv år siden efter at have modtaget en e-mail fra en fjern relativ fætter gennem Geni.com, et af de mange websteder, hvor man søgte efter familiebånd.

Med støtte fra Gemi.coms teknologichef, downloadede Erlich webstedets offentlige profiler - titusinder af millioner. Selvom det ikke bød DNA-data, indeholdt oplysningerne en persons navn, køn, fødselsdato og sted, dødsdato og nærmeste pårørende.

Naturen skrev om Erlichs projekt i sine tidlige faser tilbage i 2013, og sidste år rapporterede Atlanterhavets Sarah Zhang, at forskerne havde frigivet et fortryk af det massive træ. Nu, skriver Kaiser, har Erlichs team offentliggjort en undersøgelse af deres arbejde i tidsskriftet Science. Ved hjælp af dataene endte de med 5, 3 millioner træer, hvoraf den største forbinder omkring 13 millioner slægtninge, for det meste af europæisk afstamning.

Siden starten af ​​projektet er Erlich blevet den vigtigste videnskabschef for MyHeritage, et slægts- og DNA-testfirma, der ejer Geni.com. Sidste fredag ​​gjorde han et Reddit Ask Me Anything om sine fund, korrigerede misforståelser og forklarede metodikken bag projektet. Han bemærkede også, at den mest interessante del af oplevelsen for ham var at finde ud af, hvordan man oversætter alle de tilgængelige data til noget personligt.

I et interview med National Geographic 's Nicole Wetsman siger Erlich, at det var den mest udfordrende del af projektet at finde ud af, hvordan man arbejder med disse data. ”Genomiske datasæt har specifikke værktøjer, datastrukturer, metoder, men vi havde ikke noget af det til dette. Vi opfandt hjulet, mens vi gik, ”siger han.

I sidste ende brugte forskerne matematisk grafteori til at organisere og verificere informationen, rapporterer Laura Geggel for Live Science . De sammenlignede også profilerne med omkring 80.000 offentligt tilgængelige dødsattester fra Vermont over en periode på 25 år for at sikre, at det ikke kun var velhavende profiler, der blev uploadet til Geni.com.

Holdet besluttede derefter, hvilke oplysninger de ønskede at kigge efter for at teste databasen, skriver Wetsman.

De begyndte at se på mønstre og fandt udsving i levetiden, noget de havde forventet. For eksempel så de et dråbe unge mænd under borgerkrigen og første verdenskrig og en stigning i barndomsoverlevelse i 1900-tallet. De var også i stand til at spore migration, ligesom ankomsten af Mayflower i 1620 i det nuværende Massachusetts, efterfulgt af en stigning i fødslerne i dette område.

Forskere fandt også, at lang levetid har mere at gøre med miljø og adfærd end genetik; faktisk er de afslørede data kun 16 procent ansvarlige for levetiden. Paola Sebastiani, professor i biostatistik ved Boston University School of Public Health, advarer imidlertid om at drage konklusioner omkring disse data i et interview med Wetsman. ”Der er meget forvirring omkring definitionerne af lang levetid, ” siger hun.

Genetiker Peter Visscher fra University of Queensland i Brisbane, Australien, fortæller Kaiser, at de data, Erlichs team har overholdt, har potentiale til at give indsigt i rollen genetik for sygdomme, hvis dataene er knyttet til sundhedsoplysninger.

Forskningsteamet er allerede begyndt at kombinere træet med information fra DNA.Land, som kilder DNA-data, hvilket kan betyde, at et endnu større træ muligvis kommer snart. Forskere forudsiger, at hvis databasen kunne gå 65 generationer tilbage, vil de være i stand til at fuldføre træet.

Dette kan være verdens største slægtstræ