https://frosthead.com

Det store flertal af rå data fra gamle videnskabelige studier kan nu mangle

En af grundlagene for den videnskabelige metode er reproducerbarheden af ​​resultater. I et laboratorium overalt i verden skal en forsker være i stand til at studere det samme emne som en anden videnskabsmand og gengive de samme data, eller analysere de samme data og bemærke de samme mønstre.

Dette er grunden til, at resultaterne af en undersøgelse, der blev offentliggjort i dag i Current Biology, er så bekymrende. Da en gruppe forskere forsøgte at e-maile forfatterne til 516 biologiske studier, der blev offentliggjort mellem 1991 og 2011 og bede om de rå data, blev de forfærdet over at finde ud af, at mere end 90 procent af de ældste data (fra papirer skrevet for mere end 20 år siden) var utilgængelig. I alt, også inklusive papirer, der blev offentliggjort så sent som i 2011, var de kun i stand til at spore dataene for 23 procent.

"Alle slags ved, at hvis du beder en forsker om data fra gamle undersøgelser, vil de hæm og ha, fordi de ikke ved, hvor det er, " siger Timothy Vines, en zoolog ved University of British Columbia, der ledede indsatsen. "Men der har virkelig aldrig været systematiske skøn over, hvor hurtigt de data, som forfatterne opbevarer, faktisk forsvinder."

For at gøre deres estimat valgte hans gruppe en type data, der har været relativt konsistent over tid - anatomiske målinger af planter og dyr - og gravede op mellem 25 og 40 papirer for hvert ulige år i den periode, der brugte denne slags data, for at se hvis de kunne jage de rå tal.

En overraskende mængde af deres forespørgsler blev stoppet på det allerførste trin: I 25 procent af undersøgelserne kunne man ikke finde aktive e-mail-adresser, hvor de ikke-adresserede adresser var angivet på selve papiret og websøgninger, der ikke viste nogen aktuelle adresser. I yderligere 38 procent af undersøgelserne førte deres forespørgsler til intet svar. Yderligere 7 procent af datasættene mistede eller var utilgængelige.

"Nogle af tiden blev det for eksempel gemt på en og en halv tommer disketter, så ingen kunne få adgang til den, fordi de ikke længere havde de rette drev, " siger Vines. Fordi den grundlæggende idé om at opbevare data er sådan, at de kan bruges af andre i fremtidig forskning, gør denne form for forældelse i det væsentlige dataene ubrugelige.

Disse kan virke som verdslige hindringer, men videnskabsmænd er ligesom resten af ​​os - de skifter e-mail-adresser, de får nye computere med forskellige drev, de mister deres sikkerhedskopier af filer - så disse tendenser afspejler alvorlige, systemiske problemer i videnskaben.

Og at bevare data er så vigtigt, det er værd at huske, fordi det er umuligt at forudsige, i hvilke retninger forskning vil bevæge sig i fremtiden. Vines har for eksempel foretaget sin egen undersøgelse af et par paddearter, der er hjemmehørende i Østeuropa, som ser ud til at være i færd med at hybridisere. I 1980'erne, siger han, arbejdede et separat team af forskere med det samme emne og stødte på et gammelt papir, der dokumenterede fordelingen af ​​disse padder i 1930'erne. At vide, at deres distribution havde ændret sig relativt lidt i de mellemliggende årtier, gjorde det muligt for forskerne at foretage alle mulige beregninger, som ellers ikke ville have været muligt. ”De originale data, der var tilgængelige, fra en meget lille gammel undersøgelse skrevet på polsk, var utroligt nyttige for forskere, der fulgte 70 år senere, ” siger han.

Der er også den kendsgerning, at så meget af denne forskning er betalt med offentlig finansiering, hvor meget af den kommer gennem tilskud, der bestemmer, at resulterende data frigøres offentligt for offentligheden. Derudover påvirkes feltdata af omstændighederne i det miljø, de er samlet i - det er således umuligt at replikere perfekt senere, når forholdene er ændret.

Hvad er løsningen? Nogle tidsskrifter - inklusive Molecular Ecology, hvoraf Vines er administrerende redaktør - har vedtaget politikker, der kræver, at forfattere indsender rå data sammen med deres papirer, hvilket gør det muligt for selve tidsskriftet at arkivere dataene i evighed. Selvom tidsskrifter, som mennesker, er modtagelige for at ændre e-mail-adresser og teknologisk forældelse, kan disse problemer håndteres meget lettere på institutionel skala.

Det store flertal af rå data fra gamle videnskabelige studier kan nu mangle