https://frosthead.com

Dine tweets kan forudsige, når du får influenza

I 1854, som svar på en ødelæggende koleraepidemi, der fejede gennem London, introducerede den britiske læge John Snow en idé, der ville revolutionere området for folkesundhed: det epidemiologiske kort. Ved at registrere forekomster af kolera i forskellige kvarterer i byen og kortlægge dem på et kort baseret på patienters bopæl, opdagede han, at en enkelt forurenet vandpumpe var ansvarlig for en stor del af infektioner.

Kortet overbeviste ham - og til sidst de offentlige myndigheder - om, at miasma-teorien om sygdom (som hævdede, at sygdomme spredte sig via skadelige gasser) var falsk, og at kimteorien (som korrekt hævdede, at mikroorganismer var skylden) var sand. De satte en lås på håndtaget på pumpen, der var ansvarlig for udbruddet, og signaliserede et paradigmeskift, der permanent ændrede, hvordan vi håndterer infektionssygdomme og dermed sanitet.

Kortlægningsteknologien er en helt anden, ligesom sygdommen er, men der er en vis lighed mellem Snow's kort og et nyt projekt udført af en gruppe forskere ledet af Henry Kautz fra University of Rochester. Ved at oprette algoritmer, der kan få øje på influenza tendenser og foretage forudsigelser baseret på nøgleord i offentligt tilgængelige geotagged tweets, tager de en ny tilgang til at studere overførsel af sygdom - en der kan ændre måden vi studerer og sporer sygdomsbevægelser i samfundet .

”Vi kan tænke på mennesker som sensorer, der ser på verden omkring dem og derefter rapportere, hvad de ser og oplever på sociale medier, ” forklarer Kautz. "Dette gør det muligt for os at foretage detaljerede målinger i en befolkningsskala og kræver ikke aktiv brugerdeltagelse."

Med andre ord, når vi twitrer, at vi lige er blevet lagt af en smertefuld hoste og feber, leverer vi uforvarende rig data til et enormt folkesundhedseksperiment, information, som forskere kan bruge til at spore bevægelse af sygdomme som influenza i høj opløsning og realtid.

Kautz 'projekt, kaldet SocialHealth, har brugt tweets og andre former for sociale medier til at spore en række spørgsmål om folkesundhed - for nylig begyndte de at bruge tweets til at overvåge forekomster af madforgiftning på restauranter i New York City ved at logge alle, der havde sendt geotagged tweets fra en restaurant, og følg derefter deres tweets i de næste 72 timer, og kontroller for omtaler af opkast, diarré, mavesmerter, feber eller kulderystelser. Dermed opdagede de 480 sandsynlige tilfælde af madforgiftning.

Men når sæsonen ændrer sig, er det deres arbejde, der sporer influenzavirus, der er mest åbne. Google Flu Trends har ligeledes forsøgt at bruge Google-søgere til at spore bevægelse af influenza, men modellen overvurderede stærkt sidste års udbrud, måske fordi mediedækning af influenza fik folk til at begynde at stille influenzarelaterede forespørgsler. Twitter-analyse repræsenterer et nyt datasæt med et par kvaliteter - en højere geografisk opløsning og evnen til at fange en brugers bevægelse over tid - der kunne give bedre forudsigelser.

For at starte deres influenza-tracking-projekt så SocialHealth-forskerne specifikt på New York og indsamlede omkring 16 millioner geotagged offentlige tweets om måneden fra 600.000 brugere i tre måneder. Nedenfor er en tidsperiode af en New York Twitter-dag, med forskellige farver, der repræsenterer forskellige frekvenser af tweets på det sted (blå og grøn betyder færre tweets, orange og rød betyder mere):

For at gøre brug af alle disse data udviklede hans team en algoritme, der bestemmer, om hver tweet repræsenterer en rapport om influenzalignende symptomer. Tidligere havde andre forskere simpelthen gjort dette ved at søge efter nøgleord i tweets ("syge" for eksempel), men hans team fandt ud af, at fremgangsmåden fører til falske positiver: Mange flere brugere twitrer, at de er trætte af lektier, end de er føler sig syg.

For at redegøre for dette kigger hans teams algoritme efter tre ord i træk (i stedet for et) og overvejer, hvor ofte den bestemte rækkefølge er tegn på en sygdom, baseret på et sæt tweets, de manuelt havde mærket. Udtrykket "syg af influenza" er for eksempel stærkt korreleret med sygdom, mens "syge og trætte" er mindre. Nogle særlige ord - hovedpine, feber, hoste - er stærkt forbundet med sygdom, uanset hvilken treordssekvens de er en del af.

Når disse millioner af tweets var kodet, kunne forskerne gøre et par spændende ting med dem. Til at begynde med så de på ændringer i influenzarelaterede tweets over tid og sammenlignede dem med niveauer af influenza som rapporteret af CDC, hvilket bekræftede, at tweets nøjagtigt fangede den samlede tendens i influenzaforhold. I modsætning til CDC-data er de imidlertid tilgængelige i næsten realtid snarere end en uge eller to efter det faktum.

Men de gik også dybere og så på samspillet mellem forskellige brugere - repræsenteret af to brugere, der twitrede fra det samme sted (GPS-opløsningen er omkring en halv byblok) inden for den samme time - for at modellere, hvor sandsynligt det er, at en sund person ville blive syg efter at have kommet i kontakt med nogen med influenza. Naturligvis mødes to mennesker, der twitrede fra den samme blok med 40 minutters mellemrum, ikke nødvendigvis personligt, men oddsen for, at de har mødtes, er lidt højere end to tilfældige brugere.

Som et resultat, når du ser på et stort nok datasæt med interaktioner, fremkommer et billede af transmission. De fandt, at hvis en sund bruger støder på 40 andre brugere, der rapporterer sig selv som syge med influenzasymptomer, øges hans eller hendes odds for at få influenzasymptomer den næste dag fra mindre end en procent til 20 procent. Med 60 interaktioner stiger dette tal til 50 procent.

Holdet kiggede også på interaktioner på Twitter selv, isolerede par af brugere, der følger hinanden og kalder dem "venskaber." Selvom mange Twitter-forhold kun eksisterer på Internettet, svarer nogle til interaktive interaktioner, og de fandt, at en bruger der har ti venner, der rapporterer sig selv som syge, er 28 procent mere tilbøjelige til at blive syge næste dag. I alt ved hjælp af begge disse typer interaktioner var deres algoritme i stand til at forudsige, om en sund person ville blive syg (og tweet om det) med 90 procents nøjagtighed.

Vi er stadig i de tidlige stadier af denne forskning, og der er masser af begrænsninger: De fleste bruger stadig ikke Twitter (ja, virkelig), og selvom de gør det, tweetes de muligvis ikke om at blive syge.

Men hvis denne slags system kunne udvikles videre, er det let at forestille sig alle mulige applikationer. Din smartphone kan automatisk advare dig, hvis du f.eks. Havde brugt for meget tid på de steder, der er besat af mennesker med influenza, og bedt dig om at gå hjem for at stoppe med at sætte dig selv i infektionsvejen. En hel byens indbyggere kunne endda advares, hvis det var på randen til et udbrud.

På trods af de 150 år, vi er fjernet fra John Snow's gennembrud for sygdomsmapping, er det klart, at der stadig er aspekter af sygdomsinformation, som vi ikke fuldt ud forstår. Som da kan kortlægning af dataene hjælpe med at give svarene.

Dine tweets kan forudsige, når du får influenza