https://frosthead.com

Sådan et computerprogram kan lære alt om dig bare fra din Facebook-lide

Odds er, at når du besluttede at "kunne lide" et tv-show, et band, en lokal virksomhed eller et produkts Facebook-side, kunne du ikke forestille dig, at dette klik ville have meget konsekvens. Det viser måske dine venner lidt om dine interesser og får lejlighedsvis statusopdateringer fra siden til at vises i dit nyhedsfeed.

"Likes" er imidlertid offentligt tilgængelige for alle at se på Facebook, selv folk, som du ikke har godkendt som venner. Og til en ny undersøgelse, der blev offentliggjort i dag i Proceedings of the National Academy of Sciences, skabte en gruppe forskere et computerprogram, der kan tage en brugers “likes” og nøjagtigt udlede en enorm vifte af oplysninger om ham eller hende - inklusive alder, etnicitet, IQ, politiske tilbøjeligheder, niveau af stofbrug og endda seksuel orientering.

Til undersøgelsen analyserede forskningsgruppen - et partnerskab mellem Psychometrics Lab på University of Cambridge og Microsoft Research Cambridge - dataene fra 58.000 amerikanske Facebook-brugere, der havde valgt at levere deres profiler og "lide" til analyse via Facebook's myPersonality-app. Forskerne fodrede disse "likes" med en algoritme, der er bygget til dette projekt især, og sammenlignede derefter modellens forudsigelser om en række egenskaber med det, de vidste med sikkerhed om brugerne, der havde sendt indholdet af deres Facebook-profiler til analyse såvel.

For hvert undersøgt træk - f.eks. Kaukasisk eller afroamerikansk, eller demokrat eller republikaner - valgte forskerne et par brugere, med et tilhørende hver kategori, og algoritmen måtte blindt vælge, hvilken bruger der passer til hvilken kategori, der kun var baseret på deres "synes godt om." Det var ikke 100 procent perfekt til at udlede nogen af ​​kategorierne, men det var usædvanligt præcist til at forudsige mange, inklusive nogle egenskaber, som du sandsynligvis ikke ville antage, at de kan gætte ud fra dine "likes".

Det udledes for eksempel korrekt, hvilken bruger der var kaukasiske og afroamerikanske 95 procent af tiden, demokrat og republikanske 88 procent af tiden og kristen og muslim 82 procent af tiden. En fordeling af dens nøjagtighed ved at forudsige mange af de betragtede træk (som en påmindelse ville en værdi på 1 betyde, at modellen er 100 procent nøjagtig) er nedenfor.

Modellen forudsagde en række brugeregenskaber med uhyggelig nøjagtighed. Modellen forudsagde en række brugeregenskaber med uhyggelig nøjagtighed. (Billede via PNAS / Kosinski et al.)

For de fleste af brugerne afhænger dette nøjagtighedsniveau ikke af nogen åbenlyse “likes”, som man muligvis kan linke til den betragtede egenskab. For eksempel havde mindre end 5 procent af de brugere, der identificeres som homoseksuelle, "ønsket" homoseksuelt ægteskab eller andre relaterede sider.

Algoritmen aggregerede i stedet tonsvis af tilsyneladende ikke-relaterede “likes” til at gruppere brugere i klasser, der delte forudsigelige ligheder. Ved at sammenligne "likes" med resultaterne af en personlighedstest (også en del af myPersonality-appen) fandt forskerne, at brugere, der "kan lide" "Tordenvejr, " "Colbert-rapporten, " "Videnskab" eller "Curly Fries" alle er lidt mere tilbøjelige til at have høj IQ end dem, der ikke gør det. Tilsvarende var mandlige brugere, der "kunne lide" "Mac Cosmetics" eller "Wicked The Musical", lidt mere tilbøjelige til at være homoseksuelle, mens de, der kunne lide "Wu-Tang Clan" eller "Shaq" var lidt mindre sandsynlige.

Analyse af alle brugers “likes” aktiverede algoritmen til at skabe et overordnet portræt af dem, men dets nøjagtighed var stærkt påvirket af antallet af “likes” for hver bruger. For dem i den lave ende, med 1-10 likes, var forudsigelserne ikke bedre end chance, men for dem med 150 til 300 "likes", var algoritmen i stand til at forbedre sin evne til at gætte brugernes egenskaber i endnu bedre grad .

Forskerne gennemførte primært undersøgelsen for at vise, hvor meget vores offentligt tilgængelige information kan fortælle om os. Du lægger måske ikke offentligt din seksuelle orientering, politiske synspunkter eller om du bruger narkotika, men denne slags program kan analysere dine "likes" og komme med ret nøjagtige gætte uanset.

Selvom brugerne havde sendt deres “likes” og profiler til analyse via en tredjeparts-app, betyder Facebooks standardindstillinger for privatlivets fred, at dine “likes” er offentlige for alle. Allerede bruger Facebooks egne algoritmer disse likes til at diktere, hvilke historier der ender i brugernes nyhedsfeeds, og annoncører kan få adgang til dem for at bestemme, hvilke er de mest effektive annoncer, der vises, når du gennemser.

Sådan et computerprogram kan lære alt om dig bare fra din Facebook-lide