https://frosthead.com

Kongressbiblioteket vil stoppe arkivering af Twitter

Tilbage i 2010 forventede ingen, at knudepunktet i USAs politiske diskurs snart skulle skifte til Twitter, den sociale messaging-applikation, der gav brugerne mulighed for at "mikroblogge" 140-karakter beskeder (skønt det for nylig er blevet hævet til en breezy 280 tegn). På det tidspunkt begyndte Twitter at sende Library of Congress hver offentlig tweet, der nogensinde blev sendt, endog gå tilbage til sine tidligste eksistensdage i 2006. Efter 12 års grabbing af hver eneste hot take, fastfood feud, racistisk re-tweet, russisk bot og underlig musing af Twitter-stjerne dril, biblioteket har fået nok. Harper Neidig på The Hill rapporterer, at LOC meddelte i går, at den efter den 31. december kun vil indsamle tweets, som den finder af historisk betydning.

I en hvidbog om emnet citerer biblioteket flere grunde til ændringen. For det første er mængden af ​​tweets vokset dramatisk, siden en aftale blev først underskrevet med Twitter for syv år siden, hvilket gjorde styringen af ​​samlingen tyngende. Naturen af ​​tweets har også ændret sig. Biblioteket modtager kun teksterne på tweets og modtager ikke billeder, videoer eller animerede gif, der er knyttet til dem. Over tid, da det er blevet en større del af Twitter-kulturen, har samlingen mistet meget indhold og kontekst.

Biblioteket nævner også den nylige udvidelse af tweet-karaktergrænsen som en årsag til ændringen og forklarer, at Twitter forandrer sig og kan ændre sig mere i fremtiden. ”Biblioteket samler generelt ikke omfattende. I betragtning af den ukendte retning af sociale medier, da gaven først blev planlagt, gjorde biblioteket en undtagelse for offentlige tweets, ”forklarer biblioteket i avisen. ”Med de nu etablerede sociale medier bringer biblioteket sin indsamlingspraksis mere i overensstemmelse med sin indsamlingspolitik.”

I øjeblikket er det 12-årige arkiv med tweets ikke offentligt tilgængeligt, og LOC har ingen aktuelle tidsplan for, hvornår det muligvis er tilgængeligt. De siger nu, at det vil tjene som et øjebliksbillede af de første 12 år af en nye form for social kommunikation, som om Biblioteket havde al telegraf, der nogensinde blev sendt i løbet af de første 12 år af denne teknologi.

Flytningen var ikke helt ud af det blå. Andrew McGill hos The Atlantic forklarer, at LOC ikke havde de rette ressourcer eller erfaring til projektet, og at ingen ingeniører arbejdede på fuld tid på tweets. Biblioteket kastede mere eller mindre batches uforarbejdede tweets, 500 millioner produceret hver dag, til en server, der skal behandles på et senere tidspunkt. ”Dette er en advarsel, når vi begynder at behandle big data - vi skal være forsigtige med, hvad vi tilmelder os, ” fortæller Michael Zimmer fra University of Wisconsin-Milwaukee til McGill. ”Når biblioteker ikke havde ressourcer til at digitalisere bøger, var det kun et firma på størrelse med Google, der var i stand til at lægge pengene og kropperne i dem. Og det kan være her, hvor Library of Congress sidder fast. ”

Tilbage i 2010 var antallet af tweets cirka en tiendedel af den nuværende trafik, og “retweet” -funktionen var stadig ny, og trådene var ikke aktive. Over tid har tweets, der er indlejret i tråde, fotos og videoer og den nye karakterbegrænsning, imidlertid gjort hver tweet større og mængden af ​​daglige data svimlende. I 2013, rapporterer McGill, indrømmede biblioteket allerede, at det kæmpede, og sagde, at det ville tage 24 timer på LOC's nuværende system at udføre en søgning i tweetarkivet fra 2006 til 2010.

I den oprindelige aftale accepterede biblioteket at embargo tweets i seks måneder og fjerne alle slettede tweets og private tweets. Forskere var glade for at få adgang til dataene, men er skuffede over manglen på offentlig adgang. Stadig håber nogle, at biblioteket i sidste ende vil finde en måde at gøre tweets tilgængelige, hvilket kan være meget værdifuldt for sociologer, psykologer, politiske videnskabsmænd og andre forskere.

”Jeg er ingen ph.d., men det forstyrrer mit sind at tænke, hvad vi måske kunne lære om os selv og verden omkring os ud fra denne rigdom af data, ” skrev LOC, tidligere kommunikationsdirektør Matt Raymond, da partnerskabet var annonceret. ”Og jeg er sikker på, at vi lærer ting, som ingen af ​​os nu endda muligvis kan blive gravid.”

Selvom vi ikke har arkiverne at gennemse, har Twitter stadig lært os masser af ting. Regelmæssige mennesker kan være mere sjove end de bedste komikere. De kan også være abysmalt stum. Nazister eksisterer stadig og har ikke noget problem med at udtrykke deres forfærdelige tanker. Troll vil ødelægge enhver samtale, uanset hvor banalt. Og kortfattethed er selvfølgelig viden om sjæl. Og viddeløshed i samme mål.

Kongressbiblioteket vil stoppe arkivering af Twitter