https://frosthead.com

Million Word March

Det plejede at være, at ekspertkilden til, hvad der var eller ikke var et ord, var skoledagens hæfteklamme: ordbogen. American Heritage, Websters tredje, Oxford engelsk: der var et par betroede spillere i spillet.

Men hvad nu hvis disse spillere mister deres fordel?

Tag ordet "staycation". Staycation, som betyder at tilbringe en ferie derhjemme, dukkede for nylig op i New York Times, USA Today og MSNBC . Men det er sandsynligt, at det ikke snart vises i en ordbog. Det samme gælder "bracketology" (videnskaben om NCAA March Madness-spil) Facebook og Wikipedia .

"Vi forsøger at dække de mest fremtrædende" ord ", siger Joe Pickett, udøvende redaktør af American Heritage Dictionary.„ Hvad har den uddannede lægmand brug for at vide? "

De mennesker, der laver ordbøger, er kendt som leksikografer ("forfattere eller redaktører af en ordbog." Tak, Merriam-Webster). Og de har en tidstestet metode til at vælge, hvilke nye ord der skal attesteres, og hvilke der skal smides inden den næste udgave eller opdatering af en ordbogs websted.

Grupper af redaktører i en ordbog ser specifikke emneområder og logger de hits, et nyt ord får. En "hit" omtales i en bog, avis eller websted. Derefter sætter de hits i en database og sammenligner de nye udtryk med ord, de allerede har. Så selvom Facebook, som varemærke, ikke kvalificerer sig, gør hvert eneste ord i Shakespeares skuespil - inklusive cap-a-pie ("fra hoved til fod") og fardel ("byrde"). Da han var bedstefar til den kreative sprogvidenskab, opfandt Shakespeare mere end 1.700 ord. Alle af dem vises i en ufortablet ordbog.

Ordbøger afviser ord for at være for tekniske (selv den mest døende "Grey's Anatomy" -fan behøver aldrig at vide, hvad en mammosomatotroph er) eller for at være for ung (staycation).

De tæller ikke mærkenavne (Coke, Facebook, Wikipedia) eller de fleste udenlandske ord og udtryk.

"Vi prøver ikke at være Wikipedia, " sagde Pickett.

Så hvem er det? Hvem holder styr på, tæller og sorterer ordene, som engelsktalende bruger til daglig?

Austin, Tex., Har sporet ord i de sidste fem år. Ved hjælp af sine egne team af eksperter og sin egen algoritme siger de, at engelsk tilføjer et nyt ord hvert 98 minut. Dette betyder, at der er mere end 900.000 engelske ord i verden, og en millionthed vises i april 2009.

I modsætning hertil har de fleste standardordbøger omkring 200.000 ord, ufortegnede ordbøger ca. 600.000.

Men skærmen er så sikker på sine tal, at den har startet en Million Word March, en nedtælling til det ene million ord.

"Vi gik tilbage til mellemengelsk og så, at definitionen af ​​et ord var 'en talt talt', " sagde Paul JJ Payack, præsident og chefordanalytiker på Monitor, "hvilket betyder, hvis jeg siger et ord, og du forstår mig, det er et rigtigt ord. "

Payack tæller staycation, Facebook og Wikipedia som ord. Men han følger også nogle af de gamle regler. For eksempel tælles ord, der både er substantiv og verb, såsom "vand" kun én gang. Han tæller ikke alle de navne der er på kemikalier, fordi der er hundreder af tusinder.

Når skærmen identificerer et ord, sporer den det over tid og ser for at se, hvor ordet vises. Baseret på denne måling bestemmer de, om ordet har "momentum", dybest set, om det bliver mere populært, eller om det er et enkelt hit-undring i den sproglige verden.

Ved første øjekast virker dette meget som en ordbogs system.

"Det er det samme som den gamle [metode], bare ved at anerkende den nye virkelighed, " sagde Payack. Monitorens metode giver en langt større vægt til online citater.

Men er Payacks "nye virkelighed" godt, reel? Han hævder, at den hurtige strøm af information og fremkomsten af ​​global engelsk har ændret måden, hvorpå folk bruger ord. Og at kløften mellem de ord, folk bruger, og de ord, der vises i ordbøger, muligvis vil stige.

"Det viser sig, at når noget først kommer på Internettet, er det som et ekkokammer, " sagde Payack. Siden den første webbrowser dukkede op i 1991, har Internettet tilføjet en masse ord til det engelske sprog - dot-com, blog - og det er hurtigt tilføjet disse ord. Internettet har også ført eksisterende ord til nye ører.

"Tilbage i midten af ​​90'erne ved at få et par tusinde browsert hits for et ord fik os til at gå ind i det; nu er tærsklen ændret, " sagde Pickett. "Du kan finde så meget bevis for uklare ord og udtryk."

Men ordbøger er vant til at spille indhentning. Når alt kommer til alt er det svært at definere et ord, før det er myntet.

Payack siger, at Internettet ikke er den mest presserende udfordring til traditionel metode til ordtælling. Det er, efter hans mening, "global engelsk."

Engelsk har næsten 400 millioner indfødte højttalere, hvilket sætter det nummer to i verden, men det har 1, 3 milliarder højttalere samlet set, hvilket gør det til verdens mest forståede sprog, forklarer Payack. Det tales af over 300 millioner mennesker i Indien som et andet sprog, og i det mindste af mange andenhøjttalere i Kina.

"Enhver, der taler engelsk lige nu, føles som om de ejer det, " siger Payack. Se for eksempel på adjektivet "brokeback." Efter at instruktør Ang Lee kaldte sin film om to cowboys, der forelsker sig i "Brokeback Mountain", ormede ordet "brokeback" sig ind i det engelske sprogligt som et synonym for 'homoseksuel'. Selvom "brokeback" måske er forbi sine glansdage i USA, er ordet med denne nye betydning stadig populært i Kina, sagde Payack. Det vises på blogs og websteder, hvilket betyder, at det har fart, hvilket betyder, at det er et ord.

"I dag har vi meget mere menneskelig trafik i alle retninger rundt om i verden, " sagde Salikoko Mufwene, en sprogprofessor ved University of Chicago, der har undersøgt udviklingen af ​​regionale dialekter. Hvorvidt kinesisk-inspirerede ord bliver en del af amerikansk engelsk, for eksempel "afhænger af, hvor ofte amerikanere vil interagere med asiater på engelsk, " sagde han.

Og hvis de gjorde det, ville amerikanere i gennemsnit blive mere ordrette? Gennemsnitlige amerikanere bruger ca. 7500 ord om dagen og ved i alt ca. 20.000. Selv Shakespeare vidste kun omkring 60.000.

Så antallet af ord på det engelske sprog vil altid være mange, mange flere end nogen person kender eller bruger.

Både Mufwene og American Heritage's Pickett sagde, at engelsk meget godt kunne have en million ord allerede. At tælle ord er trods alt en upræcis videnskab.

Det er heller ikke ordbogens videnskab. Ordbøgerne har altid været, sagde Mufwene, "at afspejle, hvordan folk taler, ikke at lære dem at tale." Hvis ordbogsreflektionen bliver smallere, kan den stadig være værdifuld.

"Du har brug for folk til at redigere ordbogen og tage ansvar for den, så den er pålidelig, " sagde Pickett. "Og jeg tror ikke, det vil ændre sig."

Million Word March