https://frosthead.com

En forfatter brugte statistikker til at afsløre hemmelighederne ved, hvad der skaber god skrivning

I de fleste litteraturkurser på universitetsniveau finder du studerende, der dissekerer små dele af litterære klassikere: Shakespeares ensembler, Joyces strøm af bevidsthed og Hemingways staccato-sætninger. Der er ingen tvivl om, at der er så meget, der kan læres om en forfatter, hans eller hendes håndværk og en historiens betydning ved denne type læsning.

Men Ben Blatt fremsætter et stærkt argument for en anden tilgang. Ved at fokusere på bestemte sætninger og afsnit, poserer han i sin nye bog, Nabokovs yndlingsord er Mauve, oversætter læserne alle de andre ord, der i en gennemsnitlig roman udgør titusinder af datapunkter.

Journalisten og statistikeren oprettede en database med teksten fra en smadring af det 20. århundredes klassikere og bestsellere for kvantitativt at besvare en række spørgsmål af interesse. Hans analyse afslørede nogle finurlige mønstre, der ellers kan gå upåagtet hen:

Med tallene har de bedste åbningssætninger til romaner en tendens til at være korte. Prolific forfatter James Patterson gennemsnit 160 klichéer pr. 100.000 ord (det er 115 mere end den ærede Jane Austen), og Vladimir Nabokov brugte ordet mauve 44 gange oftere end den gennemsnitlige forfatter i de sidste to århundreder.

Smithsonian.com talte med Blatt om hans metode, nogle af hans centrale fund og hvorfor big data er vigtige for studiet af litteratur.

Du har taget en statistisk tilgang til at studere alt fra Where's Waldo til Seinfeld, fastfood-led til pop-sange. Kan du forklare din metode, og hvorfor du gør, hvad du gør?

Jeg er datajournalist og ser på ting inden for popkultur og kunst. Jeg kan virkelig godt lide at se på ting kvantitativt og objektivt, som har en masse information, som folk ikke har gennemgået. Hvis du ville lære om, hvordan den typiske person fra USA er, ville det være nyttigt, men du ville ikke bare tale med en person, vide alt om dem og derefter antage, at alt om mennesker i USA er samme. Jeg tror, ​​en ting ved at skrive den slags fortabes er, at du kan fokusere på en sætning af en forfatter, især i kreative skrivekurser eller en passage, og du mister det større billede for at se disse generelle mønstre og tendenser, som forfattere bruger igen og igen hundreder og måske tusinder af gange i deres egen forfatter.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Nabokovs foretrukne ord er mørkt: Hvad numrene afslører om klassikere, bestsellere og vores egne forfattere

Købe

Så hvad fik dig til at henvende dig til litteratur?

Min baggrund er inden for matematik og datalogi, men jeg har altid elsket at læse og skrive. Da jeg skrev mere og mere, blev jeg meget interesseret i, hvordan forskellige forfattere og folk giver råd om skrift. Der er meget af det, der gav mening, men som ikke syntes at være sikkerhedskopieret af information, og meget af det, der var i konflikt med hinanden. Jeg troede bare, at der skulle være en måde at tage disse emner på skrift, som folk allerede var godt klar over og talte om og teste dem på store forfattere og populære forfattere for at se, om dette råd er reelt, eller om det er receptpligtig rådgivning, der ikke gør ' t betyder virkelig noget i de rigtige bøger og de rigtige sider.

Hvad var det første spørgsmål, du ville stille om litterære klassikere og bestsellere?

Det første kapitel i bogen handler om, om du skal bruge –ly adverb. Dette er også det første kapitel, jeg skrev kronologisk. Det er mest på Stephen Kings råd om ikke at bruge –verb i hans bog On Writing, som for mange forfattere er bogen om at skrive. Men masser af andre forfattere - Toni Morrison, Chuck Palahniuk - og enhver kreativ skriveklasse tilråder ikke at bruge et –ly adverb, fordi det er et unødvendigt ord og et tegn på, at du ikke bliver kortfattet. I stedet for at sige: "Han løb hurtigt", kan du sige, "Han sprintede."

Så jeg ville vide, er det faktisk sandt? Hvis dette er sådan et godt råd, kan du forvente, at de store forfattere faktisk bruger det mindre. Man kunne forvente, at amatørforfattere bruger det mere end publicerede forfattere. Jeg ville virkelig gerne vide, stilistisk, først, om Stephen King fulgte hans eget råd, og så, hvis det gælder alle de andre store og ærbødige forfattere.

Så hvad fandt du?

Faktisk er der en tendens til, at forfattere som Hemingway, Morrison og Steinbeck, deres bedste bøger, dem, der holdes op og har mest opmærksomhed på dem nu, er de bøger, der har mindst antallet af adverb. Hvis du sammenligner amatørfiktionskrivning og onlineskrivning, der ikke er redigeret med bestsellere og Pulitzer-prisvindere i nyere tid, er der et uoverensstemmelse, hvor de mindre udgivne adverb bruges af de udgivne forfattere. Jeg er ikke så ensidig, at jeg tror, ​​du bare kan tage de –ly adverber fra en okay bog, og det bliver en fantastisk bog. Det er åbenbart ikke, hvordan det fungerer. Men der er noget ved det faktum, at forfattere, der skriver på en meget direkte måde, producerer bøger, der generelt lever længst.

p13 - Adverbs.JPG

Hvordan gik du hen til oprette en database med litterære værker?

På mange af spørgsmålene brugte jeg de samme 50 forfattere, som jeg havde valgt noget vilkårligt. Grundlæggende var det baseret på forfattere, der var på toppen af ​​bestsellerlisten, forfattere, der var øverst på de største forfattere på alle tidslister og forfattere, der netop repræsenterede en række forskellige genrer og tider og læsere. På den måde kan du gennem hele bogen sammenligne disse forfattere og lære dem at kende.

Det var meget vigtigt for mig, at hvis jeg sagde noget i retning af, "Toni Morrison bruger dette ord i denne takt, " talte jeg om hver eneste roman, hun nogensinde har skrevet, og ikke kun de tre, som jeg tilfældigvis allerede har. I min bog er der 50 til 100 forfattere, der henvises til overalt. Jeg fandt deres bibliografier og fandt derefter alle deres romaner, som de havde skrevet op til det tidspunkt, som deres komplette optegnelse. På nogle måder er det lidt som at holde sportsstatistikker, hvor hver bog er slags som en sæson, og så alle disse sæsoner eller bøger mødes som en karriere. Du kan se, hvordan forfattere ændrer sig over tid, og hvordan de generelt gør tingene. Når du først har alle bøgerne på arkivet, er det meget ligetil at besvare disse spørgsmål, der på nogle måder er meget skræmmende.

Og hvordan behandlede du al den tekst?

Der er et programmeringssprog kaldet Python, og inden for det er der et sæt værktøjer kaldet Natural Language Toolkit, ofte forkortet NLTK. De involverede værktøjer er frit tilgængelige for enhver. Du kan downloade pakken online og bruge den på Python eller andre sprog. Du kan ikke få mange af skriftlige spørgsmål især, men du kan sige, hvor mange gange vises dette ord i teksten? Det kan gennemgå og identificere, hvor sætninger slutter, og hvor sætninger begynder, og dele af talen - adjektiv vs. adverb vs. verb. Så når du først har disse værktøjer, kan du hente dataene.

Hvilken statistik udarbejdede du manuelt? Hvad var det mest kedelige?

Der er et afsnit, hvor jeg ser på åbningssætninger. Elmore Leonard, der var en meget succesrig romanforfatter, havde sagt: ”Åbn aldrig en bog med vejr.” Dette er også råd, der findes i mange skriveguider. Så jeg gik gennem hundreder af forfattere for at se, hvor ofte de åbner deres bog om vejret. F.eks. Tror Danielle Steel, 45 procent af hendes første sætninger i bøger handler om vejret. Mange gange er det bare "Det var en storslået dag" eller "Det var lyst og solrigt ude", lignende ting. Til dette var der ingen måde at gøre det automatisk uden at have nogle fejl, så jeg ville bare gennemgå alle bogfiler og markere, om der var vejr involveret. Du kan sige, det var kedeligt, fordi det var en masse data indsamlet, men det var lidt sjovt at gå igennem og læse hundreder af åbningsdomme på en gang. Der er andre mønstre, der tydeligt fremgår af forfattere over tid.

P207 --- Weather.jpg

Som du siger, kedelig for nogle, sjovt for andre. Nogle synes måske, at denne analytiske tilgang er kedelig, men du argumenterer for, at den kan være "morsom" og "ofte ligefrem morsom." Hvad var dit morsomste fund?

Titlen på bogen, Nabokovs foretrukne ord er Mauve, handler om, hvordan antallet af ord, som han bruger i den højeste hastighed sammenlignet med engelsk, er svagt med numrene. Det ender med at give en masse mening, hvis man ser på hans baggrund, fordi han havde synestesi. Han talte i sin selvbiografi om, hvordan hans hjerne automatisk fremkaldte farver, når han hørte forskellige bogstaver og lyde.

Jeg gentog dette eksperiment på 100 andre forfattere for at se, hvad deres yndlingsord er. Som et resultat får du tre ord, der er repræsentative for deres skrivning efter de ord, de bruger mest. Civility, fancy og uforsigtighed. Det er Jane Austen. Jeg tror, ​​at hvis du så disse ord, kunne Jane Austen muligvis være en af ​​dine første gæt. Og så har du en forfatter som John Updike, der er en smule mere grusom og reel og af en anden tid. Hans yndlingsord er rimmet, stikket og kneppet. Jeg synes, det er meget interessant at se personligheden komme gennem disse enkle matematiske spørgsmål. Hvis du har en favoritforfatter, afslører det noget om deres personlighed, som du måske ikke har bemærket før, hvis du går igennem det.

Ray Bradbury havde skrevet, at hans yndlingsord var kanel. Ved tallene bruger han det meget. Hans forklaring på, hvorfor han kunne lide kanel, var, at det mindede ham om hans bedstemors pantry. Så jeg gik igennem og fandt andre krydderord og lugtord, der kunne være forbundet med en bedstemors spiskammer, og Ray Bradbury bruger de fleste af disse ord i meget høj hastighed. På en eller anden måde kan du få dette underlige, freudianske kig på noget ved forfatteres barndom. Hvis Ray Bradbury ikke havde sagt det, kunne du måske stadig finde ud af det.

Du sammenlignede amerikanske og britiske forfattere og bekræftede en stereotype om, at amerikanere er højlydt. Kan du forklare denne?

Denne var faktisk oprindeligt baseret på en undersøgelse foretaget af en kandidatstuderende i Stanford. Han havde identificeret ord, der bruges til at beskrive dialog i bøger og beskrev dem som højt, neutralt eller støjsvagt. ”Hviskede” og ”knurrede” ville være under stille. Neutral ville være "sagde han" eller "sagde hun", og højt ville være "udbrød han" eller "råbte". Jeg gik gennem de 50 forfattere, som jeg kiggede på, såvel som store eksempler på fan-fiction, og fandt, ikke med en skør margin men en meningsfuld margin, at amerikanere har et højere forhold mellem de høje ord og de stille ord. Der er et par forklaringer. Det kan være, at det er sådan, amerikanere taler gennem hele deres liv, så det er sådan, forfattere beskriver dem, der ofte taler. Du kan også bare se det som amerikanske forfattere, der foretrækker mere actionbaserede, thriller, historier i højt tempo sammenlignet med de mere subtile. Amerikanerne er faktisk højere over antallet.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, forfatter af Nabokovs yndlingsord er Mauve (Sierra Katow)

Hvorfor synes du, at anvendelse af matematik til skrivning er en god måde at studere litteratur på?

Jeg går bestemt ikke ind for, at dette skal være den første måde, du studerer litteratur på, hvis du forsøger at forbedre din skrivning. Men selv en roman med moderat længde er sandsynligvis 50.000 ord, og det er 50.000 datapunkter. Du vil bare ikke være i stand til at suge det hele ind på én gang, og der vil være nogle spørgsmål, som du bare ikke kan besvare læsning på egen hånd. Det er godt at se det større billede. Hvis du sætter dig ned og studerer et afsnit, er du i din kreative skriveklasse og taler med din professor. Hvis der er en bestemt måde at se på det, vil du bare se det igennem alt. Men med dataene frigør den slags dig for dem, og du kan besvare nogle spørgsmål uden disse forudindvindinger og virkelig få nogle nye oplysninger.

Du nævner, at du fortsat tænkte på Roald Dahls "Den store grammatizator."

Der er en stor Roald Dahl-historie, hvor i det væsentlige en ingeniør udtænker en måde at skrive en historie på. I dette dommedagscenarie kan nogen bare give maskinen et plot, og det vil spytte en sidste roman. Der antages, at de producerer romaner, der er så formelformede og grundlæggende. Hovedpersonen i denne historie vælger ikke at deltage i maskinens drift og kæmper imod den ved at skabe sin egen skrift og kunst.

Jeg tror bestemt, at denne bog, hvis du skriver, vil svare på mange spørgsmål til dig og helt sikkert ændre den måde, du tænker på nogle ting, men i sidste ende er der virkelig ingen erstatning for ideer, der får folk til at tænke og scener, der får folk til bange eller forbinde med karaktererne. Denne bog ser på håndværket til at skrive og ikke nødvendigvis hvordan man opretter en mindeværdig historie. Denne bog forsøger ikke at konstruere en perfekt roman, og jeg tror ikke, vi er så tæt på det, som nogle mennesker måske frygter.

En forfatter brugte statistikker til at afsløre hemmelighederne ved, hvad der skaber god skrivning