https://frosthead.com

Kan computere dechiffrere et 5.000 år gammelt sprog?

Indus-civilisationen, der blomstrede gennem store dele af det tredje årtusinde f.Kr., var dets mest omfattende samfund i sin tid. På sin højde omfattede det et område på mere end en halv million kvadrat miles centreret omkring det, der i dag er grænsen mellem Indien og Pakistan. Rester af Indus er fundet så langt nord som Himalaya og så langt syd som Mumbai. Det var den tidligste kendte bykultur i subkontinentet, og det prale af to store byer, en ved Harappa og en ved Mohenjo-daro. På trods af sin størrelse og levetid og trods næsten et århundredes arkæologiske undersøgelser, forbliver meget om Indus indhyllet i mystik.

Det lille, vi ved, er kommet fra arkæologiske grave, der begyndte i 1920'erne og fortsætter i dag. I løbet af årtierne har arkæologer vist mange artifakter, inklusive frimærkeforseglinger, amuletter og små tabletter. Mange af disse artefakter bærer det, der ser ud til at være eksempler på skrift - indgraverede figurer, der ligner blandt andet vingede hestesko, spoke hjul og lodrette fisk. Hvad nøjagtigt disse symboler kan betyde, forbliver dog en af ​​de mest berømte uløste gåder i stipendiet fra gamle civilisationer.

Der har været andre hårde koder at knække i historien. Stumpede egyptologer fik en heldig pause med opdagelsen af ​​den berømte Rosetta-sten i 1799, der indeholdt tekst på både egyptisk og græsk. Undersøgelsen af ​​maya-hieroglyfer langsomt, indtil en russisk sprogforsker ved navn Yury Knorozov anvendte klog brug af nutidig talt maya i 1950'erne. Men der er ingen Rosetta-sten i Indus, og lærde ved ikke, hvilke sprog der eventuelt er nedstammet fra det, der er talt af indusfolket.

For omkring 22 år siden i Hyderabad, Indien, vendte en studerende i ottende klasse ved navn Rajesh Rao siden i en historiebog og lærte først om denne fascinerende civilisation og dens mystiske script. I årene efter fulgte Raos skolegang og erhverv ham i en anden retning - han afviklede forfølgning af datalogi, som han underviser i dag på University of Washington i Seattle - men han overvågede Indus-stipendier omhyggeligt og holdt oversigt over de snesevis af mislykkede forsøg på at give mening til scriptet. Selv da han studerede kunstig intelligens og robotik, samlede Rao et lille bibliotek med bøger og monografier på Indus-skriften, ca. 30 af dem. På en nærliggende boghylde opbevarede han også den elskede historiebog til ottendeklasse, der introducerede ham for Indus.

”Det var bare fantastisk at se antallet af forskellige ideer, folk foreslog, ” siger han. Nogle forskere hævdede, at forfatterskabet var en slags sumerisk skrift; andre beliggende i Dravidian-familien; endnu andre mente, at det var relateret til et sprog på påskeøen. Rao erkendte, at dette var "sandsynligvis et af de mest udfordrende problemer med hensyn til den gamle historie."

Da forsøg efter forsøg mislykkedes med at dechiffrere scriptet, begyndte nogle eksperter at miste håbet om, at det kunne dekodes. I 2004 argumenterede tre lærde i et kontroversielt papir, at Indus-symbolerne overhovedet ikke havde sprogligt indhold. I stedet kan symbolerne have været lidt mere end piktogrammer, der repræsenterer politiske eller religiøse figurer. Forfatterne gik så langt som at antyde, at Indus overhovedet ikke var en litterat civilisation. For nogle i marken begyndte hele jakten på at forsøge at finde sprog bag disse Indus-ætsninger ligne en øvelse i nytteløs.

Få år senere gik Rao ind i striden. Indtil da var folk, der studerede manuskriptet, arkæologer, historikere, lingvister eller kryptologer. Men Rao besluttede at lokke hemmelighederne fra Indus-scriptet ved hjælp af det værktøj, han kendte bedst - datalogi.

Rajesh Rao er fascineret af Indus-civilisationen siden ottende klasse og bruger datalogi og et koncept kaldet "betinget entropi" til at hjælpe med at afkode Indus-scriptet. (Med tilladelse fra David Zax) I løbet af årtier har arkæologer vist mange artefakter fra Indus-civilisationen, herunder frimærkeforseglinger, amuletter og små tabletter. (Robert Harding / Robert Harding verdensbillede / Corbis) Rao og hans samarbejdspartnere offentliggjorde deres fund i tidsskriftet Science i maj. De dechiffrer ikke sproget, men deres fund skærpede forståelsen for det. (Robert Harding / Robert Harding verdensbillede / Corbis) Rao og hans kolleger ser nu på længere karakterstrenge end de analyserede i Science- artiklen. At finde mønstre ville igen hjælpe med at bestemme, hvilke sprogfamilier scriptet måske tilhører. (Med tilladelse fra David Zax)

En sommerdag i Seattle bydte Rao mig ind på sit kontor for at vise mig, hvordan han og hans kolleger nærede sig problemet. Han redegjorde for en samling kopier af indtryk af lertætning, som arkæologer har vist fra Indus-steder. De er små - som små firkantede chokolader - og de fleste af dem har et billede af et dyr under en række Indus-symboler. De fleste eksempler på Indus-scriptet er miniaturer som disse, der kun indeholder nogle få tegn; ingen grand monolit er blevet opdaget. Forskere er usikre på funktionen af ​​de små sæler, fortalte Rao mig, men en teori er, at de muligvis er blevet brugt til at certificere kvaliteten af ​​de handlede varer. En anden antyder, at sælerne måske har været en måde at sikre, at forhandlere betalte skat ved indsejling eller forladelse af en by - mange sæler er fundet blandt ruinerne af porthuse, som måske har fungeret som gamle bomstationer.

Rao og hans kolleger forsøgte ikke at udføre mirakler - de vidste, at de ikke havde tilstrækkelig information til at dechiffrere det gamle skrift - men de antagede, at de ved hjælp af beregningsmetoder i det mindste kunne begynde at finde ud af, hvilken slags indus der blev skrevet script var: kodede det sprog, eller ej? De gjorde dette ved hjælp af et koncept kaldet "betinget entropi."

På trods af det imponerende navn er betinget entropi et ret simpelt begreb: det er et mål for mængden af ​​tilfældighed i en rækkefølge. Overvej vores alfabet. Hvis du skulle tage Scrabble fliser og smide dem i luften, kan du finde et hvilket som helst gammelt brev dukker op efter noget andet. Men i virkelige engelske ord er der mere sandsynligt, at visse bogstaver forekommer efter andre. En q på engelsk følges næsten altid af en u . Et t kan følges af en r eller e, men det er mindre sandsynligt, at det efterfølges af et n eller et b .

Rao og hans samarbejdspartnere - en international gruppe, der inkluderer computerforskere, astrofysikere og en matematiker - brugte et computerprogram til at måle den betingede entropi af Indus-scriptet. Derefter målte de den betingede entropi af andre typer systemer - naturlige sprog (sumerisk, tamil, sanskrit og engelsk), et kunstigt sprog (computerprogrammeringssproget Fortran) og ikke-sproglige systemer (humane DNA-sekvenser, bakterielle proteinsekvenser og to kunstige datasæt, der repræsenterer høje og lave ekstremer af betinget entropi). Da de sammenlignede mængden af ​​tilfældighed i Indus-scriptet med størrelsen af ​​de andre systemer, fandt de, at det mest lignede de satser, der findes på de naturlige sprog. De offentliggjorde deres fund i maj i tidsskriftet Science .

Hvis det ligner et sprog, og det fungerer som et sprog, er det sandsynligvis et sprog, antyder deres papir. Resultaterne dechiffrerer selvfølgelig ikke manuskriptet, men de skærper vores forståelse for det og har givet forsikring til de arkæologer, der havde arbejdet under den antagelse, at Indus-scriptet koder for sprog.

Efter at have offentliggjort papiret, blev Rao en overraskelse. Spørgsmålet om, hvilken sprogfamilie skriften tilhører, viser det sig, er et følsomt: på grund af Indus-civilisationens alder og betydning, vil mange moderne grupper i Indien gerne hævde det som en direkte stamfar. For eksempel foretrækker de tamilspråklige indianere i syd at lære, at indus-skriften var en slags proto-dravidisk, da tamil er stammende fra proto-dravidisk. Hindi-højttalere i nord ville hellere være en gammel form for sanskrit, en stamfar til Hindi. Raos papir konkluderer ikke, hvilken sprogfamilie scriptet tilhører, skønt det bemærker, at den betingede entropi ligner den gamle tamil - hvilket får nogle kritikere til at kort ”beskylde os for at være dravidiske nationalister”, siger Rao. ”Grusomheden i beskyldningerne og angrebene var helt uventet.”

Rao har undertiden lettelse ved at vende tilbage til den mindre voldsomt omstridte verden af ​​neurovidenskab og robotik. Men opkaldet fra Indus-scriptet forbliver lokkende, og "hvad der tidligere var en hobby, monopoliserer nu mere end en tredjedel af min tid, " siger han. Rao og hans kolleger ser nu på længere karakterstrenge end de analyserede i Science- artiklen. ”Hvis der er mønstre, ” siger Rao, ”kunne vi komme med grammatiske regler. Det vil igen give begrænsninger for, hvilke slags sprogfamilier ”skriften måtte tilhøre.

Han håber, at hans fremtidige konklusioner vil tale for sig selv og medføre mindre ranspirer fra modstandere, der stammer fra en region i Indien mod en anden. Når Rao på sin side taler om, hvad Indus-scriptet betyder for ham, har han en tendens til at tale i form af Indien som helhed. ”Indiens arv ville blive beriget betydeligt, hvis vi var i stand til at forstå Indus-civilisationen, ” siger han. Rao og hans samarbejdspartnere arbejder på det, en linje med kildekode ad gangen.

Kan computere dechiffrere et 5.000 år gammelt sprog?