https://frosthead.com

Kysse sprogbarrierer farvel

I lang tid har den universelle oversætter været en besættelse af popkultur. Star Trek præsenterer det som en håndholdt maskine, der ligner en mikrofon, der kan oversætte de fleste sprog med det samme . Hitchhiker's Guide to the Galaxy kan prale af en Babel-fisk, en væsen, der, når den sidder inde i ens øre, tilbyder øjeblikkelig oversættelse af ethvert sprog i galaksen.

Så det burde ikke komme som nogen overraskelse, at nutidige mennesker forsøger at skabe en enhed, der fungerer lige så godt. Der findes dusinvis af apps til oversættelsessmartphone, men de fleste oversætter ord på et enkelt, en-til-en-grundlag; en bruger skriver eller taler et ord, og appen hopper tilbage med en oversættelse. Målet og det reelle monetære vindfald er nu, at ingeniører og iværksættere kan gøre det muligt for to personer at tale på forskellige sprog, mens en lille enhed spytter oversættelser i realtid.

Eksisterende oversættelsesapps

På en rejse til Grækenland blev engelsktalende Andrew Lauder syg.

”Jeg gik på apoteket, og de kunne ikke forstå noget engelsk, så jeg fik ingen medicin, ” siger Lauder, administrerende direktør for Vocre Translate. Medikamentetiketterne var bogstaveligt talt græsk for ham. Sprogbarrierer er almindelige for verdens rejsende. I et fremmed land bliver små transaktioner som at købe medicin eller få kørselsanvisninger - en anden vanskelighed, som Lauder står overfor - til herculiske opgaver.

Da han vendte tilbage til staten, oprettede Lauder Vocre Translate, en stemme- og tekstoversættelsesapp. Det begyndte som en tekst-til-tekst-app (kaldet MyLangauge), derefter oprindeligt omdannet til en tale-til-tekst-model, der ligesom andre apps, herunder SayHi Translate, brugte en traditionel model, hvor et ord oversættes direkte til et andet ord. Sig ”Hej”, og smarttelefonen eller tabletten krypterer en automatisk ”Hola”. ”Farvel” bliver ”Sayonara.” Og så videre, ligesom en tekstoversætter.

For at skabe den enkle lydoversættelse havde skaberne af disse apps brug for data. Vocre hentede sine oplysninger fra optagelser og dokumenter fra public domain, såsom gamle film eller offentlige høringer. ”Vi bad grundlæggende en telefonsvarer-transkriptionstjeneste for at lade os bruge deres sky til talegenkendelse, ” siger SayHi CEO Lee Bossier.

Når ingeniørerne havde lyd- og tekstdata, parrede de lyden og teksten ord for ord. Stemmegenkendelsessoftware genkender “ost” og konverterer det til tekst. Det er konverteret til fransk, og appen finder den franske udtale for "fromage."

Når det er sagt, hvis en bruger cheekily kalder noget "osteagtigt", fungerer oversætteren ikke så godt, fordi talesprog næsten ikke er så statisk som skriftsprog. Kadens, slang, bøjning, udtale, dialekt og konversationsstrøm kan ændre mening

Over tid ønsket Lauder imidlertid en mere samtaleenhed. I en e-mail siger han, ”Baseret på vores brugsdata har vi fundet ud af, at folk taler meget forskelligt fra den måde, de skriver. Det talte ord er meget mere spontant og meget mindre formelt og bogstaveligt. ”Så han benyttede sig af statistisk maskineoversættelse, en fremgangsmåde, der også bruges af Google, der bruger data til at finde almindelig ordforbrug, hvor han går imod den traditionelle ord-til-ord-oversættelsesmodel. Grundlæggende lærer Vocre, som det bruges. ”Det lærer baseret på hver samtale, hver sætning, der går igennem den. Det er noget, der bliver smartere med tiden, ”siger Lauder.

På nuværende tidspunkt tager begge apps et par sekunder at oversætte, men er uden tvivl effektive, især i samspil med kropssprog, til transaktionssamtaler som bestilling af et måltid. Når alt kommer til alt har mennesker bestilt mad på ikke-modersmål i mange år og har altid formået at stadig spise. Men de har ikke været i stand til at have dybdegående, komplekse samtaler.

Med Vocre og SayHi kan samtaler stive svimle sammen, men det er ikke det samme som at chatte på dit modersmål. Google har til hensigt at ændre dette helt.

Googles tilgang (statistisk maskinoversættelse)

Når vi lærer et nyt sprog i skolen, begynder vi med individuelle ordforråd. Men sprog er mere flydende - ord har brug for kontekst.

”Den fremgangsmåde [Google] tager er en mere generel tilgang, ” siger Josh Estelle, en softwareingeniør for Google Translate. ”I stedet for at prøve at kode alle disse regler, prøver vi at lære reglerne ved at se på data.”

Teknologiselskabet undgår en-til-en-ord-til-ord-metode og anvender i stedet statistisk maskineoversættelse, idet den ikke ser på, hvad ord betyder, men hvordan sprog modelleres, hvilket det lærer gennem data . Så det sigter mod skoven, ikke træerne. Et engelsk eksempel: vi kender definitionerne af ordet "break" og "up". Men udtrykket "break up" er ikke den bogstavelige kombination af de to ord.

Statistisk maskinoversættelse kræver data. Bjerge af det. For at metoden skal fungere, behøver den ikke kun det faktum, at "foder" er fransk til ost, men 100 eksempler på, at både "foder" og ost bruges i faktiske sætninger.

Estelle siger, at hvis en engelsktalende har to menuer, identisk med undtagelse af det faktum, at den ene er trykt på engelsk og en på kinesisk, "kan du sandsynligvis finde ud af, hvad den kinesiske karakter er for 'suppe.'" Kontekst er konge. Men for at skabe den sammenhæng har du brug for adgang til millioner af menuer og ethvert andet tænkeligt dokument.

Hvilket er nøjagtigt hvad Google har. Uden webgiganten til at samle bunker af data kunne en ægte Babel-fisk ikke eksistere. Det gennemsøger internettet og indsamler alt - tekst og lyd. Derefter feeds den disse data i algoritmer, der sammenligner alt med alt andet. Disse sammenligninger hjælper med at komme til roden af, hvordan sprog naturligt fungerer.

”En ting, der overrasker folk, når vi taler om Translate, er, at vores team ikke har nogen sprogkundskaber på det, ” siger Estelle. ”Vi har lanceret 71 sprog, og jeg vil sige, at vores team ikke ved, hvordan man taler langt de fleste af dem. En menneskelig oversætter vil ikke være i stand til at lære alle disse udtryk og ting så hurtigt som vores [data] kan lære af nettet. ”

Hvad er pointen?

Ligesom Google ser Facebook fordele. Overvej det sociale medies webstedets eget forsøg på oversættelse.

"Facebooks mission har været at forbinde hele verden, og en af ​​hindringerne for at forbinde verden er ikke alle, der taler det samme sprog, " siger Tom Stocky, en teknikdirektør hos Facebook. "På oversættelsessiden tror jeg, at den virkelig ambitiøse vision for fremtiden er, hvis du kunne bruge Facebook på dit modersmål og interagere med ethvert andet sprog."

I august 2008 erhvervede Facebook Jibbigo, en tale-til-tale-oversættelsesapp, der er tilgængelig til Android- og iOS-enheder.

Keen Facebook-brugere vil bemærke, at det sociale site allerede har en vis oversættelse. Hvis du nogensinde har haft et spansk indlæg på din engelsk-baserede side, har du straks fået muligheden for at oversætte det til dit modersmål.

Men Stocky ser stemmekomponenten som en potentiel spiludveksler. Fremgangen i smartphones og tablets hilser en evigt sammenkoblet verden velkommen, og fremkomsten af ​​talegenkendelsessoftware inviterer nye måder til webinteraktion. Stocky ser for sig en fremtid, hvor brugere bare kan tale en kommando til deres smartphones og interagere med andre brugere, sprogforskelle til side.

”Der er ingen tvivl om, hvad der vil ske i sidste ende, fordi de eneste begrænsninger der er kraften i sprogmotoren og selvfølgelig behandlingstid og behandlingskraft, ” siger han.

Laura Murphy, professor i afdelingen for globale sundhedssystemer og udvikling ved Tulane University og en godkendt teknik skeptiker, sætter spørgsmålstegn ved værdien af ​​en universel oversætter og behøver ikke at vide mere end et sprog.

Hun mener, at enheden kunne være noget nyttigt med rejser, forretningsforbindelser og internationale forbindelser, men ikke banebrydende. På et bestemt niveau har vi allerede oversættere (mennesker) på plads, og de fleste, der arbejder i udenrigsrelationer, kender de relevante sprog. En enhed, mener Murphy, kan have negative konsekvenser.

”Jeg tror, ​​det kan gøre folk dovne, ” siger Murphy. Oversættelse af sprog kan være mentalt udfordrende ved at tvinge hjernen - især et, der kender mere end to sprog - til at arbejde på en anden måde, men øvelsen er ikke desto mindre givende. Hjernen trækker fra et sted med sproglig empati, som selv den fineste stemmeoversætter aldrig kunne nå.

Selvom denne universelle kommunikation kan være en positiv, anerkender Murphy, ”kan det føre til, at folk tænker, at de kommunikerer, når de ikke er det.” Kultur er ikke altid fuldt udformet i sprog (tag f.eks. Sarkasme), og kommunikation er ikke altid om de oplysninger, der videregives.

Hvornår kan vi forvente at se denne teknologi?

”I 2005 tog det 40 timer at oversætte 1.000 sætninger, ” siger Estelle fra Google. ”I dag oversætter vi svarende til 1.000 sætninger hvert 10. millisekund.”

Som Richard Anderson berømt siger i 1970'erne TV-serien The Six Million Dollar Man, “Vi har teknologien.” Nu handler det bare om at vente på indsamling og analyse af data. Hvor lang tid det vil tage forbliver ukendt, ifølge Estelle. Men forsigtige skøn lægger en sådan enhed i vores hænder inden for et årti.

Mens appskabere som Bossier eller gigantiske virksomheder som Google og Facebook ikke ønsker at bygge deres egne versioner af det bibelske tårn i Babel, vil de stoppe babbling. Den forestiller sig en verden, hvor vi alle kommunikerer, om medicin, om politik, om ideer.

Og den verden er måske ikke langt væk.

Redaktørens note: Vi opdaterede denne historie den 4. april 2014 for nøjagtigt at beskrive Vocre Translate-teknologien.

Kysse sprogbarrierer farvel