https://frosthead.com

Sådan lærer GPS at tale dit sprog

Karen Jacobsen, en australsk sanger og stemmeskuespillerinde, fik optræden i 2000, kort efter ankomsten til New York. Producenterne - erhvervstyper - sendte hende til et optagestudio i tre uger, hvor hun tilbragte fire timer om dagen på at sige ting som ”i det næste kryds, drej til venstre” og ”genberegner”. I sidste ende var det ikke hendes stemme det var anstrengt. ”Jeg sagde” cirka ”cirka 186 gange, ” husker Jacobsen. ”Den slags ting kan få dig til at blive uklar.”

Relateret indhold

  • Fra Ptolemeus til GPS, den korte historik om kort

To år senere fik hun et telefonopkald fra en ven. ”Karen, ” slørede hendes ven. ”Jeg købte min mand en af ​​de nye GPS-ting, og vi satte den på den australske stemme. Det er dig! ”Sådan fandt Jacobsen ud af, at hendes stemme gav veje til 400 millioner mennesker rundt om i verden.

Hendes arbejde fremhæver hybrid af blod og tech, der går ind i de nu allestedsnærværende stemmer, der fortæller os, hvor vi skal dreje: Mere end en milliard mennesker er afhængige af Google Maps hver måned, og 80 procent aktiverer stemmemuligheden.

I de tidlige dage af stemmesyntesen - tænk på robotlydene fra Speak & Stave fra slutningen af ​​1970'erne - konverterede en algoritme tekst til en monotone strøm. Efterhånden som databaser voksede, kunne du optage en stemmeskuespiller som Jacobsen, der udtaler et korpus af stavelser og ord, hvilke algoritmer ville kombinere og ændre i henhold til grundlæggende regler. For nylig har softwarekodere hos virksomheder som Nuance, der designer navigationsgrænseflader til biler, udviklet en tredje tilgang - anvendelse af dyb læring til talesyntese. Det blander indspillede ord og syntetiserede uddrag og stoler på kunstig intelligens for at gøre udtalen endnu mere menneskelig. ”De lyder uhyggeligt naturlige, ” siger Nuances teknologichef, Vlad Sejnoha.

Naturligvis forbliver sprogfald en udfordring for stemmesystemer. ”Tænk 'bough' versus 'købte', 'eller' læse 'versus' læst ', " siger en Google-talsperson. ”Men forhåbentlig kan brugeren altid gætte, hvad vi mente.” Nu hvor AI lærer bilnav-systemer at tale mere intelligent, vil det næste søge i onlineverdenen og finde ud af, hvor du vil hen, før du gør det.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Abonner på Smithsonian magasin nu for kun $ 12

Denne artikel er et udvalg fra juli / august-udgaven af ​​Smithsonian-magasinet

Købe
Sådan lærer GPS at tale dit sprog