https://frosthead.com

At tale med maskiner

Stemmegenkendelsessoftware, som de fleste af os sandsynligvis ville være enige i, er en ret cool ting. Men det at tale med maskiner er en del - det være sig smartphone, tv-skærm eller instrumentbræt - godt, ikke så meget. Beder du råd om en enhed? Reeks af nørd. Enunciating hvert ord, så du kan blive forstået? Hvor sej kan du virkelig være?

Men Apple, sandt at forme, har taget dette hoved ved at ansætte tre ikoner af cool at spille i deres seneste annoncekampagne for Siri, stemmen fra iPhone 4S. Der er Zooey Deschanel (Adorable Cool) og John Malkovich (Cerebral Cool) og Samuel L. Jackson (Ultimate Cool), og de får alle til at engagere sig i ordspil a med en telefon som gudsporten.

Kritikere påpeger ikke desto mindre, at Siri i det virkelige liv hverken er så lydhør eller allvidende, som hun skildres i reklamer. Du er også sikker på at du er chokeret over at høre dette. Andre ser det hele som moden for parodi - se Zooey's bror Jooey lave en morsom eller Die version af Zooey's og Siris regnfulde dag sammen.

Lige meget. Siri er blevet en forsanger i robotens kor, “You Got Mail” -stemmen fra en ny generation.

Det er moderigtigt i nogle kredse at antyde, at Siri ikke er Steve Jobs-værdig, at hvis han stadig var i live, ville Jobs have trukket det væk fra markedet eller i det mindste aldrig ville have godkendt en så høj profil kampagne for så mangelfuldt produkt.

Men som Jobs 'efterfølger, Tim Cook, sagde tidligere i denne uge, sagde iPhone 4S-ejere som Siri. Ifølge en undersøgelse, der blev offentliggjort i marts, siger næsten 90 procent, at de bruger den mindst en gang om måneden. Og husk, at Siri, et af de meget få Apple-produkter, der siges at være i beta, da det blev frigivet, ikke vil fejre hendes første fødselsdag før i oktober. Hun lærer stadig sprog og, endnu vigtigere, er lige begyndt at udnytte potentialet ved kunstig intelligens.

Siri vil sandsynligvis være et midtpunkt i Apple TV, der forventes at debutere i december. Men chancerne er, at det sted, hvor vi snakker med maskiner, går i vores biler.

Kør, sagde hun

Ja, det sker allerede, men du er stadig nødt til at skifte til robot tale, hvis du vil blive forstået. Og selv da er der ingen garanti. Det vil begynde at ændre sig i sommer, når nogle nye modeller kommer udstyret med noget, der hedder Dragon Drive!

Det er opfindelsen af ​​Nuance Communications, et Massachusetts-baseret firma, der er blevet et kraftcenter inden for stemmegenkendelsesbranchen. (Det antages bredt at være hjernen bag Siri.) Nuance og stemmegenkendelse i biler tog et stort spring frem i sidste uge, da firmaet meddelte, at Dragon Drive! vil være i stand til at tappe ind i skyen.

Hvad dette betyder er, at systemet dramatisk vil forbedre sin datakraft og hukommelsesevne. Og det betyder, at stemmen i dit dashboard bliver mere Siri-lignende og giver dig mulighed for rent faktisk at tale med det. Ikke mere monosyllabisk råb. Dagen kommer, hvor du vil være i stand til at nævne tilfældigt, at du har lyst til nogle Allman Brothers, og sekunder senere kommer "Whipping Post" og pumper gennem højttalerne.

Nøglen er, hvor godt vi er i stand til at lære maskiner kontekst og pragmatik - hvordan sprog bruges i sociale situationer. Og det er en vanskelig forretning. For det første skal selv den mest sofistikerede stemmegenkendelsesenhed vente på, at et menneske er færdig med at tale, så det er i stand til at analysere og fortolke hele sætningen. Så er der ”sindets teori”, evnen til at forstå, at andre mennesker kan have forskellige overbevisninger og intentioner end vores egen. Så vidt vi ved, er det kun mennesker, der kan gøre dette.

En nylig undersøgelse af to Stanford-psykologer kan give dig en fornemmelse af, hvad der er involveret i at hjælpe maskiner intuit. Forskerne Michael Frank og Noah Goodman oprettede et online-eksperiment, hvor deltagerne blev bedt om at se på et sæt objekter og derefter vælge, hvilken der blev henvist til at være et bestemt ord. For eksempel så en gruppe deltagere en blå firkant, en blå cirkel og en rød firkant. Spørgsmålet til denne gruppe var: Forestil dig, at du taler med nogen, og du vil henvise til det midterste objekt. Hvilket ord vil du bruge, "blå" eller "cirkel"?

Den anden gruppe blev spurgt: Forestil dig, at nogen taler til dig og bruger ordet "blå" til at henvise til et af disse objekter. Hvilket objekt taler de om?

Svarene hjalp forskerne med at få et klarere billede af, hvordan en lytter forstår en taler, og hvordan en taler beslutter, hvad de skal sige. Fra det tidspunkt udviklede de den slags matematiske model, der kan udvide og forfine en computers tankeproces.

Frank sagde: "Det vil tage mange års arbejde, men drømmen er en computer, der virkelig tænker over, hvad du vil og hvad du mener snarere end bare hvad du sagde."

En måde at tale på

Her er nogle nyere udviklinger inden for stemmegenkendelse:

  • Siri tier: IBM har en tendens til at være virkelig nervøs for, at virksomhedshemmeligheder kommer ud, så det forbyder nu sine ansatte at bruge offentlige filoverførselswebsteder, såsom Dropbox. Men det har også et forbud mod brug af Siri på kontoret, fordi sikkerhedsudviklere bekymrer sig for, at nogen, mens de taler til deres telefon, kunne afsløre følsomme oplysninger, der ender på Apples servere.
  • Tag det, Apple !: Samsung lancerede sin nye Galaxy X III-smartphone i London denne uge, og selvom den store berøringsskærm får meget opmærksomhed, har den også ny stemme- og ansigtsgenkendelsessoftware.
  • Gør hvad jeg siger, ikke hvad jeg gør: Og Samsung stopper ikke der. Den har for nylig indgivet en patentansøgning for en robot, der forstår menneskelig tale. Roboten ville være i stand til at justere sine "lytte" -funktioner for at tage hensyn til omgivende støj, der kan afbryde eller forstyrre kommandoer, den har fået. Det vil også være i stand til at genkende, hvem der taler til det, selvom baggrundsstøjen er meget høj.

Infografisk bonus: Du tror, ​​din bil er computeret nu. Vent, indtil det er helt tilsluttet internettet. Få lavet af hvad en tilsluttet bil kan gøre.

At tale med maskiner