https://frosthead.com

Turing-testen for computerintelligens er for nem

Alan Turing, en engelsk matematiker, der spillede en nøglerolle som kodebrydere under 2. verdenskrig, kaldes undertiden computer til programmering. Han er berømt for at foreslå en test for computerintelligens, der var baseret på et parlor-spil, hvor en spørger forsøgte at udlede kønet til to personer bag et gardin. Parlor-spillet var enkelt: Skriftlige spørgsmål og svar blev sendt frem og tilbage, så tone og tonehøjde ikke forrådte folkene bag gardinet. Turings foreslåede test skifter en af ​​de skjulte personer til en computer. Spillet er at finde ud af, hvad gardin skjuler et menneske, og som skjuler kunstig intelligens.

Vi kalder dette nu Turing-testen, og det afspilles typisk på en computer gennem en samtale med en chatbot. Sidste sommer overbeviste et program, der emulerer personligheden af ​​en 13-årig ukrainsk dreng, "Eugene Goostman, " 33 procent af dommerne om, at det var menneskeligt, rapporterer Dan Falk for Smithsonian .

Turing optimistisk forudsagde, at i år 2000 et computerprogram ville narre dommerne 30 procent af tiden. Men endnu har de fleste chatbots kæmper for at virkelig "lyde" menneskeligt. Årets brag er blevet mødt med kritik, fordi Eugene kan skjule sin natur bag de fejltagelser, en teenage, der ikke taler perfekt engelsk, måtte gøre. Falk skriver:

I en af ​​mine samtaler i 2012 indtastede jeg en simpel vittighed - og den enhed, som jeg talte med, ændrede øjeblikkeligt emnet til hamburgere. (Computer videnskabsmand Scott Aaronson havde for nylig en lignende oplevelse, da han chattede med Eugene via botens hjemmeside. Aaronson spurgte Eugene, hvor mange ben en kamel har; den svarede: "Noget mellem 2 og 4. Måske tre? :-)))" Senere, da Aaronson spurgte, hvor mange ben en maur har, hostede Eugene nøjagtigt det samme svar, triple-smiley og alt sammen.)

Hvis folk kan narre af en computer, der tuter nonsens - ikke nøjagtigt et tegn på intelligens - så skulle vi sandsynligvis komme med en bedre måde at teste AI Gå ind i Lovelace Test, opkaldt efter Ada Lovelace, den første computerprogrammør.

Lovelace skrev i 1843, at computere ikke kan betragtes som intelligente, før de kan skabe noget originalt, noget de ikke var programmeret til at gøre, rapporterer Jordan Pearson til bundkortet. Lovelace-testen blev først foreslået i 2001, men Mark Riedl, en AI-forsker, forklarer, at denne test, som oprindeligt udtænkt, heller ikke er perfekt. ”Jeg er ikke sikker på, at testen faktisk fungerer, fordi det er meget usandsynligt, at programmereren ikke kunne finde ud af, hvordan deres AI skabte noget, ” sagde han til New Scientist .

Hans opdatering, Lovelace 2.0-testen, ville blot bede computeren om at skabe noget originalt og kreativt: en historie, digt eller et billede. Han skriver:

Hvis dommeren er tilfreds med resultatet, anmoder de om en anden, vanskeligere anmodning. Dette fortsætter, indtil AI vurderes at have svigtet en opgave, eller dommeren er tilfreds med, at den har vist tilstrækkelig intelligens. De flere runder betyder, at du får en score i modsætning til et pas eller ikke bestået. Og vi kan registrere en dommer forskellige anmodninger, så de kan testes mod mange forskellige AI'er

Testen fungerer mere som et sammenligningsværktøj mellem AI-systemer, siger New Scientist . Men det ser i det mindste ud som om det ikke kan lindres af tricks, som Turing-testen kan. Også værd at bemærke: skabelsens æstetik betyder ikke noget. Når alt kommer til alt kan ikke alle levende, vejrtrækende mennesker male mesterværker. Men de fleste kan spille Pictionary, påpeger Riedl.

Turing-testen for computerintelligens er for nem