https://frosthead.com

Googles nye AI er en mester i spil, men hvordan kan det sammenlignes med det menneskelige sind?

For mennesker kan skak tage en levetid at mestre. Men Google DeepMinds nye kunstige intelligens-program, AlphaZero, kan lære sig at erobre brættet i løbet af få timer.

Ved at bygge videre på sin tidligere succes med AlphaGo-pakken - en række computerprogrammer designet til at spille det kinesiske brætspil Go - kan Google prale af, at dens nye AlphaZero opnår et niveau af "overmenneskelig præstation" på ikke kun et brætspil, men tre: Gå, skak og shogi (hovedsagelig japansk skak). Teamet af datalogi og ingeniører, ledet af Googles David Silver, rapporterede om sine fund for nylig i tidsskriftet Science .

”Før dette med maskinlæring kunne du få en maskine til at gøre nøjagtigt hvad du vil - men kun den ting, ” siger Ayanna Howard, en ekspert i interaktiv computing og kunstig intelligens ved Georgia Institute of Technology, der ikke deltog i forskning. ”Men AlphaZero viser, at du kan have en algoritme, der ikke er så [specifik], og den kan lære inden for bestemte parametre.”

AlphaZero's smarte programmering forhøjer bestemt ante til gameplay både for mennesker og maskiner, men Google har længe haft sit syn på noget større: engineering intelligence.

Forskerne er omhyggelige med ikke at hævde, at AlphaZero er på randen af ​​verdensherredømme (andre har været lidt hurtigere med at springe pistolen). Alligevel er Silver og resten af ​​DeepMind-holdet allerede håbefulde for, at de en dag vil se et lignende system anvendt til stofdesign eller materialevidenskab.

Så hvad gør AlphaZero så imponerende?

Gameplay er længe blevet respekteret som en guldstandard inden for kunstig intelligensforskning. Strukturerede, interaktive spil er forenklinger af virkelige scenarier: vanskelige beslutninger skal træffes; sejre og tab driver op i indsatsen; og forudsigelse, kritisk tænkning og strategi er nøglen.

Kodning af denne form for dygtighed er vanskelig. Ældre AI'er til spilsspilning - inklusive de første prototyper af den originale AlphaGo - er traditionelt blevet pumpet fulde af koder og data for at efterligne den oplevelse, der typisk er opnået gennem mange års naturligt, menneskeligt gameplay (i det væsentlige en passiv, programmerer-afledt vidensdump). Med AlphaGo Zero (den seneste version af AlphaGo) og nu AlphaZero, gav forskerne programmet kun et input: reglerne for det aktuelle spil. Derefter gik systemet ned og lærte aktivt tricks i selve handlen.

Gå AlphaZero er baseret på AlphaGo Zero, en del af AlphaGo-pakken designet til at spille det kinesiske brætspil Go, der er afbildet ovenfor. Tidlige iterationer af det originale program blev fodret med data fra menneske-mod-menneske-spil; senere versioner, der beskæftiger sig med selvundervisning, hvor softwaren spillede spil mod sig selv for at lære sin egen strategi. (Chad Miller / Flickr / CC BY-SA 2.0)

Denne strategi, kaldet self-play-forstærkende læring, er stort set præcis, hvordan den lyder: For at træne til de store ligaer, spillede AlphaZero sig selv i iteration efter iteration, hvor man hædrer sine evner ved prøve og fejl. Og brute-force-metoden betalte sig. I modsætning til AlphaGo Zero, spiller AlphaZero ikke bare Go: Det kan slå de bedste AI'er i branchen også ved skak og shogi. Læringsprocessen er også imponerende effektiv og kræver kun to, fire eller 30 timers selvledelse for at overgå de programmer, der er specielt skræddersyet til at mestre henholdsvis shogi, skak og Go. Navnlig rapporterede undersøgelsesforfatterne ikke om nogen tilfælde af, at AlphaZero går head-to-head med et faktisk menneske, siger Howard. (Forskerne har måske antaget, at i betragtning af at disse programmer konsekvent kløver deres menneskelige kolleger, ville en sådan matchup have været meningsløs.)

AlphaZero var også i stand til at trounce Stockfish (den nu ubesatte AI-skakmester) og Elmo (den tidligere AI-shogi-ekspert) på trods af at have vurderet færre mulige næste træk på hver tur under spillet. Men fordi de pågældende algoritmer i sagens natur er forskellige og kan forbruge forskellige mængder af magt, er det svært at direkte sammenligne AlphaZero med andre, ældre programmer, påpeger Joanna Bryson, der studerer kunstig intelligens ved University of Bath i Storbritannien og gjorde ikke bidrage til AlphaZero.

Google holder mor om meget af det fine print på sin software, og AlphaZero er ingen undtagelse. Selvom vi ikke ved alt om programmets strømforbrug, er det, der er klart, det: AlphaZero skal pakke nogle seriøse computermmunition. I disse knappe træningstimer holdt programmet sig meget travlt og deltog i titus eller hundreder af tusinder af øvelsesrunder for at få sin brætspilsstrategi op til snus - langt mere end en menneskelig spiller ville have brug for (eller i de fleste tilfælde kunne endda udrette) i stræben efter færdigheder.

Dette intensive regime brugte også 5.000 af Googles proprietære maskinelæringsprocessorenheder eller TPU'er, som efter nogle skøn forbruger omkring 200 watt pr. Chip. Ligegyldigt hvordan du skærer det, kræver AlphaZero måde mere energi end en menneskelig hjerne, der kører på cirka 20 watt.

Det absolutte energiforbrug af AlphaZero skal tages i betragtning, tilføjer Bin Yu, der arbejder på grænsefladen mellem statistik, maskinlæring og kunstig intelligens ved University of California, Berkeley. AlphaZero er magtfuld, men måske er det ikke godt for pengene - især når man tilføjer de personlige timer, der gik ind i dens oprettelse og udførelse.

AlphaZero, der er energisk dyrt eller ej, gør en plask: De fleste AI'er er hyperspecialiserede på en enkelt opgave, hvilket gør dette nye program - med dets tredobbelt trussel om spil - bemærkelsesværdigt fleksibelt. ”Det er imponerende, at AlphaZero var i stand til at bruge den samme arkitektur til tre forskellige spil, ” siger Yu.

Så ja. Googles nye AI sætter et nyt mærke på flere måder. Det er hurtigt. Det er magtfuldt. Men gør det det smart?

Det er her definitioner begynder at blive grumset. ”AlphaZero var i stand til at lære fra starten uden nogen menneskelig viden at spille hvert af disse spil til overmenneskeligt niveau, ” sagde DeepMinds Silver i en erklæring til pressen.

Selv hvis ekspertise i brætspil kræver mental skarphed, har alle fuldmagter til den virkelige verden deres grænser. I sin nuværende iteration maksimerer AlphaZero ved at vinde menneskesignede spil - hvilket muligvis ikke berettiger den potentielt alarmerende etiket "superhuman." Plus, hvis overrasket med et nyt sæt regler midt i spillet, kan AlphaZero blive flummoxed. Den egentlige menneskelige hjerne kan derimod gemme langt mere end tre brætspil i sit repertoire.

Hvad mere er at sammenligne AlphaZeros baseline med en tabula rasa (tom skifer) - som forskerne gør - er en strækning, siger Bryson. Programmører fodrer stadig med det en vigtig stykke menneskelig viden: spillereglerne det handler om at spille. ”Det har langt mindre at gå på end noget andet har gjort før, ” tilføjer Bryson, “men det mest grundlæggende er, at det stadig er givet regler. Det er eksplicit. ”

Og disse irriterende regler kunne udgøre en betydelig krykke. ”Selvom disse programmer lærer at udføre, har de brug for vejens regler, ” siger Howard. ”Verden er fuld af opgaver, der ikke har disse regler.”

Når push kommer til at skyve, er AlphaZero en opgradering af et allerede kraftfuldt program - AlphaGo Zero, forklarer JoAnn Paul, der studerer kunstig intelligens og computational dreaming ved Virginia Polytechnic Institute og State University og ikke var involveret i den nye forskning. AlphaZero bruger mange af de samme byggesten og algoritmer som AlphaGo Zero, og udgør stadig kun en undergruppe af ægte smarts. ”Jeg troede, at denne nye udvikling var mere evolutionær end revolutionær, ” tilføjer hun. ”Ingen af ​​disse algoritmer kan oprette . Intelligens handler også om historiefortælling. Det forestiller sig ting, der endnu ikke er der. Vi tænker ikke på disse termer i computere. ”

En del af problemet er, at der stadig ikke er nogen konsensus om en sand definition af "intelligens", siger Yu - og ikke kun inden for teknologiområdet. ”Det er stadig ikke klart, hvordan vi træner kritisk tænkende væsener, eller hvordan vi bruger den ubevidste hjerne, ” tilføjer hun.

Til dette punkt mener mange forskere, at der sandsynligvis findes flere typer intelligens. Og at tappe ind i en langt fra garanterer ingredienserne til en anden. For eksempel er nogle af de smarteste mennesker derude forfærdelige ved skak.

Med disse begrænsninger, Yu's vision for fremtiden for kunstig intelligens partnere mennesker og maskiner i en slags coevolution. Maskiner vil bestemt fortsætte med at udmærke sig ved visse opgaver, forklarer hun, men menneskelig input og tilsyn kan altid være nødvendigt for at kompensere for det uautoriserede.

Der er selvfølgelig ikke noget, der fortæller, hvordan tingene ryster ud på AI-arenaen. I mellemtiden har vi masser at overveje. "Disse computere er magtfulde og kan gøre visse ting bedre end en menneskelig kan, " siger Paul. "Men det mangler stadig under intelligensens mysterium."


Denne artikel blev oprindeligt offentliggjort på NOVA.
Googles nye AI er en mester i spil, men hvordan kan det sammenlignes med det menneskelige sind?