SENESTE AI LÆRER SIG SELV AT SPILLE GÅ UDEN MENNESKELIG HJÆLP | SMARTE NYHEDER | SMITHSONIAN - SMARTE NYHEDER, SMARTE NYHEDSVIDENSKAB

Sidste år slog et kunstigt intelligens-program kaldet AlphaGo oprettet af Googles DeepMind-team en menneskelig mester på Go, et gammelt kinesisk strategispil, der på mange måder er mere kompliceret end skak. Som Emily Matchar rapporterede for Smithsonian.com på det tidspunkt, var det en fantastisk præstation, da så sent som i 1997 forudsagde nogle mennesker, at det ville tage 100 år for en computer at slå et menneske på Go.

Mens bragden er imponerende, lærte AlphaGo at spille spillet ved at analysere tidligere spil spillet af mennesker. Men som Merrit Kennedy hos NPR rapporterer, har en ny version af den kunstige intelligens kaldet AlphaGo Zero fundet ud af, hvordan man mestrer spillet på egen hånd, uden menneskelig input eller manipulation - et fremskridt, der har store implikationer for den fremtidige AI-udvikling.

Ifølge en pressemeddelelse fra DeepMind lærte tidligere versioner af AlphaGo at spille spillet ved at studere kampe mellem professionelle og stærke amatørspillere, absorbere spillereglerne og succesrige spillestrategier. AlphaGo Zero så imidlertid ikke på nogen spil, der blev spillet af mennesker. I stedet blev det givet spillereglerne og derefter spillet mod sig selv ved hjælp af forstærkningslæring for at lære sig selv rigtige og forkerte bevægelser og langsigtede strategier. Da AI spillede spillet, opdaterede det sit avancerede neurale netværk for bedre at forudsige modstanderens bevægelser.

Forskerne så, da AI mestrer spillet i realtid. Efter tre dage var det i stand til at besejre en tidligere version kaldet AlphaGo Lee, som slog den koreanske Go-mester Lee Sedol i 4 ud af 5 spil i 2016. Efter 21 dage bested det AlphaGo Master, den version, der slog 60 top Go-spillere online og verdens bedste spiller Ke Jie tidligere på året. Den seneste version bestilte AlphaGo Master 100 spil til 0. Efter 40 dage nåede den niveauer af spillet ingen har set før. Forskningen vises i tidsskriftet Nature.

”På kort tid har AlphaGo Zero forstået al Go-viden, der er blevet akkumuleret af mennesker gennem tusinder af år med at spille, ” siger hovedforsker David Silver fra Googles DeepMind i en Youtube-video. ”Nogle gange er det faktisk valgt at gå ud over det og opdagede noget, som mennesker ikke engang havde opdaget i denne periode og opdagede nye viden, som er kreative og nye på mange måder.”

Som Agence France-Presse rapporterer, nåede AlphaGo Zero dette mestringsniveau meget mere effektivt end sine forgængere. Mens den forrige iteration havde 48 databehandlingsenheder og spillede 30 millioner træningspil i løbet af flere måneder, havde Zero kun 4 behandlingsenheder og spillede 4, 9 millioner træningspil i løbet af tre dage. ”Folk har en tendens til at antage, at maskinlæring handler om big data og massive mængder beregning, men det, vi faktisk så med AlphaGo Zero, er, at algoritmer betyder meget mere, ” fortæller Silver til AFP.

Men forskningen handler om mere end bare at mestre et brætspil. Som Ian Sample fra The Guardian rapporterer, kunne denne type tabula rasa, eller tom skifer, indlæring føre til en ny generation af generel kunstig intelligens, der kan hjælpe med at løse problemer i felter, der kan simuleres godt i en computer, som lægemiddelsammensætning, proteinfoldning eller partikelfysik. Ved at opbygge sin viden fra bunden op uden menneskelige forudindtægter eller begrænsninger, kunne algoritmerne gå i retninger, som mennesker endnu ikke har tænkt på at se ud.

Mens mange mennesker i AI-samfundet ser AlphaGo Zero som en stor bedrift, fortæller Gary Marcus, psykologiprofessor ved New York University, der er specialiseret i kunstig intelligens, NPRs Kennedy, at han ikke synes algoritmen virkelig er tabula rasa, fordi forudgående menneskelig viden gik ind i konstruktionen af algoritmen. Han synes heller ikke, at tabula rasa AI er så vigtig, som det ser ud til. "[I] biologi er faktiske menneskelige hjerner ikke tabula rasa ... Jeg ser ikke den vigtigste teoretiske grund til, at du skal gøre det, hvorfor du skal opgive en masse viden, som vi har om verden, " siger han.

Alligevel er Alpha Gos hurtige mestring af spillet imponerende - og lidt skræmmende.