Du kan blive tilgivet for at tro, at AI snart vil erstatte menneskelige læger baseret på overskrifter som "AI-lægen vil se dig nu", "Din fremtidige læge kan ikke være menneskelig" og "Denne AI bare slå menneskelige læger på en klinisk eksamen . ”Men eksperter siger, at virkeligheden er mere et samarbejde end en udstødning: Patienter kunne snart finde deres liv delvis i hænderne på AI-tjenester, der arbejder sammen med humane klinikere.
Der er ingen mangel på optimisme omkring AI i det medicinske samfund. Men mange advarer også om, at hypen omkring AI endnu ikke er realiseret i reelle kliniske omgivelser. Der er også forskellige visioner for, hvordan AI-tjenester kan have størst betydning. Og det er stadig uklart, om AI vil forbedre livene for patienter eller bare bundlinjen for Silicon Valley-virksomheder, sundhedsorganisationer og forsikringsselskaber.
”Jeg synes, at alle vores patienter faktisk skulle ønske, at AI-teknologier skal bæres på svagheder i sundhedsvæsenet, men vi er nødt til at gøre det på en ikke-Silicon Valley hype-måde, ” siger Isaac Kohane, en biomedicinsk informatikforsker hos Harvard Medical School.
Hvis AI fungerer som lovet, kunne det demokratisere sundhedsvæsenet ved at øge adgangen for underudtjente samfund og sænke omkostningerne - en velsignelse i USA, som rangerer dårligt på mange sundhedsforanstaltninger til trods for en gennemsnitlig årlig omkostninger til sundhedsvæsenet på $ 10.739 pr. Person. AI-systemer kunne frigøre overanstrengede læger og reducere risikoen for medicinske fejl, der kan dræbe titusinder, hvis ikke hundretusinder af amerikanske patienter hvert år. Og i mange lande med national lægemangel, såsom Kina, hvor overfyldte byhospitalers polikliniske afdelinger muligvis kan se op til 10.000 mennesker om dagen, behøver sådanne teknologier ikke perfekt nøjagtighed for at vise sig nyttigt.
Men kritikere påpeger, at alt dette løfte kunne forsvinde, hvis hasten med at implementere AI tramper patienters privatlivsret, overser fordomme og begrænsninger eller undlader at implementere tjenester på en måde, der forbedrer sundhedsresultaterne for de fleste.
”På samme måde som teknologier kan lukke forskelle, kan de forværre forskellene, ” siger Jayanth Komarneni, grundlægger og formand for Human Diagnosis Project (Human Dx), et selskab med almen fordel, der fokuserer på medicinsk ekspertise i crowddsourcing. ”Og intet har den evne til at forværre forskelle som AI”
***
I dag er de mest populære AI-teknikker maskinlæring og dens yngre fætter, dyb læring. I modsætning til computerprogrammer, der støjt følger regler skrevet af mennesker, kan både maskinlæring og dyb læringsalgoritmer se på et datasæt, lære af det og komme med nye forudsigelser. Især dyb læring kan give imponerende forudsigelser ved at opdage datamønstre, som folk måske savner.
Men for at få mest muligt ud af disse forudsigelser inden for sundhedsvæsenet, kan AI ikke tage det alene. Tværtimod skal mennesker stadig hjælpe med at træffe beslutninger, der kan have store sundhedsmæssige og økonomiske konsekvenser. Fordi AI-systemer mangler den generelle intelligens hos mennesker, kan de komme med forvirrende forudsigelser, der kan vise sig skadelige, hvis læger og hospitaler uden tvivl følger dem.
Det klassiske eksempel kommer fra Rich Caruana, en seniorforsker hos Microsoft Research, som han forklarede i Engineering and Technology magazine sidste år. I 1990'erne arbejdede Caruana på et projekt, der forsøgte at bruge en tidligere form for maskinlæring for at forudsige, om en patient med lungebetændelse var en lavrisiko eller en højrisikosag. Men der opstod problemer, da maskinindlæringsmodellen forsøgte at forudsige sagen for astmapatienter, som er høje risici, fordi deres forudgående åndedrætsbesvær gør dem sårbare over for lungebetændelse. Modellen bundede disse patienter som lavrisiko og krævede mindre indgriben i stedet for indlæggelse - noget en menneskelig ekspert aldrig ville have gjort.
Hvis du følger modellen blindt, siger Kenneth Jung, forskningsforsker ved Stanford Center for Biomedical Informatics Research, ”så er du sløret. Fordi modellen siger: 'Åh, dette barn med astma kom ind, og de fik lungebetændelse, men vi behøver ikke at bekymre dig om dem, og vi sender dem hjem med nogle antibiotika.' ”
Forudsigelser med dyb læring kan også mislykkes, hvis de støder på usædvanlige datapunkter, såsom unikke medicinske tilfælde, for første gang, eller når de lærer særegne mønstre i specifikke datasæt, der ikke generaliseres godt til nye medicinske tilfælde.
AI-forudsigelser klarer sig bedst, når de anvendes til massive datasæt, såsom i Kina, som har en fordel ved træning af AI-systemer takket være adgang til store populationer og patientdata. I februar offentliggjorde tidsskriftet Nature Medicine en undersøgelse fra forskere med base i San Diego og Guangzhou, Kina, der viste løfte om diagnosticering af mange almindelige børnesygdomme baseret på de elektroniske sundhedsregistre for mere end 567.000 børn.
Men selv store datasæt kan give problemer, især når forskere forsøger at anvende deres algoritme til en ny population. I studien Nature Medicine kom alle de halv millioner millioner patienter fra et medicinsk center i Guangzhou, hvilket betyder, at der ikke er nogen garanti for, at de diagnostiske lektioner, der læres af træning i dette datasæt, ville gælde for pædiatriske tilfælde andetsteds. Hvert medicinsk center kan tiltrække sit eget unikke sæt patienter - et hospital, der er kendt for sit kardiovaskulære center, kan for eksempel tiltrække mere kritiske hjertesygdomme. Og fund fra et Guangzhou-hospital, der for det meste tiltrækker etniske kinesiske patienter, kan måske ikke oversættes til en i Shanghai med et større antal udenlandske fødte, ikke-kinesiske patienter.
I denne TEDx Talk 2017 forklarer Shinjini Kundu fra Johns Hopkins Hospital, hvordan AI-værktøjer har potentialet til at hente mere fra medicinske billeder, end læger alene kan - inklusive forudsigelse af sygdomme, før patienter viser symptomer.
Denne ekstrapolering vil også vise sig at være vanskelig i andre situationer. For eksempel, siger Marzyeh Ghassemi, en datalogi og biomedicinsk ingeniør ved University of Toronto, at du har 40.000 ICU-patienter på Beth Israel Deaconess Medical Center - det er kun et hospital i en by. ”Og så har jeg alle disse papirer, der har forudsagt med disse data. Arbejder det med et andet hospital i Boston? Måske. Arbejder det for et hospital i en anden stat? Ville det fungere i et andet land? Vi ved ikke. ”
***
Mens AI-modeller muligvis ikke fungerer i alle tilfælde, synes Ghassemi, at teknologien stadig er værd at udforske. "Jeg er meget for at tage disse modeller fra bænken til sengen, " siger hun, "men med virkelig aggressive forsigtighedsskridt."
Disse trin skal eksistere i hele AI-udvikling og -udvikling, siger I. Glenn Cohen, en juristprofessor ved Harvard University og leder af projektet om præcisionsmedicin, kunstig intelligens og loven. Dette kan involvere bekræftelse af nøjagtigheden og gennemsigtigheden af AI-forudsigelser. Og under dataindsamling er forskere også nødt til at beskytte patientens privatliv og bede om samtykke til at bruge patientdata til træning af AI
Samtykkeproblemet dukker op igen, når AI-modellen er klar til eksperimentel klinisk test med rigtige patienter. ”Behøver patienter at blive fortalt, at du bruger algoritmen på dem, og betyder det noget, om AI er helt vejledende eller delvist vejleder?” Spørger Cohen. ”Der er virkelig meget lidt tænkning over disse spørgsmål.”
Ghassemi går også ind for hyppigt at revidere AI-algoritmer for at sikre retfærdighed og nøjagtighed på tværs af forskellige grupper af mennesker baseret på etnicitet, køn, alder og sundhedsforsikring. Det er vigtigt i betragtning af, hvordan AI-applikationer i andre felter allerede har vist, at de let kan afhente forspændinger.
Efter alle disse trin er de mennesker og virksomheder, der leverer AI-tjenester, nødt til at sortere juridisk ansvar i tilfælde af uundgåelige fejl. Og i modsætning til de fleste medicinske apparater, som normalt kun har brug for en lovgivningsmæssig godkendelse, kan AI-tjenester muligvis kræve yderligere gennemgang, når de lærer af nye data.
Nogle regulerende agenturer overvejer, hvordan de vurderer sundhedspleje AI I april frigav US Food and Drug Administration (FDA) et diskussionsdokument for at få offentlig feedback om, hvordan man opdaterer den relevante lovgivningsmæssige gennemgang. ”Det, vi kontinuerligt prøver at gøre her, er at vende tilbage til vores mål om at give folk adgang til teknologier, men vi er også klar over, at vores nuværende metoder ikke helt fungerer godt, ” siger Bakul Patel, direktør for digital sundhed hos FDA. "Derfor er vi nødt til at se på en helhedsorienteret tilgang til hele produktets livscyklus."
Ud over spørgsmål omkring adgang, privatliv og regler er det heller ikke klart, hvem der kan drage mest fordel af AI-sundhedsydelser. Der er allerede forskelle i sundhedsvæsenet: Ifølge Verdensbanken og Verdenssundhedsorganisationen mangler halvdelen af klodens befolkning adgang til vigtige sundhedsydelser, og næsten 100 millioner mennesker skubbes ud i ekstrem fattigdom af udgifter til sundhedsvæsenet. Afhængigt af hvordan det er implementeret, kunne AI enten forbedre disse uligheder eller gøre dem værre.
”Meget af AI-diskussionen har handlet om, hvordan man demokratiserer sundhedsvæsenet, og jeg vil se, at det sker, ” siger Effy Vayena, en bioetiker ved Federal Institute of Technology i Schweiz.
”Hvis du bare ender med en bedre service til dem, der alligevel har råd til god sundhedsydelser, ” tilføjer hun, ”jeg er ikke sikker på, om det er den transformation, vi leder efter.”
Hvordan dette hele spiller ud afhænger af de forskellige visioner for implementering af AI Tidlig udvikling har fokuseret på meget snævre diagnostiske applikationer, såsom undersøgelse af billeder for antydninger til hudkræft eller neglesvampe eller læse røntgenstråler fra brystet. Men nyere indsats har forsøgt at diagnosticere flere helbredstilstande på én gang.
I august 2018, Moorfields Eye Hospital i Storbritannien og DeepMind. det London-baserede AI-laboratorium, der ejes af Googles moderselskab Alphabet, viste, at de med succes havde trænet et AI-system til at identificere mere end 50 øjesygdomme i scanninger, der svarede til resultaterne fra førende eksperter. Tilsvarende brede ambitioner drev San Diego og Guangzhou-undersøgelsen, som trente AI til at diagnosticere almindelige lidelser blandt børn. Sidstnævnte var ikke så god til at diagnosticere pædiatriske sygdomme sammenlignet med seniorlæger, men det var bedre end nogle juniorlæger.
Sådanne AI-systemer er muligvis ikke nødvendigt at overgå de bedste menneskelige eksperter for at hjælpe med at demokratisere sundhedsvæsenet, men blot udvide adgangen til de nuværende medicinske standarder. Indtil videre er indtil videre mange foreslåede AI-applikationer fokuseret på at forbedre den nuværende plejestandard snarere end at sprede overkommelig sundhedspleje rundt, siger Cohen: ”At demokratisere, hvad vi allerede har, ville være et meget større smell for dit penge end at forbedre det, vi har i mange områder. ”
Et konsulentfirma Accenture forudsiger, at top-AI-applikationer kan spare den amerikanske økonomi 150 milliarder dollars om året inden 2026. Men det er uklart, om patienter og sundhedsvæsenet systemer, der suppleres med skattebetalernes dollars, ville være til gavn, eller om flere penge simpelthen ville strømme til tech-virksomhederne, udbydere af sundhedsydelser og forsikringsselskaber.
”Spørgsmålet om, hvem der skal køre dette, og hvem der skal betale for dette, er et vigtigt spørgsmål, ” siger Kohane. ”Noget lidt hallucinerende ved alle disse forretningsplaner er, at de tror, de ved, hvordan det vil fungere.”
Selv hvis AI-tjenester fremsætter omkostningsbesparende henstillinger, kan menneskelige læger og sundhedsorganisationer tøve med at tage AI-råd, hvis de tjener mindre penge som et resultat, advarer Kohane. Det taler til det større systemiske problem med de amerikanske sundhedsforsikringsselskaber ved hjælp af en gebyr-for-service-model, der ofte belønner læger og hospitaler for at tilføje tests og medicinske procedurer, selv når de ikke er nødvendige.
***
Der er en anden AI-mulighed, der kan forbedre kvaliteten af plejen, mens den stadig overlader de fleste medicinske diagnoser i hænderne på lægerne. I sin bog fra 2019, Deep Medicine, taler Eric Topol, direktør og grundlægger af Scripps Research Translational Institute, om at skabe i det væsentlige en supercharged medicinsk Siri - en AI-assistent til at notere om samspillet mellem læger og deres patienter, indtaste disse noter inden for elektronisk helbred registrerer, og mind lægerne om at spørge om relevante dele af patientens historie.
”Min ambition er, at vi dekomprimerer lægeres arbejde og slipper for deres rolle som datapersonale, hjælper patienter med at tage mere ansvar og indtaste dataene, så det ikke tager så lang tid at gennemgå tingene, ” siger Topol.
Den "glemte medicinske assistent eller skrivel, " siger Kohane, ville kræve AI, der automatisk kan spore og transkribere flere stemmer mellem læger og patienter. Han støtter Topols idé, men tilføjer, at de fleste AI-applikationer under udvikling ikke synes at være fokuseret på sådanne assistenter. Stadig har nogle virksomheder som Saykara og DeepScribe udviklet tjenester i disse linjer, og endda Google samarbejdede med Stanford University for at teste en lignende ”digital scribe” -teknologi.
En AI-assistent lyder måske mindre spændende end en AI-læge, men det kan frigøre læger til at tilbringe mere tid med deres patienter og forbedre den generelle kvalitet af pleje. Især familielæger bruger ofte mere end halvdelen af deres arbejdsdage på at indtaste data i elektroniske helbredsregistre - en hovedfaktor bag fysisk og følelsesmæssig udbrændthed, som har alvorlige konsekvenser, inklusive patientens død.
Ironisk nok skulle elektroniske helbredsregistre forbedre medicinsk behandling og skære ned på omkostningerne ved at gøre patientoplysninger mere tilgængelige. Nu pegede Topol og mange andre eksperter på elektroniske helbredsregistre som en forsigtighedsfortælling for den nuværende hype omkring AI inden for medicin og sundhedspleje.
Implementeringen af elektroniske helbredsregistre har allerede oprettet et lappetekstsystem, der er spredt blandt hundreder af private leverandører, der hovedsageligt lykkes med at isolere patientdata og gør det utilgængeligt for både læger og patienter. Hvis historien er nogen guide, vil mange teknologivirksomheder og sundhedsorganisationer mærke trækket til at følge lignende veje ved at opbevare medicinske data til deres egne AI-systemer.
En måde at omgå dette kan være at bruge et kollektivt efterretningssystem, der aggregerer og rangerer medicinsk ekspertise fra forskellige kilder, siger Komarneni, der prøver denne tilgang med Human Dx. Oprettet af større medicinske organisationer som American Medical Association, har Human Dx opbygget en online platform til rådgivning fra skare fra tusinder af læger om specifikke medicinske tilfælde. Komarneni håber, at en sådan platform i teorien også en dag kan omfatte diagnostisk rådgivning fra mange forskellige AI-tjenester.
"På samme måde som flere menneskelige fagfolk kan se på din sag i fremtiden, er der ingen grund til, at flere AI ikke kunne gøre det, " siger Komarneni.
Mens læger venter på deres AI-hjælpere, kunne crowddsourcing-projekter som Human Dx "helt sikkert føre til forbedret diagnostik eller endda forbedrede anbefalinger til terapi, " siger Topol, som medforfatter til en undersøgelse i 2018 på en lignende platform kaldet Medscape Consult. Papiret konkluderede, at kollektiv menneskelig intelligens kunne være en "konkurrencedygtig eller komplementær strategi" til AI i medicin.
Men hvis AI-tjenester gennemfører alle test og kontrol i den virkelige verden, kunne de blive betydelige partnere for mennesker i omformning af moderne sundhedsvæsen.
”Der er ting, som maskiner aldrig vil gøre godt, og så er andre, hvor de vil overgå, hvad ethvert menneske kan gøre, ” siger Topol. ”Så når du sætter de to sammen, er det en meget stærk pakke.”
***
Jeremy Hsu er freelance journalist med base i New York City. Han skriver ofte om videnskab og teknologi til Backchannel, IEEE Spectrum, Popular Science og Scientific American, blandt andre publikationer.
Denne artikel blev oprindeligt offentliggjort på Undark. Læs den originale artikel.