https://frosthead.com

Kan en algoritme diagnosticere lungebetændelse?

Lungebetændelse lægger en million voksne amerikanere på hospitalet hvert år og dræber 50.000. Hvis en læge har mistanke om, at en patient har lungebetændelse, bestiller han eller hun generelt et røntgenbillede af brystet. Disse røntgenbilleder skal naturligvis fortolkes af en læge. Men nu har Stanford-forskere udviklet en algoritme, som de siger, at de kan diagnosticere lungebetændelse på røntgenbilleder bedre end erfarne radiologer.

"Fordelen ved en algoritme er, at den kan lære af hundreder af tusinder af røntgenstråler i brystet og deres tilsvarende diagnoser fra andre eksperter, " siger Pranav Rajpurkar, en kandidatstuderende i Stanford Machine Learning Group, som medledede forskningen. ”Hvornår får radiologer nogensinde en chance for at lære af hundreder af tusinder af andre radiologers diagnoser og finde mønstre på de billeder, der fører til disse diagnoser?”

Algoritmen, kaldet CheXNet, kan også diagnosticere 13 andre medicinske tilstande, herunder emfysem og pneumothorax (luft fanget mellem lunge og brystvæg). Holdet opbyggede algoritmen ved hjælp af et offentligt datasæt fra National Institutes of Health (NIH), som indeholdt mere end 100.000 røntgenbilleder af brystet mærket med 14 mulige betingelser. Datasættet blev frigivet sammen med en initial diagnosealgoritme, som NIH opfordrede andre forskere til at gå videre.

Rajpurkar og hans medarbejdere i Machine Learning Group besluttede at tage udfordringen op. Forskerne fik fire Stanford-radiologer til at markere mulige indikationer på lungebetændelse på 420 af billederne. Ved hjælp af disse data oprettede de inden for en uge en algoritme, der nøjagtigt kunne diagnosticere 10 tilstande. Inden for en måned kunne algoritmen overgå tidligere algoritmer ved diagnosticering af alle 14 tilstande. På dette tidspunkt var CheXNet-diagnoser oftere enige med en flertalsopfattelse af radiologer end en individuel mening fra nogen radiolog.

Forskningen blev offentliggjort denne måned på det videnskabelige fortrykswebsted arXiv .

Andre diagnostiske algoritmer har lavet nyheden for nylig. Canadiske og italienske teams har begge udviklet algoritmer til diagnosticering af Alzheimers sygdom fra hjernescanninger. Fordelingen af ​​plaques i hjernen, der karakteriserer sygdommen, er for subtil til det blotte øje, men forskerne siger, at AI-teknologi kan registrere unormale mønstre. Rajpurkar og hans medforskere ved Stanford's Machine Learning Group har også udviklet en algoritme til diagnosticering af hjerterytmier ved at analysere timers data fra bærbare hjertemonitorer. Andre lungebetændelsesalgoritmer er udviklet ud fra NIH-data, men Stanford-en er indtil videre den mest nøjagtige.

CheXNet kunne være særlig nyttigt på steder, hvor folk ikke har let adgang til erfarne radiologer, siger teamet. Det kan også være nyttigt som en slags triage, idet det identificeres, hvilke sager der sandsynligvis har brug for nødsituation, og hvilke ikke. Teamet udviklede også et værktøj, der producerer et kort over potentielle lungebetændelsesindikatorer på røntgenstråler, hvilket giver en praktisk visuel guide til læger.

Mens teamet er optimistisk med hensyn til CheXNets diagnostiske evner, er de forsigtige med dets grænser.

”AI er et magtfuldt værktøj, men det tager mange års erfaring og mange hårde timer at intuitere, hvordan man udøver det, og det er lige så svært at bestemme, hvor vi kan bruge det til mest positiv påvirkning, ” siger Rajpurkar.

Selvom der er en række dybe indlæringsalgoritmer under udvikling, har ingen endnu gennemgået den strenge test- og godkendelsesproces, der er nødvendig til brug på rigtige patienter.

Paul Chang, radiologiprofessor og næstformand for afdelingen for radiologi ved University of Chicago, lyder en skeptisk note om CheXNet og lignende dybe læringsprogrammer. Læger bruger allerede algoritmer til at hjælpe med diagnosticering af et vilkårligt antal tilstande, siger Chang. Disse algoritmer er afhængige af en forformet model af, hvordan tilstanden ser ud: kræftformer er større og spikier end for eksempel godartede masser. Derimod er dybe indlæringsprogrammer beregnet til at finde ud af, hvilke egenskaber der er vigtige for sig selv ved at knuse enorme mængder data. Men dette betyder også, at de kan tage de forkerte signaler. Chang giver eksemplet på en dyb indlæringsalgoritme, der lærte forskellen mellem forskellige typer røntgenstråler: hænder, fødder, mammogrammer. Men forskere opdagede, at programmet simpelthen havde lært at genkende mammogrammer ved det faktum, at hovedbilledet var på siden af ​​filmen snarere end i midten (da bryster er knyttet til brystvæggen, vises de på kanten af ​​filmen i en mammogrambillede. Hænder eller fødder derimod vises i midten af ​​røntgenstrålingen). Algoritmen lærte ikke noget væsentligt om bryster, bare om deres placering på skærmen.

”Dette er meget tidlige tider, ” siger Chang, der påpeger, at CheXNet-resultaterne ikke er blevet peer review. ”Dyb indlæring har et stort potentiale, men vi inden for medicin og radiologi har en tendens til at være tidligt i hype-cyklus, men det tager os længere tid at vedtage. Vi lærer, hvordan vi bruger det korrekt. ”

Kan en algoritme diagnosticere lungebetændelse?