Nova studija s Harvarda: AI precizniji od liječnika u hitnoj

OpenAI modeli o1 i 4o nadmašili su preciznost liječnika u stvarnim slučajevima na hitnom prijemu

Nova studija s Harvarda pokazuje da umjetna inteligencija može biti preciznija u postavljanju dijagnoza od liječnika u stvarnim situacijama na hitnom prijemu. Istraživanje objavljeno u časopisu Science uspoređivalo je dijagnoze dvojice liječnika interne medicine s onima koje su generirali OpenAI modeli o1 i 4o na temelju 76 stvarnih pacijenata.

Ključni detalji

U eksperimentu provedenom na hitnom prijemu bolnice Beth Israel u Bostonu, OpenAI-jev model o1 dao je točnu ili vrlo blisku dijagnozu u 67% slučajeva tijekom prvotne trijaže. Usporedbe radi, dvojica liječnika interne medicine imali su stopu uspješnosti od 55% i 50%. Model o1 je bio jednako dobar ili bolji od liječnika i modela 4o u svakoj fazi postavljanja dijagnoze, a razlika u preciznosti bila je najizraženija upravo pri prvotnoj trijaži, kada je dostupno najmanje informacija, a potreba za brzom i točnom odlukom je najveća.

Zašto je to važno

Rezultati ovog istraživanja ukazuju na ogroman potencijal velikih jezičnih modela u zdravstvu, posebno u okruženjima pod visokim pritiskom poput hitnog prijema gdje brza i točna dijagnoza može spasiti život. Iako umjetna inteligencija još uvijek nije spremna za samostalno donošenje odluka o životu i smrti, njena sposobnost brzog i preciznog analiziranja medicinskih podataka mogla bi značajno smanjiti broj pogrešnih dijagnoza i poboljšati skrb za pacijente u budućnosti.

Tehnička pozadina

Istraživači nisu unaprijed pripremali niti obrađivali podatke; AI modelima predstavljene su iste informacije iz elektroničkih zdravstvenih zapisa koje su bile dostupne liječnicima u trenutku dijagnoze.
Studija je procjenjivala performanse modela o1 i 4o, pri čemu se model o1 pokazao znatno uspješnijim.
Modeli su testirani samo na tekstualnim informacijama, a poznato je da trenutni temeljni modeli imaju ograničenja u logičkom zaključivanju na temelju netekstualnih unosa (poput slika ili zvučnih zapisa).

Širi kontekst

Unatoč impresivnim rezultatima, stručnjaci upozoravaju na oprez i ističu da su ovi alati daleko od samostalne kliničke primjene. Trenutno ne postoji formalni okvir za odgovornost kada su u pitanju AI dijagnoze, a pacijenti i dalje žele da ih kroz teške odluke o liječenju vode ljudi. Neki liječnici, poput dr. Kristen Panthagani, također su kritizirali metodologiju studije, ističući da su AI modeli uspoređivani s liječnicima interne medicine, a ne specijalistima hitne medicine, čiji je primarni zadatak utvrditi postoji li stanje koje ugrožava život pacijenta, a ne nužno pogoditi konačnu dijagnozu.

Što slijedi

Autori studije naglašavaju hitnu potrebu za prospektivnim kliničkim ispitivanjima kako bi se ove tehnologije evaluirale u stvarnim uvjetima skrbi za pacijente. U budućnosti će naglasak biti na pronalasku načina kako sigurno i odgovorno integrirati umjetnu inteligenciju u medicinsku praksu, gdje će AI vjerojatno služiti kao napredni alat za podršku u kliničkom odlučivanju, pomažući liječnicima, a ne zamjenjujući ih.

Izvor: TechCrunch Objavljeno na portalu Umjetna Inteligencija Blog by ShtefAI, autor: Shtef

Nova studija s Harvarda: AI precizniji od liječnika u hitnoj