Sekėjai

Ieškoti šiame dienoraštyje

2024 m. gegužės 6 d., pirmadienis

„Google“ dirbtinis intelektas veikia geriau, nei gydytojai žmonės ir leidžia geriau diagnozuoti

„Mokslininkai teigia, kad jų dirbtinio intelekto sistema galėtų padėti demokratizuoti mediciną

 

Dirbtinio intelekto (AI) sistema, išmokyta atlikti medicininius pokalbius, atitiko ar net pranoko žmonių gydytojų gebėjimus kalbėtis su modeliuojamais pacientais ir išvardyti galimas diagnozes pagal pacientų ligos istoriją1.

 

Pokalbių robotas, pagrįstas „Google“ sukurtu didelės kalbos modeliu (LLM), diagnozuodamas kvėpavimo ir širdies ir kraujagyslių ligas, be kita ko, buvo tikslesnis, nei sertifikuoti pirminės sveikatos priežiūros gydytojai. Palyginti su žmonių gydytojais, per medicininius pokalbius pavyko gauti panašų informacijos kiekį ir užėmė aukštesnę vietą pagal empatiją.

 

„Mūsų žiniomis, tai pirmas kartas, kai pokalbio AI sistema buvo sukurta optimaliai diagnostiniam dialogui ir klinikinei istorijai kaupti“, – sako Alanas Karthikesalingamas, klinikinių tyrimų mokslininkas iš „Google Health“ Londone ir bendraautorius tyrime, kuris sausio 11 d. buvo paskelbtas arXiv išankstinio spausdinimo saugykloje. Ji dar nebuvo recenzuotas.

 

Pavadintas „Articulate Medical Intelligence Explorer“ (AMIE), pokalbių robotas vis dar yra tik eksperimentinis. Jis nebuvo išbandytas su žmonėmis, turinčiais realių sveikatos problemų – tik su aktoriais, apmokytais vaizduoti žmones, turinčius sveikatos problemų. „Norime, kad rezultatai būtų interpretuojami atsargiai ir nuolankiai“, – sako Karthikesalingamas.

 

Nors pokalbių robotas toli gražu nenaudojamas klinikinėje priežiūroje, autoriai teigia, kad galiausiai jis galėtų prisidėti prie sveikatos priežiūros demokratizavimo. Priemonė gali būti naudinga, tačiau ji neturėtų pakeisti bendravimo su gydytojais, sako Adamas Rodmanas, vidaus ligų gydytojas iš Harvardo medicinos mokyklos Bostone, Masačusetso valstijoje. „Medicina yra kur kas daugiau, nei informacijos rinkimas – viskas joje yra apie žmonių santykius“, – sako jis.

 

Mokymasis subtilios užduoties

 

Kelios pastangos panaudoti LLM medicinoje ištyrė, ar sistemos gali imituoti gydytojo gebėjimą surinkti asmens ligos istoriją ir panaudoti ją diagnozei nustatyti. Medicinos studentai praleidžia daug laiko treniruodamiesi, kad tai padarytų, sako Rodmanas. „Tai vienas iš svarbiausių ir sunkiausių įgūdžių, kuriuos reikia ugdyti gydytojams."

 

Vienas iš iššūkių, su kuriais susiduria kūrėjai, buvo realaus pasaulio medicininių pokalbių, kuriuos būtų galima naudoti, kaip mokymo duomenis, trūkumas, sako Vivekas Natarajanas, dirbtinio intelekto tyrinėtojas iš Google Health Mountain View mieste, Kalifornijoje, ir tyrimo bendraautorius. Norėdami išspręsti šį iššūkį, tyrėjai sukūrė būdą, kaip pokalbių robotas galėtų treniruotis savo „pokalbiuose“.

 

Tyrėjai atliko pradinį pagrindinio LLM koregavimo etapą su esamais realaus pasaulio duomenų rinkiniais, tokiais. kaip elektroniniai sveikatos įrašai ir perrašyti medicininiai pokalbiai. Norėdami toliau mokyti modelį, mokslininkai paskatino LLM atlikti tam tikros būklės asmens ir empatiško gydytojo vaidmenis, siekiant suprasti asmens istoriją ir nustatyti galimas diagnozes.

 

Komanda taip pat paprašė modelio atlikti dar vieną vaidmenį: kritiko, kuris įvertina gydytojo sąveiką su gydomu asmeniu ir pateikia grįžtamąjį ryšį, kaip tą sąveiką pagerinti. Ši kritika naudojama toliau mokyti LLM ir kurti geresnius dialogus.

 

Norėdami išbandyti sistemą, mokslininkai įdarbino 20 žmonių, kurie buvo išmokyti apsimesti pacientais, ir privertė juos konsultuotis internetu – tiek su AMIE, tiek su 20 sertifikuotų gydytojų. Jiems nebuvo pasakyta, ar jie kalbasi su žmogumi, ar su botu.

 

Aktoriai imitavo 149 klinikinius scenarijus ir buvo paprašyti įvertinti jų patirtį. Specialistų grupė taip pat įvertino AMIE ir gydytojų veiklą.

 

AMIE išlaiko testą

 

AI sistema atitiko arba pranoko gydytojų diagnostinį tikslumą visose šešiose nagrinėjamose medicinos specialybėse. Botas pranoko gydytojus 24 iš 26 pokalbio kokybės kriterijų, įskaitant mandagumą, būklės ir gydymo paaiškinimą, sąžiningumą ir rūpestingumo bei įsipareigojimo išreiškimą.

 

„Tai jokiu būdu nereiškia, kad kalbos modelis yra geresnis už gydytojų klinikinę istoriją“, – sako Karthikesalingamas. Jis pažymi, kad tyrime dalyvavę pirminės sveikatos priežiūros gydytojai, tikriausiai, nebuvo įpratę bendrauti su pacientais per tekstinį pokalbį, ir tai galėjo turėti įtakos jų veiklai.

 

Priešingai, LLM turi nesąžiningą pranašumą, nes gali greitai sudaryti ilgus ir gražiai susistemintus atsakymus, teigia Karthikesalingam, leidžiantį būti nuosekliai dėmesingam ir nepavargstant.

 

Ieškomas: nešališkas pokalbių robotas

 

Pasak jo, svarbus tolesnis tyrimo žingsnis yra atlikti išsamesnius tyrimus, siekiant įvertinti galimą šališkumą ir užtikrinti, kad sistema būtų teisinga įvairiose populiacijose. „Google“ komanda taip pat pradeda nagrinėti etikos reikalavimus, keliamus sistemos testavimui su žmonėmis, turinčiais realių medicininių problemų.

 

Danielis Tingas, Singapūro Duke-NUS medicinos mokyklos AI mokslininkas, sutinka, kad sistemos tyrimas šališkumo klausimu yra būtinas, norint užtikrinti, kad algoritmas nenubaustų rasinių grupių, kurios nėra tinkamai pateiktos mokymo duomenų rinkiniuose.

 

„Chatbot“ naudotojų privatumas taip pat yra svarbus aspektas, į kurį reikia atsižvelgti, sako Tingas. „Daugelyje šių komercinių didelių kalbų modelių platformų šiuo metu vis dar nesame tikri, kur saugomi duomenys ir kaip jie analizuojami“, – sako jis." [1]



1. Nature 625, 643-644 (2024). By Mariana Lenharo

Komentarų nėra: