Sekėjai

Ieškoti šiame dienoraštyje

2024 m. balandžio 14 d., sekmadienis

Protingas vaistų dizainas

„Patys ryškiausi įrodymai, kad dirbtinis intelektas gali suteikti gilių mokslo proveržių, buvo pristatyti Google DeepMind programoje, pavadintoje AlphaFold. 2016 m. bendrovės mokslininkai sulaukė didelio pasisekimo su AlphaGo – AI sistema, kuri iš esmės išmoko Go taisykles, toliau įveikdavo aukščiausiai įvertintus žaidimo žaidėjus, kartais naudodamas taktiką, kurios niekas niekada nenumatė.

 

     Tai paskatino bendrovę sukurti sistemą, kuri parengtų daug sudėtingesnes taisykles: tas, kurios pagal aminorūgščių seką, kuri apibrėžia konkretų baltymą, sukuria formą, į kurią ta seka susilanksto, kai tas baltymas iš tikrųjų gaminamas. AlphaFold atrado tas taisykles ir pritaikė jas stebėtinai sėkmingai.

 

     Laimėjimas buvo ir nuostabus, ir naudingas.

 

     Nepaprasta, nes daug protingų žmonių dešimtmečius veltui stengėsi sukurti kompiuterinius procesų, kurių metu aminorūgščių grandinės sulankstomos į baltymus, modelius.

 

     „AlphaFold“ nugalėjo visas šias pastangas beveik taip pat kruopščiai, kaip ją įkvėpusi sistema naikina „Go“ žaidėjus.

 

     Naudinga, nes baltymo forma turi didžiulę praktinę reikšmę: ji lemia, ką baltymas veikia ir ką gali su juo padaryti kitos molekulės. Visi pagrindiniai gyvenimo procesai priklauso nuo to, ką veikia konkretūs baltymai. Daugumos pasaulio vaistų kūrimo programų tikslas yra rasti molekules, kurios daro norimus dalykus baltymams (kartais blokuoja jų veikimą, kartais skatina).

 

     Dėl baltymų trimatės struktūros svarbos jai iš esmės skirta visa subdisciplina: struktūrinė biologija. Jis naudoja įvairias technologijas, kad apžiūrėtų baltymus, taikant branduolinį magnetinį rezonansą  viename metode arba priverčiant juos kristalizuotis (tai gali būti labai sunku) ir apšviečiant juos rentgeno spinduliais kitame metode. Dabar darosi populiariausias trečias metodas - elektroninė mikroskopija, atskleidžianti tokias sudėtingas struktūras, kokios neprieinamos kitiems metodams. (K.))

 

     Iki AlphaFold daugiau nei pusę amžiaus struktūrinė biologija šiomis priemonėmis sukūrė kelis šimtus tūkstančių patikimų baltymų struktūrų. AlphaFold ir jo konkurentai (ypač Meta sukurta programa) dabar pateikė išsamias daugiau, nei 600 m formų prognozes.

 

     Mokslininkus sugniuždyti yra sunku. Tačiau jei AlphaFold produktai sužavėjo pasaulį, pagrindai, kaip jie buvo pagaminti, yra gana būdingi dalykams, kuriuos biologijai gali pasiūlyti gilus mokymasis ir generatyvus AI. Apmokytas dviejų skirtingų tipų duomenų (aminorūgščių sekos ir trimačių formų, į kurias jie sulankstomi, aprašymais), AlphaFold rado modelius, leidžiančius naudoti pirmos rūšies duomenis, kad nuspėtų antrosios. Ne visos prognozės yra tobulos. Chrisas Gibsonas, Jutoje įsikūrusios AI intensyvaus vaistų atradimo startuolio „Recursion Pharmaceuticals“ vadovas sako, kad jo įmonė AlphaFold rezultatus traktuoja, kaip hipotezes, kurias reikia išbandyti ir patvirtinti eksperimentiškai. Ne visi jie pasitvirtina. Tačiau daktaras Gibsonas taip pat sako, kad modelis greitai gerėja.

 

     Krištolo svajonės

 

     Būtent tai dabar daro daugybė AI biomedicinos ir ypač vaistų tyrimų pasaulyje: pateikia pasiūlymus apie tai, koks yra pasaulis, kurį mokslininkai sunkiai galėtų arba nesugalvotų patys.

 

     Išmokytos rasti modelius, apimančius didelius skirtingų duomenų rinkinius, AI sistemos gali atrasti ryšius tarp tų duomenų, kurie turi įtakos žmogaus biologijai ir ligoms. Pateikiant naujus duomenis, jie gali panaudoti tuos implikacijų modelius, kad sukurtų naujas hipotezes, kurias vėliau galima patikrinti.

 

     AI gebėjimas generuoti naujas idėjas suteikia vartotojams įžvalgų, kurios gali padėti nustatyti vaistų taikinius ir numatyti naujų junginių, kartais niekada anksčiau neįsivaizduojamų, kurie gali veikti, kaip vaistai, elgesį. Jis taip pat naudojamas, ieškant naujų, seniai žinomų, vaistų pritaikymo būdų, numatant naujų vaistų šalutinį poveikį ir ieškant būdų, kaip pasakyti pacientams, kuriems vaistas gali padėti, ir tiems, kuriems gali pakenkti.

 

     Tokie skaičiavimo tikslai nėra naujiena. Didelio masto kompiuterija, mašinų mokymasis ir vaistų kūrimas jau buvo sujungti 2000-aisiais, sako Vijay Pande, tuo metu dirbęs Stanfordo universiteto mokslininkas.

 

     Tai iš dalies buvo atsakas į biologijos priešgaisrinę žarną su naujais atradimais: dabar kasmet išleidžiama daugiau, nei milijonas biomedicininių tyrimų straipsnių.

 

     Vienas iš pirmųjų būdų, kaip dirbtinis intelektas padėjo tai padaryti, buvo „žinių grafikai“, leidžiantys mašinoms perskaityti visą tą informaciją ir gauti įžvalgų, tarkime, kurie kraujo baltymai gali būti naudojami, kaip biologiniai žymenys ligos buvimui ar sunkumui. 2020 m. Londone įsikūrusi „BenevolentAI“ panaudojo šį metodą, kad pamatytų baricitinibo, parduodamo Eli Lilly, kaip reumatoidinio artrito gydymo priemonės, potencialą, gydant COVID-19.

 

     Šį sausį žurnale „Science“ paskelbtame tyrime buvo aprašyta, kaip kitokio pobūdžio AI algoritmai paspartino pastangas ilgo COVID biomarkerių kraujyje paieškose. Atsižvelgiant į duomenų sudėtingumą, statistiniai metodai tokių biomarkerių atradimui gali būti sudėtingi. AI suteikia galimybę sumažinti šį triukšmą ir paspartinti naujų ligų, pvz., užsitęsusio koronaviruso, ir sunkiai diagnozuojamų ligų, pvz., ankstyvosios Alzheimerio ligos, aptikimo procesą.

 

     Laikas tinkamas

 

     Tačiau nepaisant šios praeities pažangos, daktaras Pande, dabar dirbantis Andreessen Horowitz, rizikos kapitalo įmonėje, kuri yra didelė jėga dirbtinio intelekto srityje, mano, kad naujesni pasiekimai žymi žingsnius pokyčiams. Biomedicininiai tyrimai, ypač biotechnologijų ir farmacijos srityse, nuolat didino savo priklausomybę nuo automatizavimo ir inžinerijos, kol naujieji pamatų modeliai neatsirado. dabar, kai tai atsitiko, atrodo, kad jiedu sustiprina vienas kitą.

 

     Nauji pagrindų modeliai ne tik suteikia galimybę susidoroti su dideliais duomenų kiekiais; jie jų reikalauja. Gausybė patikimų duomenų, kuriuos gali pagaminti labai automatizuotos laboratorijos, yra tik tam tikras dalykas, skirtas mokymo pagrindų modeliams. Biomedicinos tyrėjams reikia visos pagalbos, kad suprastų duomenų srautus, kuriuos jie dabar gali generuoti.

 

     Biologija gali būti laikoma „informacijos apdorojimo sistema, nors ir nepaprastai sudėtinga“.

 

     Radę modelius, kurių žmonės nemanė ieškoti, arba neturėjo vilties rasti be pagalbos, dirbtinis intelektas siūlo mokslininkams naujų būdų tyrinėti ir suprasti gyvenimo paslaptis. Kai kas kalba apie tai, kad dirbtinis intelektas įvaldo „biologijos kalbą“, mokosi suprasti, ką evoliucija padarė tiesiogiai iš duomenų, taip pat, kaip, mokydamiesi daug tikros žmonių kalbos, jie gali sklandžiai generuoti prasmingus sakinius, kurie anksčiau niekada nebuvo pasakyti.

 

     Demis Hassabis, „DeepMind“ vadovas, pabrėžia, kad pati biologija gali būti laikoma „informacijos apdorojimo sistema, nors ir nepaprastai sudėtinga ir dinamiška“. Įraše „Medium“ Serafimas Batzoglou, Silicio slėnio bendrovės „Seer Bio“, kurios specializacija yra baltymų elgsenos tyrimas, vyriausiasis duomenų pareigūnas, prognozuoja atviro pagrindo modelių, kurie integruos duomenis nuo genomo sekų iki medicinos istorijų, atsiradimą. Jis teigia, kad tai labai paspartins inovacijas ir patobulins tiksliąją mediciną.

 

     Kaip ir daugelis entuziastų, besinaudojančių dirbtiniu intelektu, Dr Pande kalba apie „pramonės revoliuciją..., kaip viską keičiančią“. Tačiau jo supratimas apie iki šiol sugaištą laiką verčia jį įspėti, kad pasiekimai, pateisinantys ilgalaikį entuziazmo pasikeitimą, neatsiras per vieną naktį: „Esame pereinamam laikotarpy, kai žmonės mato skirtumą, bet dar yra ką nuveikti“.

 

     Visi duomenys iš visur vienu metu

 

     Daug farmacijos įmonių pastaraisiais metais daug investavo į pamatų modelių kūrimą. Be to, daugėjo į dirbtinį intelektą orientuotų įmonių, tokių, kaip Recursion, Genesis Therapeutics, įsikūrusios Silicio slėnyje, Insilico, įsikūrusios Honkonge ir Niujorke, ir Relay Therapeutics Kembridže, Masačusetso valstijoje. Daphne Koller, Pietų San Franciske esančios dirbtinio intelekto intensyvios biotechnologijos Insitro bosas sako, kad vienas iš laiko ženklų yra tai, kad jai nebereikia žmonėms aiškinti didelių kalbos modelių ir savarankiškai prižiūrimo mokymosi. O Nvidia, kuri gamina grafikos apdorojimo įrenginius, būtinus pagrindiniams modeliams maitinti, parodė didelį susidomėjimą. Praėjusiais metais ji investavo arba sudarė partnerystės sandorius su mažiausiai šešiomis skirtingomis į AI orientuotomis biotechnologijų įmonėmis, įskaitant „Schrodinger“, kitą Niujorke įsikūrusią įmonę, „Genesis“, „Recursion“ ir „Genentech“, nepriklausomą „Roche“, didelės Šveicarijos farmacijos įmonės, dukterinę įmonę.

 

     Vaistų atradimo modeliai, su kuriais dirba daugelis įmonių, gali pasimokyti iš daugybės biologinių duomenų, įskaitant genų sekas, ląstelių ir audinių nuotraukas, atitinkamų baltymų struktūras, kraujo biomarkerius, specifinėse ląstelėse gaminamus baltymus ir klinikinių duomenų apie ligos eigą ir gydymo poveikį pacientams. Išmokę AI gali būti tiksliai sureguliuoti, naudojant pažymėtus duomenis, kad padidintų jų galimybes.

 

     Ypač įdomus yra pacientų duomenų naudojimas. Dėl gana akivaizdžių priežasčių eksperimentuojant dažnai neįmanoma nustatyti tikslios ligos veikimo eigos žmonėms. Taigi vaistų kūrimas paprastai labai priklauso nuo gyvūnų modelių, net jei jie gali būti klaidinantys. AI modeliai, kurie yra išmokyti ir geriau prisitaikę prie žmogaus biologijos, gali padėti išvengti kai kurių akligatvių, trukdančių kurti vaistus.

 

     Pavyzdžiui, Insitro treniruoja savo modelius, susijusius su patologijos skaidrėmis, genų sekomis, MRT duomenimis ir kraujo baltymais. Vienas iš jos modelių gali susieti pokyčius, kaip ląstelės atrodo po mikroskopu, su pagrindinėmis genomo mutacijomis ir su įvairių ligų klinikiniais rezultatais. Bendrovė tikisi panaudoti šiuos ir panašius metodus, kad surastų būdus, kaip nustatyti vėžiu sergančių pacientų pogrupius, kurie ypač gerai atitiks tam tikrus gydymo kursus.

 

     „Recursion“ teigia, kad naudojant laboratorinę robotiką kiekvieną savaitę galima atlikti 2,2 mln. eksperimentų. 

 

Kartais naudinga sužinoti, į kokį duomenų aspektą AI reaguoja. 2019 m. Paryžiuje įsikūrusi „AI biotechnologija“ Owkin paskelbė išsamią informaciją apie giluminį neuroninį tinklą, išmokytą prognozuoti pacientų, sergančių piktybine mezotelioma, plaučius supančio audinio vėžiu, išgyvenimą, remiantis ant stiklelių pritvirtintais audinių mėginiais. Nustatyta, kad AI prognozėms labiausiai tinka ne pačios vėžio ląstelės, o netoliese esančios ne vėžinės ląstelės. Owkin komanda atnešė papildomų ląstelių ir molekulinių duomenų ir atrado naują vaistų tikslą. Praėjusių metų rugpjūtį mokslininkų komanda iš Indianos universiteto Bloomington parengė duomenų apie vėžio ląstelių reakciją į vaistus (įskaitant genetinę informaciją) ir cheminių vaistų struktūrų modelį, leidžiantį numatyti, kaip veiksmingas vaistas būtų gydant konkretų vėžį.

 

     Daugeliui, dirbtinį intelektą naudojančių, įmonių reikia tiek daug aukštos kokybės duomenų, kad jos pačios juos generuoja vykdydamos vaistų kūrimo programas, o ne laukia, kol jie bus paskelbti kitur. Vienas iš šios temos variantų yra sukurtas naujame „Genentech“ skaičiavimo mokslų padalinyje, kuris naudoja „laboratorijos ciklas“ metodą, kad mokytų savo AI. Sistemos prognozės yra išbandomos dideliu mastu, atliekant eksperimentus su automatizuotomis laboratorinėmis sistemomis. Tų eksperimentų rezultatai naudojami dirbtinio intelekto perkvalifikavimui ir jo tikslumui padidinti. 

 

Panašią strategiją taikanti, bendrovė „Recursion“ teigia, kad gali naudoti automatizuotą laboratorinę robotiką, kad kiekvieną savaitę atliktų 2,2 mln. eksperimentų.

 

     Esmė yra tai pakeisti

 

     Kadangi farmacijos įmonės vis labiau trokšta duomenų, susirūpinimas pacientų duomenų privatumu tampa vis ryškesnis. Vienas iš problemos sprendimo būdų, kurį, be kita ko, naudoja Owkinas, yra „federated learning“, kai mokymo duomenys, kurių reikia vėžio ląstelių tipų atlasui sudaryti, niekada nepalieka ligoninės, kurioje saugomi reikalingi audinių mėginiai: tik kokie duomenų parametrai gali būti pasiūlyti AI mokymui, yra atimta. Patys duomenys išlieka ligoninėje.

 

     AI pasekmės apima ne tik ligos supratimą, bet ir supratimą, kaip įsikišti. Generatyvieji dirbtinio intelekto modeliai, tokie, kaip ProteinSGM iš Toronto universiteto, dabar yra galingi baltymų projektavimo įrankiai, nes jie gali ne tik vaizduoti esamus baltymus, bet ir sukurti naujus (su norimomis savybėmis), kurių šiuo metu gamtoje nėra, bet kurie yra galimi norimos funkcijos įkūnijimo būdai. Kitos sistemos leidžia chemikams sukurti mažas molekules, kurios gali būti naudingos, kaip vaistai, nes norimu būdu sąveikauja su taikiniu.

 

     Kiekviename etape AI hipotezės turi būti patikrintos, ar atitinka tikrovę. Nepaisant to, panašu, kad toks požiūris pagreitina atradimą. Neseniai konsultacinės grupės BCG atlikta „intensyvių AI“ įmonių vaistų analizė parodė, kad iš aštuonių vaistų, apie kuriuos buvo prieinama informacija, penki klinikiniai tyrimai buvo atlikti per trumpesnį laiką, nei įprastai. Kiti darbai rodo, kad AI ikiklinikiniame vaistų kūrimo etape, kuris gali užtrukti nuo ketverių iki septynerių metų, gali padėti sutaupyti nuo 25% iki 50% laiko ir išlaidų. Atsižvelgiant į viso proceso laiko ir pinigų sąnaudas, kurios vienam vaistui gali siekti kelis milijardus dolerių, patobulinimai galėtų pakeisti pramonės produktyvumą. Tačiau prireiks laiko, kol tikrai sužinosime. Vaistų tiekimas vis dar lėtas; nė vienas iš šių pažadėtų naujų vaistų dar nepateko į rinką.

 

     „Insilico Medicine“ yra viena iš įmonių, kurios tikisi, kad tai pasikeis. Savo vaistų kūrimo procese ji naudoja daugybę modelių. Vienas iš jų nustato baltymus, kurie gali turėti įtakos ligai. Kitas gali sukurti galimus naujus vaistų junginius. Taikant šį metodą, buvo nustatytas kandidatas į vaistą, kuris gali būti naudingas nuo plaučių fibrozės greičiau, nei per 18 mėnesių ir kainuoja 3 mln. dolerių – tai tik maža dalis įprastų išlaidų. Vaistas neseniai pradėjo 2 fazės klinikinius bandymus.

 

     Daugelis Kinijos farmacijos įmonių sudaro sandorius su dirbtinio intelekto įmonėmis, tokiomis, kaip „Insilico“, tikėdamosi pamatyti daugiau tokių atvejų. Kai kurie tikisi, kad tokie sandoriai gali paskatinti Kinijos gana lėtai augančią vaistų kūrimo verslą. Kinijos mokslinių tyrimų organizacijos jau jaučia AI naudą, paskatintą susidomėjimo naujomis molekulėmis iš viso pasaulio. 2021 m. investicijos į, AI padedamą, vaistų atradimą Kinijoje siekė daugiau, nei 1,26 mlrd. dolerių.

 

     Pasaulis per pastarąjį dešimtmetį matė daugybę novatoriškų naujų vaistų ir gydymo būdų: vaistų, nukreiptų į GLP-1, kurie keičia diabeto ir nutukimo gydymą; CAR-T terapija, skatinanti imuninę sistemą nuo vėžio; pirmieji klinikiniai genomo redagavimo pritaikymai. Tačiau ilgas vaistų kūrimo kelias, pradedant svarbių biologinių procesų atpažinimu ir baigiant vaistams tinkamų taikinių identifikavimu, molekulių kandidatų kūrimu iki ikiklinikinių ir klinikinių bandymų, paprastai išlieka lėtas ir varginantis darbas. Maždaug 86% visų vaistų kandidatų, kurie išsivystė tarp 2000 ir 2015 m., neatitiko savo pagrindinių vertinamųjų rodiklių klinikinių tyrimų metu. Kai kurie teigia, kad vaistų kūrimas nuskynė daugumą biologijos vaisių, todėl likusios ligos yra sunkiai išgydomos, o vaistų taikiniai yra „nepagydomi vaistais“.

 

     Ateinantys keleri metai įtikinamai parodys, ar AI sugebės iš esmės pakeisti tą vaizdą. Jei jis siūlo tik laipsniškus patobulinimus, tai vis tiek gali būti tikra palaima. Jei tai leis biologiją iššifruoti visiškai nauju būdu, kaip teigia labiausiai skatinantys žmonės, tai gali padaryti visą procesą daug sėkmingesnį ir veiksmingesnį – ir iš tikrųjų labai greitai išgydyti ligas, dabar nepagydomas vaistais. BCG analitikai mato sparčiai artėjančios naujų vaistų bangos, pagrįstos dirbtiniu intelektu, požymių. Dr Pande perspėja, kad vaistų reguliavimo institucijos turės pagerinti jų žaidimą, kad galėtų įveikti šį iššūkį. Tai būtų gera problema, iškylanti pasauliui.“ [1]

 

1.  Intelligent design. The Economist; London Vol. 450, Iss. 9390,  (Mar 30, 2024): 10, 11, 8, 9.

Intelligent design of medicines


"The most striking evidence that artificial intelligence can provide profound scientific breakthroughs came with the unveiling of a program called AlphaFold by Google DeepMind. In 2016 researchers at the company had scored a big success with AlphaGo, an AI system which, having essentially taught itself the rules of Go, went on to beat the most highly rated human players of the game, sometimes by using tactics no one had ever foreseen. 

This emboldened the company to build a system that would work out a far more complex set of rules: those through which the sequence of amino acids which defines a particular protein leads to the shape that sequence folds into when that protein is actually made. AlphaFold found those rules and applied them with astonishing success.

The achievement was both remarkable and useful. 

Remarkable because a lot of clever humans had been trying hard to create computer models of the processes which fold chains of amino acids into proteins for decades. 

AlphaFold bested their best efforts almost as thoroughly as the system that inspired it trounces human Go players. 

Useful because the shape of a protein is of immense practical importance: it determines what the protein does and what other molecules can do to it. All the basic processes of life depend on what specific proteins do. Finding molecules that do desirable things to proteins (sometimes blocking their action, sometimes encouraging it) is the aim of the vast majority of the world’s drug development programmes.

Because of the importance of proteins’ three-dimensional structure there is an entire sub-discipline largely devoted to it: structural biology. It makes use of all sorts of technology to look at proteins through nuclear-magnetic-resonance techniques in one method or by getting them to crystallise (which can be very hard) and blasting them with x-rays in another method. 

Before AlphaFold over half a century of structural biology had produced a couple of hundred thousand reliable protein structures through these means. AlphaFold and its rivals (most notably a program made by Meta) have now provided detailed predictions of the shapes of more than 600m.

As a way of leaving scientists gobsmacked it is a hard act to follow. But if AlphaFold’s products have wowed the world, the basics of how it made them are fairly typical of the sort of things deep learning and generative AI can offer biology. Trained on two different types of data (amino-acid sequences and three-dimensional descriptions of the shapes they fold into) AlphaFold found patterns that allowed it to use the first sort of data to predict the second. The predictions are not all perfect. Chris Gibson, the boss of Recursion Pharmaceuticals, an AI-intensive drug-discovery startup based in Utah, says that his company treats AlphaFold’s outputs as hypotheses to be tested and validated experimentally. Not all of them pan out. But Dr Gibson also says the model is quickly getting better.

Crystal dreams

This is what a whole range of AIs are now doing in the world of biomedicine and, specifically, drug research: making suggestions about the way the world is that scientists could or would not come up with on their own. 

Trained to find patterns that extend across large bodies of disparate data, AI systems can discover relationships within those data that have implications for human biology and disease. Presented with new data they can use those patterns of implication to produce new hypotheses which can then be tested.

The ability of AI to generate new ideas provides users with insights that can help to identify drug targets and to predict the behaviour of novel compounds, sometimes never previously imagined, that might act as drugs. It is also being used to find new applications for old drugs, to predict the side effects of new drugs, and to find ways of telling those patients whom a drug might help from those it might harm.

Such computational ambitions are not new. Large-scale computing, machine learning and drug design were already coming together in the 2000s, says Vijay Pande, who was a researcher at Stanford University at the time. 

This was in part a response to biology’s fire hose of new findings: there are now more than a million biomedical research papers published every year.

One of the early ways in which AI was seen to help with this was through “knowledge graphs”, which allowed all that information to be read by machines and mined for insights about, say, which proteins in the blood might be used as biomarkers revealing the presence or severity of a disease. In 2020 BenevolentAI, based in London, used this method to see the potential which baricitinib, sold by Eli Lilly as a treatment for rheumatoid arthritis, had for treating covid-19.

This January, research published in Science described how AI algorithms of a different sort had accelerated efforts to find biomarkers of long covid in the blood. Statistical approaches to the discovery of such biomarkers can be challenging given the complexity of the data. AIs offer a way of cutting through this noise and advancing the discovery process in diseases both new, like long covid, and hard to diagnose, like the early stages of Alzheimer’s.

The time is right

But despite this past progress, Dr Pande, now at Andreessen Horowitz, a venture-capital firm that is big on AI, thinks that more recent advances mark a step change. Biomedical research, particularly in biotech and pharma, was steadily increasing its reliance on automation and engineering before the new foundation models came into their own; now that has happened, the two seem to reinforce each other. 

The new foundation models do not just provide a way to cope with big bodies of data; they demand them. The scads of reliable data highly automated labs can produce in abundance are just the sort of thing for training foundation models. And biomedical researchers need all the help they can get to understand the torrents of data they are now capable of generating.

Biology can be thought of as “an information processing system, albeit an extraordinarily complex one”

By finding patterns humans had not thought to look for, or had no hope of finding unaided, AI offers researchers new ways to explore and understand the mysteries of life. Some talk of AIs mastering the “language of biology”, learning to make sense of what evolution has wrought directly from the data in the same way that, trained on lots of real language, they can fluently generate meaningful sentences never uttered before.

Demis Hassabis, the boss of DeepMind, points out that biology itself can be thought of as “an information processing system, albeit an extraordinarily complex and dynamic one”. In a post on Medium, Serafim Batzoglou, the chief data officer at Seer Bio, a Silicon Valley company that specialises in looking at how proteins behave, predicts the emergence of open foundation models that will integrate data spanning from genome sequences to medical histories. These, he argues, will vastly accelerate innovation and advance precision medicine.

Like many of the enthusiasts piling into AI Dr Pande talks of an “industrial revolution…changing everything”. But his understanding of the time taken so far leads him to caution that achievements that justify that long-term enthusiasm change will not come overnight: “We are in a transitory period where people can see the difference but there is still work to do.”

All the data from everywhere all at once

A lot of pharma firms have made significant investments in the development of foundation models in recent years. Alongside this has been a rise in AI-centred startups such as Recursion, Genesis Therapeutics, based in Silicon Valley, Insilico, based in Hong Kong and New York and Relay Therapeutics, in Cambridge, Massachusetts. Daphne Koller, the boss of Insitro, an AI-heavy biotech in South San Francisco, says one sign of the times is that she no longer needs to explain large language models and self-supervised learning. And Nvidia—which makes the graphics-processing units that are essential for powering foundation models—has shown a keen interest. In the past year, it has invested or made partnership deals with at least six different AI-focused biotech firms including Schrodinger, another New York based firm, Genesis, Recursion and Genentech, an independent subsidiary of Roche, a big Swiss pharmaceutical company.

The drug-discovery models many of the companies are working with can learn from a wide variety of biological data including gene sequences, pictures of cells and tissues, the structures of relevant proteins, biomarkers in the blood, the proteins being made in specific cells and clinical data on the course of disease and effect of treatments in patients. Once trained, the AIs can be fine tuned with labelled data to enhance their capabilities.

The use of patient data is particularly interesting. For fairly obvious reasons it is often not possible to discover the exact workings of a disease in humans through experiment. So drug development typically relies a lot on animal models, even though they can be misleading. AIs that are trained on, and better attuned to, human biology may help avoid some of the blind alleys that stymie drug development.

Insitro, for example, trains its models on pathology slides, gene sequences, MRI data and blood proteins. One of its models is able to connect changes in what cells look like under the microscope with underlying mutations in the genome and with clinical outcomes across various different diseases. The company hopes to use these and similar techniques to find ways to identify sub-groups of cancer patients that will do particularly well on specific courses of treatment.

Recursion says it can use laboratory robotics to conduct 2.2m experiments each week

Sometimes finding out what aspect of the data an AI is responding to is useful in and of itself. In 2019 Owkin, a Paris based “AI biotech”, published details of a deep neural network trained to predict survival in patients with malignant mesothelioma, a cancer of the tissue surrounding the lung, on the basis of tissue samples mounted on slides. It found that the cells most germane to the AI’s predictions were not the cancer cells themselves but non-cancerous cells nearby. The Owkin team brought extra cellular and molecular data into the picture and discovered a new drug target. In August last year a team of scientists from Indiana University Bloomington trained a model on data about how cancer cells respond to drugs (including genetic information) and the chemical structures of drugs, allowing it to predict how effective a drug would be in treating a specific cancer.

Many of the companies using AI need such great volumes of high quality data they are generating it themselves as part of their drug development programmes rather than waiting for it to be published elsewhere. One variation on this theme comes from a new computational sciences unit at Genentech which uses a “lab in the loop” approach to train their AI. The system’s predictions are tested at a large scale by means of experiments run with automated lab systems. The results of those experiments are then used to retrain the AI and enhance its accuracy. Recursion, which is using a similar strategy, says it can use automated laboratory robotics to conduct 2.2m experiments each week.

The point is to change it

As pharma firms become increasingly hungry for data, concerns about the privacy of patient data are becoming more prominent. One way of dealing with the problem, used by Owkin among others, is “federated learning”, in which the training data it needs to build an atlas of cancer cell types never leaves the hospital where the tissue samples required are stored: what the data can offer in terms of training is taken away. The data themselves remain.

The implications of AI go beyond understanding disease and on into figuring out how to intervene. Generative AI models, such as ProteinSGM from the University of Toronto, are now powerful tools in protein design because they are not merely able to picture existing proteins but also to design new ones—with desired characteristics—that do not currently exist in nature but which are possible ways of embodying a desired function. Other systems allow chemists to design small molecules that might be useful as drugs as they interact with a target in a desired way.

At every stage the AI hypotheses need to be checked against reality. Even so, such an approach seems to speed up discovery. A recent analysis of drugs from “AI-intensive” firms carried out by BCG, a consulting group, found that of eight drugs for which information was available, five had reached clinical trials in less than the typical time for doing so. Other work suggests AI could yield time and cost savings of 25% to 50% in the preclinical stage of drug development, which can take four to seven years. Given the cost in time and money of the whole process, which can be several billions of dollars for a single drug, improvements could transform the industry’s productivity. But it will take time to know for sure. Drug pipelines are still slow; none of these promised new drugs has yet got to market.

Insilico Medicine is one of the companies hoping for that to change. It uses a range of models in its drug development process. One identifies the proteins that might be targeted to influence a disease. Another can design potential new drug compounds. Using this approach it identified a drug candidate which might be useful against pulmonary fibrosis in less than 18 months and at a cost of $3m—a fraction of the normal cost. The drug recently started Phase 2 trials.

A lot of pharma firms in China are doing deals with AI-driven companies like Insilico in the hope of seeing more of the same. Some hope that such deals might be able to boost China’s relatively slow-growing drug-development businesses. China’s contract research organisations are already feeling the benefits of AI fuelled interest in new molecules from around the world. Investment in AI-assisted drug discovery in China was more than $1.26bn in 2021.

The world has seen a number of ground breaking new drugs and treatments in the past decade: the drugs targeting GLP-1 that are transforming the treatment of diabetes and obesity; the CAR-T therapies enlisting the immune system against cancer; the first clinical applications of genome editing. But the long haul of drug development, from discerning the biological processes that matter to identifying druggable targets to developing candidate molecules to putting them through preclinical tests and then clinical trials, remains generally slow and frustrating work. Approximately 86% of all drug candidates developed between 2000 and 2015 failed to meet their primary endpoints in clinical trials. Some argue that drug development has picked off most of biology’s low-hanging fruit, leaving diseases which are intractable and drug targets that are “undruggable”.

The next few years will demonstrate conclusively if AI is able to materially shift that picture. If it offers merely incremental improvements that could still be a real boon. If it allows biology to be deciphered in a whole new way, as the most boosterish suggest, it could make the whole process far more successful and efficient—and drug the undruggable very rapidly indeed. The analysts at BCG see signs of a fast-approaching AI-enabled wave of new drugs. Dr Pande warns that drug regulators will need to up their game to meet the challenge. It would be a good problem for the world to have." [1]

1.  Intelligent design. The Economist; London Vol. 450, Iss. 9390,  (Mar 30, 2024): 10, 11, 8, 9.

Gydytojas - dirbtinis intelektas jus priims... galų gale

  "Geresnės diagnozės. Individualizuota pagalba pacientams. Greitesnis vaistų atradimas. Didesnis efektyvumas. Dirbtinis intelektas (AI) visur sukelia jaudulį ir hiperbolę, tačiau sveikatos priežiūros sritį jis gali pakeisti. Europoje analitikai prognozuoja, kad dirbtinio intelekto diegimas, kasmet išgelbėtų šimtus tūkstančių gyvybių, ir būtų galima sutaupyti 200–360 mlrd. JAV dolerių kasmet, nuo dabartinių išlaidųsveikatai – 4,5 trn. dolerių. Nuo robotų chirurgų, iki  galimybės analizuoti didelius duomenų rinkinius arba galimybės kalbėtis su medicininiu dirbtiniu intelektu žmogaus veidu.

 

     Jau yra įrodymų, kad dirbtinio intelekto sistemos gali pagerinti diagnostikos tikslumą ir ligų sekimą, pagerinti pacientų rezultatų prognozavimą ir pasiūlyti geresnius gydymo būdus. Jis taip pat gali padidinti efektyvumą ligoninėse ir chirurgijose, imdamasis tokių užduočių, kaip medicininė transkripcija ir pacientų stebėjimas bei supaprastindamas administravimą. Tai jau gali pagreitinti laiką, per kurį nauji vaistai pasiekia klinikinius tyrimus. Nauji įrankiai, įskaitant generatyvųjį AI, galėtų papildyti šiuos gebėjimus. Tačiau, kaip rodo šios savaitės technologijų ketvirtinis leidinys, nors dirbtinis intelektas sveikatos priežiūros srityje naudojamas daugelį metų, integracija buvo lėta, o rezultatai dažnai buvo vidutiniški.

 

     Tam yra gerų ir blogų priežasčių. Geros priežastys yra tai, kad sveikatos priežiūra reikalauja didelių įrodomųjų kliūčių diegiant naujas priemones, siekiant apsaugoti pacientų saugumą. Blogos priežastys apima duomenis, reguliavimą ir paskatas. Jas įveikus, dirbtinio intelekto pamokos praverstų ir kitose srityse.

 

     AI sistemos mokosi, apdorodamos didžiulius duomenų kiekius, kurių sveikatos priežiūros paslaugų teikėjai turi daug. Tačiau sveikatos duomenys yra labai fragmentiški; griežtos taisyklės kontroliuoja jų naudojimą. Vyriausybės pripažįsta, kad pacientai nori apsaugoti jų medicininį privatumą. Tačiau pacientai taip pat nori geresnės ir labiau individualizuotos priežiūros. Kiekvienais metais apie 800 000 amerikiečių kenčia nuo prastų medicininių sprendimų priėmimo.

 

     Norint pagerinti AI įrankių tikslumą ir sumažinti šališkumą, jie turi būti mokomi naudotis dideliais duomenų rinkiniais, atspindinčiais visą pacientų įvairovę. Padėtų rasti saugių būdų, kaip leisti sveikatos duomenims laisviau judėti. Tačiau tai gali būti naudinga ir pacientams: jiems turėtų būti suteikta teisė prieiti prie savo įrašų nešiojamu skaitmeniniu formatu. Vartotojų sveikatos priežiūros įmonės jau naudojasi nešiojamų prietaisų duomenimis, tačiau su nevienoda sėkme. Nešiojami pacientų įrašai leistų žmonėms visapusiškiau naudotis savo duomenimis ir prisiimti daugiau atsakomybės už jų sveikatą.

 

     Kita problema – šių naujovių valdymas ir reguliavimas. Daugelyje šalių dirbtinio intelekto valdymui sveikatos srityje, kaip ir kitose srityse, sunku neatsilikti nuo spartaus inovacijų tempo. Reguliavimo institucijos gali lėtai patvirtinti naujus AI įrankius arba gali trūkti pajėgumų ir patirties. Vyriausybės turi aprūpinti reguliavimo institucijas, kad galėtų įvertinti naujas AI priemones. Jos taip pat turi užpildyti reguliavimo spragas, susijusias su nepageidaujamų įvykių stebėjimu ir nuolatiniu algoritminiu stebėjimu, siekiant užtikrinti, kad jie išliktų tikslūs, saugūs, veiksmingi ir skaidrūs.

 

     Tai bus sunku. Vienas iš sprendimų būtų, kad šalys dirbtų kartu, mokytųsi viena iš kitos ir sukurtų minimalius pasaulinius standartus. Ne tokia sudėtinga tarptautinė reguliavimo sistema taip pat padėtų sukurti rinką, kurioje mažos įmonės galėtų diegti naujoves. 

 

Skurdesnės šalys, kuriose sveikatos priežiūros infrastruktūra yra mažiau išvystyta, gali daug pasipelnyti įdiegusios naujas priemones, pvz., dirbtinio intelekto valdomą, nešiojamąjį ultragarsinį akušerijos prietaisą.

 

     Kadangi dirbtinio intelekto įrankio alternatyva dažnai yra visai jokio gydymo, skurdesnės šalys netgi gali aplenkti įsitvirtinusias turtingų šalių sveikatos sistemas, nors tam trukdys duomenų, ryšio ir skaičiavimo galios trūkumas.

 

     Paskutinė problema yra susijusi su institucijomis ir paskatomis. Dirbtinis intelektas žada sumažinti medicinines išlaidas, teikdamas pagalbą arba pakeisdamas darbuotojus, gerindamas našumą, sumažindamas klaidų skaičių ir išlygindamas ar sumažindamas išlaidas, kartu gerindamas priežiūrą. To labai reikia. Iki 2030 m. pasaulyje gali trūkti 10 mln. sveikatos priežiūros darbuotojų, ty maždaug 15 % šiandieninės darbo jėgos.

 

     Ir administravimas sudarė apie 30% Amerikos perteklinių sveikatos priežiūros išlaidų, palyginti su kitomis šalimis, 2022 m.

 

     Tačiau sutaupyti pinigų, naudojant naujoves yra sudėtinga. Sveikatos sistemos sukurtos taip, kad jas naudotų priežiūros gerinimui, o ne išlaidų mažinimui. Naujos technologijos gali sudaryti net pusę metinio sveikatos išlaidų augimo. Naujų sistemų sluoksniavimas padidins išlaidas ir padidins sudėtingumą. Tačiau tikėtina, kad pacientai ir medikai priešinsis procesų pertvarkymui, siekiant efektyviai panaudoti dirbtinį intelektą. Nors dirbtinis intelektas gali jų ligas nustatyti telefonu arba pateikti įprastinius rezultatus, pacientai gali reikalauti, kad juos apžiūrėtų asmeniškai.

 

     Dar blogiau, kad daugelis sveikatos sistemų, pavyzdžiui, Amerikos, sukurtos taip, kad atlygintų už darbo apimtį. Jie turi mažai priežasčių taikyti technologijas, kurios sumažina apsilankymų, testų ar procedūrų skaičių. Ir netgi viešai valdomoms sveikatos priežiūros sistemoms gali trūkti paskatų taikyti technologijas, kurios mažina išlaidas, o ne pagerina rezultatus, galbūt, todėl, kad sutaupius pinigų, kitais metais gali sumažėti biudžetas. Jei vyriausybės negalės pakeisti šių paskatų, kad dirbtinis intelektas derintų geresnį gydymą su nauju veiksmingumu, naujovės padidins išlaidas. Atitinkamai, vyriausybės ir sveikatos priežiūros institucijos turės finansuoti programas, skirtas išbandyti ir diegti naujas dirbtinio intelekto technologijas. Šalys, įskaitant Ameriką, Britaniją ir Kanadą, rodo kelią.

 

     AI, MD

 

     Didelė naštos, skatinančios dirbtinį intelektą sveikatos priežiūros srityje, tenka vyriausybėms ir reguliavimo institucijoms. Tačiau įmonės taip pat turi atlikti jų vaidmenį. Draudikai jau naudojo dirbtinio intelekto priemones, kad nesąžiningai atsisakytų globos; įmonės klaidingai pardavė arba pervertino sveikatos AI galimybes; algoritmai padarė klaidų. Įmonės privalo užtikrinti, kad jų gaminiai būtų saugūs, patikimi ir atskaitingi, o žmonės, kad ir kokie būtų jų trūkumai, išliktų kontroliuojančiais.

 

     Šios kliūtys yra didžiulės, tačiau galima AI naudojimo sveikatos priežiūros srityje nauda yra tokia didelė, kad jų įveikimo reikalas turėtų būti akivaizdus. Ir jei dirbtinis intelektas gali veikti medicinoje, jis gali būti receptas, kaip šią technologiją pritaikyti kitose srityse." [1]


1.  The AI doctor will see you…eventually. The Economist; London Vol. 450, Iss. 9390,  (Mar 30, 2024): 10.