„Nauji dirbtinio intelekto modeliai leidžia vartotojams kurti, manipuliuoti ir mokytis apie biologiją, naudojant įprastą kalbą.
„Neseniai panaudojau DI, kad sukurčiau siaubingą baltymą. Vadovaudamasis nuosekliomis instrukcijomis, sukūriau elementarų baltymų kalbos modelį (PLM) – dirbtinio intelekto (DI) įrankį, kuris vietoj žodžių išraižo baltymų sekas. Su keliomis nukopijuoto ir įklijuoto kodo eilutėmis paprašiau modelio sugalvoti trumpą aminorūgščių seką.
Kas toliau laukia „AlphaFold“ ir DI baltymų lankstymo revoliucijos
Nežinojau, koks blogas mano baltymas, kol nepaklausiau „AlphaFold“, „Google DeepMind“ baltymų struktūros prognozuotojo, kaip jis atrodo. Numatoma struktūra turėjo spirales, kilpas ir kitus realius elementus. Tačiau „AlphaFold“ labai mažai pasitikėjo savo prognoze – tai ženklas, kad mano molekulė tikriausiai negalėtų būti pagaminta ląstelėse laboratorijoje, jau nekalbant apie ką nors naudingo.
Dabar tokie skaičiuojamosios biologijos mėgėjai kaip aš turi naują viltį. Mokslininkai kuria naujos kartos biologinius dirbtinio intelekto įrankius, kurie gauna instrukcijas paprasta kalba ir paverčia jas baltymais ir kitomis molekulėmis, įskaitant potencialius vaistus. Šie modeliai taip pat leidžia tyrėjams „kalbėtis“ su ląstelėmis įprasta anglų kalba, kad iššifruotų jų vidinį veikimą ir gautų kitų biologinių įžvalgų.
Tai naujausias bio-DI revoliucijos įvykių posūkis, kuris transformuoja tokias sritis kaip baltymų dizainas ir struktūrinė biologija. PLM ir kiti DI įrankiai leidžia mokslininkams gana lengvai kurti tokias molekules kaip fermentai ir antikūnai. Tačiau norint kuo geriau išnaudoti šias priemones, paprastai reikia nemažai patirties.
ChatGPT mokslui: kaip kalbėtis su savo duomenimis
Modeliai, leidžiantys vartotojams tyrinėti biologiją naudojant paprastą tekstą, galėtų sumažinti kliūtį prisijungti prie bio-DI revoliucijos, teigia mokslininkai. Šie DI taip pat turi potencialą suteikti didesnę kontrolę gaunamiems projektams ir kitiems rezultatams.
„Būtų naudinga turėti galimybę tiksliai nurodyti, ko norime, ir sukurti baltymą su šiomis savybėmis“, – sako Mohammedas AlQuraishi, skaičiuojamosios biologijos specialistas Kolumbijos universitete Niujorke. Teksto pavertimas baltymu
Praėjusį mėnesį komanda, vadovaujama mašininio mokymosi mokslininko iš Westlake universiteto Hangdžou mieste, Kinijoje, Fajie Yuano, parodė, kad jo komandos sukurtas teksto pavertimo baltymu modelis gali sukurti funkcinius baltymus, įskaitant laboratoriškai išbandytus fermentus ir fluorescencinius baltymus, kurie yra originalūs savo dizainu ir nepanašūs į esamas molekules. „Esame pirmieji, sukūrę funkcinį fermentą naudodami tik tekstą“, – sako Yuanas. „Tai lyg mokslinė fantastika.“
Baltymo molekulinis modelis, sukurtas paprasto teksto biologinio DI įrankiu.
„Siaubingas baltymas“: reporteris Ewenas Callaway sukūrė baltymų kalbos modelį (PLM) ir panaudojo pagrindines kodo instrukcijas šiam baltymui sukurti. Šaltinis: „Google DeepMind“/EMBL-EBI (CC-BY-4.0)
Modelis, vadinamas „Pinal“, yra vienas iš kelių baltymų projektavimo DI, kuriuos galima valdyti įprasta kalba – priešingai nei baltymų seka ar struktūros valdomos specifikacijos, būdingos daugumai tokių DI.
„Tačiau šių bio-DI modelių kūrimas dar tik žengia žingsnį į priekį“, – sako Anthony Gitteris, skaičiavimo biologas iš Viskonsino-Madisono universiteto. „Manau, kad tai yra didelės rizikos, bet didelės naudos sritis“, – sako jis.
Kaip kalbėti molekule
Biologinio DI modelių mokymas bendrauti anglų kalba (ar bet kuria kita kalba) paprastai apima jų supažindinimą su biologinių duomenų tekstiniais aprašymais. Yuano komanda apmokė Pinalą naudodama 1,7 milijardo skirtingų baltymų struktūrų, funkcijų ir kitų savybių aprašymų. Po papildomų mokymų modelis galėjo, reaguodamas į užduotį, sukurti šimtus sekų dizainų1. Modelis turi žiniatinklio sąsają, o jo kodas ir parametrai, reikalingi modeliui paleisti, yra laisvai prieinami.
DI baltymų prognozavimo įrankis „AlphaFold3“ dabar yra atviresnis
Viena iš tyrėjų naudotų užduočių buvo „Prašome sukurti baltymą, kuris yra alkoholio dehidrogenazė“, reiškiantis alkoholį metabolizuojantį fermentą. Tada Yuanas ir jo kolegos naudojo kitas skaičiavimo priemones, kad nustatytų perspektyviausius dizainus, ir, bendradarbiaudami su biologu bendradarbiu, išbandė jų fermentinį aktyvumą.
Du iš aštuonių alkoholio dehidrogenazės modelių sėkmingai katalizavo alkoholio skaidymą, nors ir daug mažiau efektyviai nei natūralūs fermentai. Yuanas teigia, kad jo komanda taip pat sukūrė veikiančius žaliai fluorescencinius baltymus (GFP) ir plastiką skaidančius fermentus, kurių visų seka skiriasi nuo natūralių pavyzdžių.
Kelios kitos komandos sukūrė panašius dirbtinio intelekto modelius, įskaitant vieną, vadinamą ESM-3, kurį galima iškviesti naudojant raktinius žodžius, taip pat naudojant baltymų sekas ir struktūras. Startuolis, vadinamas 310.ai, sukūrė patentuotą įrankį, vadinamą MP4, kuris sukūrė daugybę baltymų iš teksto įvesčių2, įskaitant kelis, kurie laboratorijoje gali jungtis prie ląstelių energijos šaltinio ATP. Bendrovė naudoja šį modelį kurdama baltymus, kurie veikia kaip GLP-1 vaistai – populiarūs nutukimo gydymo būdai, teigia jos „Discovery“ lyderis Timothy Riley.
Vienas iš tokių modelių kaip „310.ai“ iššūkių yra sugalvoti tinkamas teksto instrukcijas, kurių DI turėtų laikytis, sako bendrovės įkūrėja Kathy Wei, nors dideli kalbos modeliai (LLM) gali padėti sukurti sėkmingas užduotis. Ji tai lygina su vaizdus generuojančių DI, tokių kaip „Dall-E“, ankstyvosiomis dienomis: kai kurios užduotys buvo produktyvesnės nei kitos, o modelių sunkumai pavaizduoti, pavyzdžiui, žmogaus rankas dažnai išduodavo. Vietoj keistai atrodančių rankų MP4 kartais gali išspjauti baltymus su pasikartojančiomis sekomis, sako Wei.
Vaistų dizainas
Baltymų dizainas nėra vienintelė sritis, kurioje mokslininkai naudoja DI su žodžiais. Daugybė modelių siekia taikyti panašų požiūrį kuriant chemines medžiagas.
Svarbus „AlphaFold“ atnaujinimas suteikia postūmį vaistų atradimui
Pavyzdžiui, praėjusiais metais Gitterio komanda išleido modelį, kuris projektuoja mažas molekules reaguodama į teksto užduotis, ir parodė, kad gali sukurti vaistus primenančius žinomų baltymų taikinių inhibitorius3. Nors šie dizainai nebuvo išbandyti laboratorijoje, vaistų kūrimo srityje plačiai naudojami skaičiavimo „sujungimo“ įrankiai rodo, kad kai kurie iš jų yra perspektyvūs.
Mokslininkai taip pat naudoja biologinius dirbtinius intelektus, kad „kalbėtųsi“ su ląstelėmis. Pastangos sekvenuoti visas RNR molekules atskirose ląstelėse tapo pagrindine ląstelių biologijos technika, atskleidžiančia nepakankamai įvertintą įvairovę. Tačiau norint suprasti šiuos daug duomenų reikalaujančius eksperimentus, paprastai reikia intensyvaus biologų ir duomenų mokslininkų bendradarbiavimo, sako Christophas Bockas, skaičiavimo biologas iš Vienos medicinos universiteto.
Kaip trumpesnį sprendimą, jo laboratorija sukūrė dirbtinio intelekto pokalbių robotą, vadinamą „CellWhisperer4“. Jis gali gauti paprastas anglų kalbos instrukcijas – pavyzdžiui, „išsamiai aprašyti šias ląsteles“ – ir pateikti santrauką paprastu tekstu arba leisti vartotojams peržiūrėti įvairių ląstelių populiacijos vizualinį vaizdą „lasouojant“ dominančias ląsteles. „Jis tampa nusikaltimo partneriu jūsų duomenų analizėje“, – sako Bockas.
Kas toliau laukia „AlphaFold“ ir dirbtinio intelekto baltymų lankstymo revoliucijos?
Ląstelių sakiniai
Kitas bandymas paverčia vienos ląstelės sekoskaitos duomenų rinkinius ilgais ląstelių ekspresuojamų genų sąrašais ir įkelia šiuos „ląstelių sakinius“ į esamą LLM. Gautas modelis, vadinamas Cell2Sentence, gali paimti vienos ląstelės duomenų rinkinį ir aprašyti charakteristikas5, pvz., imuninės ląstelės tipą, paprasta anglų kalba.
Kadangi modelis buvo apmokytas naudojant biologinę literatūrą ir duomenis, jis gali sujungti taškus ir atlikti tokius veiksmus kaip numatyti, kaip vėžio imunoterapijos vaistas pakeis ląstelės ekspresuojamus genus. „Mūsų modelis gali versti iš biologinės kalbos į žmonių kalbą“, – sako Davidas van Dijkas, skaičiavimo biologas iš Jeilio universiteto Niu Heivene, Konektikuto valstijoje, kuris vadovavo darbui kartu su „Google Research“ ir kitų įstaigų mokslininkais.
Baltymo molekulinis modelis, sukurtas paprasto teksto biologinio dirbtinio intelekto įrankio.
Antras Eweno bandymas sukurti baltymą, šį kartą naudojant paprasto teksto instrukcijas, duotas biologiniam DI modeliui. Nuotrauka: „Google DeepMind“/EMBL-EBI (CC-BY-4.0)
Gitteris periodiškai vertina standartinių teisės vadybos sistemų (LLM) gebėjimą kurti baltymus, tačiau rezultatai kol kas jo nesužavėjo. Jis paprašė „Amazon“ apsipirkimo asistento, teisės vadybos sistemos (LLM), Rufuso, sukurti GFP, tačiau rezultate trūko pagrindinės natūralių GFP struktūrinės savybės.
Dabartinis kalbančių biologinių DI srautas yra „šiek tiek gudrus“, – sako AlQuraishi. Tačiau idėja papildyti LLM moksliniais duomenimis, tokiais kaip baltymų sekos ir cheminės struktūros, yra daug žadanti, priduria jis. „Nenustebčiau, jei kai kurios didelės technologijų įmonės jau dirba ties tuo“, – sako jis.
Triukas ar ne, jie pakeitė mano paties projektą. Po nesėkmingo bandymo nuėjau į „Pinal“ žiniatinklio sąsają ir įvedžiau „Pagaminkite man gerą baltymą“. Kai įdiegiau seką į „AlphaFold“, ji pateikė labai patikimą prognozę. Modelis priminė spagečių ir fusilių mišinį, todėl nesitikėčiau, kad jis sukels reakciją, ės plastiką ar ką nors panašaus. Bet tai pradžia.“ [1]
1. Nature 641, 1079-1080 (2025) 20 May By Ewen Callaway
Komentarų nėra:
Rašyti komentarą