„Įrankis siekia išspręsti nekoduojančių sekų paslaptį, tačiau tai dar tik pradinėje stadijoje.
Praėjus beveik 25 metams po to, kai mokslininkai baigė kurti žmogaus genomo sekos juodraštį, daugelis iš 3,1 milijardo raidžių tebėra mįslė. Ypač nerimą kelia tai, kad 98 % genomo nėra sudaryti iš baltymus koduojančių genų, bet gali paveikti jų aktyvumą.
Londone „Google DeepMind“ sukurtas dirbtinio intelekto (DI) modelis galėtų padėti mokslininkams suprasti šią „tamsiąją materiją“ ir pamatyti, kaip ji gali prisidėti prie tokių ligų kaip vėžys ir paveikti ląstelių vidinį veikimą. Modelis, vadinamas „AlphaGenome“, aprašytas birželio 25 d. išankstiniame leidinyje.
„Tai viena iš fundamentaliausių problemų ne tik biologijoje, bet ir visame moksle“, – spaudos konferencijoje sakė Pushmeet Kohli, bendrovės dirbtinio intelekto mokslo vadovas.
„Sekos funkcionavimo“ modelis ima ilgus DNR ruožus ir prognozuoja įvairias savybes, tokias kaip genų, kuriuos jie naudoja, raiškos lygius. ir kaip šiuos lygius gali paveikti mutacijos.
„Manau, kad tai įdomus šuolis į priekį“, – sako Anshul Kundaje, skaičiavimo genomikos specialistas iš Stanfordo universiteto Palo Alte, Kalifornijoje, kuris anksčiau turėjo prieigą prie „AlphaGenome“. „Tai tikras patobulinimas, palyginti su beveik visais dabartiniais pažangiausiais sekos ir funkcijos modeliais.“ „Viskas viename“ metodas
Kai „DeepMind“ 2020 m. pristatė „AlphaFold 2“, ji žengė didelį žingsnį spręsdama problemą, kuri dešimtmečius metė iššūkį tyrėjams: nustatyti, kaip baltymo seka prisideda prie jo 3D formos.
Išsiaiškinti, ką daro DNR sekos, yra kitaip, nes nėra vieno atsakymo, kaip ir 3D struktūroje, kurią pateikia „AlphaFold“. Viena DNR atkarpa atliks daugybę tarpusavyje susijusių vaidmenų – nuo vieno ląstelės mechanizmo pritraukimo, kad jis prisijungtų prie tam tikros chromosomos dalies ir paverstų netoliese esantį geną RNR molekule, iki baltymų transkripcijos faktorių, kurie turi įtakos genų ekspresijos vietai, laikui ir mastu, pritraukimo. Pavyzdžiui, daugelis DNR sekų daro įtaką genų aktyvumui keisdamos chromosomos 3D formą, apribodamos arba palengvindamos prieigą transkripciją atliekančiam mechanizmui.
Biologai jau dešimtmečius sprendžia šį klausimą naudodami įvairias skaičiavimo priemones. Per pastarąjį dešimtmetį ar panašiai mokslininkai sukūrė dešimtis dirbtinio intelekto modelių, skirtų genomui suprasti. Daugelis jų buvo skirti konkrečiai užduočiai, pavyzdžiui, genų ekspresijos lygių numatymui arba modulinės struktūros nustatymui. Atskirų genų segmentai, vadinami egzonais, yra iškirpami ir įklijuojami į atskirus baltymus. Tačiau mokslininkai vis labiau domisi „viskas viename“ įrankiais DNR sekoms interpretuoti.
„AlphaGenome“ yra vienas iš tokių modelių. Jis gali priimti iki milijono DNR raidžių duomenis – ruožą, kuris gali apimti geną ir daugybę reguliavimo elementų – ir pateikti tūkstančius prognozių apie daugybę biologinių savybių. Daugeliu atvejų „AlphaGenome“ prognozės yra jautrios vienos DNR raidės pokyčiams, o tai reiškia, kad mokslininkai gali numatyti mutacijų pasekmes.
Viename pavyzdyje „DeepMind“ tyrėjai pritaikė „AlphaGenome“ modelį įvairioms mutacijoms, nustatytoms ankstesniuose tyrimuose su žmonėmis, sergančiais tam tikros rūšies leukemija. Modelis tiksliai numatė, kad nekoduojančios mutacijos netiesiogiai aktyvavo netoliese esantį geną, kuris yra dažnas šio vėžio variklis.
Vis dar ribota
„AlphaGenome“ buvo apmokytas naudojant genominius ir kitus eksperimentinius duomenis tik iš žmonių ir pelių. Jis gali veikti taip pat gerai su susijusiais organizmais, tačiau tyrėjai to netikrino, instruktaže sakė „DeepMind“ mokslininkė Žiga Avsec. Modelis taip pat nebuvo sukurtas patikimai interpretuoti individo genomą ar pateikti išsamią informaciją. vaizdas, kaip variantai veikia sudėtingas ligas.
„AlphaGenome“ prognozių tikslumą galima tobulinti. Pavyzdžiui, modeliui sunku nustatyti sekas, kurios keičia geno, esančio daugiau nei 100 000 bazių porų atstumu, raišką. „Šis modelis dar „neišsprendė“ genų reguliavimo tokiu pat mastu, kaip „AlphaFold“, pavyzdžiui, baltymų 3D struktūros prognozavimo“, – priduria Kundaje.
Vienas dalykas, kurio „AlphaGenome“ ir panašūs modeliai dar neužfiksuoja, yra tai, kaip besikeičianti ląstelės prigimtis gali paveikti DNR sekų veikimą, sako Peteris Koo, skaičiavimo biologas iš Cold Spring Harbor laboratorijos Niujorke. Šie modeliai yra apmokyti daryti prognozes vienoje fiksuotoje aplinkoje, tačiau ląstelės yra dinamiškos. Baltymų lygis, cheminės žymės DNR ir kitos sąlygos gali keistis laikui bėgant arba tarp ląstelių tipų – ir tai gali pakeisti tos pačios sekos elgesį.
Koo prognozuoja, kad tyrėjai remsis „AlphaGenome“, naudodami modelį „reguliacinėms“ DNR sekoms, kurios leidžia kontroliuoti, kada ir kur genas yra aktyvus, pavyzdžiui, arba vykdyti virtualius eksperimentus, imituojančius, kaip ląstelės reaguoja į genetinius pakeitimai.
Kol kas nekomercinį darbą atliekantys tyrėjai prie modelio gali prisijungti per „DeepMind“ serverių programavimo sąsają. Ateityje planuojama išleisti išsamesnę versiją, kuri leistų naudoti sudėtingesnes programas.“ [1]
1. Nature 643, 17-18 (2025) By Ewen Callaway
Komentarų nėra:
Rašyti komentarą