Sekėjai

Ieškoti šiame dienoraštyje

2024 m. balandžio 3 d., trečiadienis

Kaip dirba organinės sintezės laboratorijos? Dideli kalbiniai modeliai nukreipia automatizuotą chemijos laboratoriją dirbti taip pat

   „Automatizuojant chemijos tyrimus daugiausia dėmesio buvo skiriama robotų kūrimui, kad jie galėtų atlikti darbus.

 

    

 

     Dirbtinio intelekto technologija dabar buvo naudojama ne tik robotams valdyti, bet ir planuoti jų užduotis pagal paprastus žmogaus raginimus.

 

    

 

     Chemijos tyrimai yra pagrįsti pasikartojančiais ciklais, kurių metu eksperimentai kuriami, vykdomi ir patobulinami, kad būtų pasiektas konkretus tikslas. Tyrėjų patirtis ir intuicija turi lemiamą vaidmenį kuriant pradinį projektą ir vėlesniame optimizavimo procese – tai, ko anksčiau nebuvo galima pakartoti autonominėse sistemose, atliekančiose chemijos tyrimus. Rašydami žurnale Nature, Boiko ir kt.1 praneša apie dirbtinio intelekto (AI) agentą, pavadintą Coscientist, kuris gali planuoti ir organizuoti daugybę chemijos tyrimų ciklo užduočių be detalaus žmogaus indėlio, todėl savarankiškai dirbančių laboratorijų vizija priartėja prie realybės.

 

    

 

     Chemikų darbas yra daugialypis – reikia ne tik techninių įgūdžių atlikti chemines reakcijas, bet ir žinių joms planuoti. Pavyzdžiui, organinės sintezės projektavimas gali apimti retrosintetinės analizės atlikimą (dirbant atgal nuo tikslinės molekulės, siekiant nustatyti paprastesnes pirmtakų molekules), ieškoti tinkamų reakcijos sąlygų duomenų bazėse ir pasirinkti reakcijas, kurios greičiausiai pasieks iš anksto nustatytą tyrimo tikslą, pavyzdžiui, maksimaliai padidinti produkto išeigą. Tačiau cheminių reakcijų metu dažnai nepavyksta gauti priimtino produkto, o kartotinis literatūros paieškos, tolesnio eksperimento (arba eksperimentų) nustatymo ir jų vykdymo procesas gali greitai tapti rutina.

 

    

 

     Todėl chemikai jau seniai siekė sukurti automatizuotas sistemas, kurios palengvintų jų darbą2. Vienas iš pirmųjų sėkmių buvo pipetavimo robotų, kuriuos galima užprogramuoti, kad nustatytų naujas reakcijas arba į indus įpiltų reagentų nurodytu laiku, sukūrimas. Kai kurie robotai dabar yra gana įperkami ir yra pritaikyti daugelyje laboratorijų, todėl mokslininkai gali sutelkti dėmesį į sudėtingesnes užduotis.

 


     Lygiagrečiai dirbtinis intelektas padarė pažangą chemijos srityje, vadovaudamasis sprendimų priėmimu, planuojant užduotis, kurias vos prieš kelerius metus vargu ar buvo galima automatizuoti (pavyzdžiui, žr. 3 nuorodą). Nepaisant to, tie AI įrankiai paprastai yra mokomi atlikti vieną operaciją – bendras įvairių cheminių tyrimų aspektų supratimas yra už jų galimybių ribų. Šie apribojimai sužlugdė svajonę sukurti darbo aplinką, kurioje žmonės prižiūrėtų robotus, gebančius savarankiškai planuoti ir vykdyti eksperimentus.

 

    

 

     Tačiau atsiradę generatyvūs iš anksto apmokyti transformatoriai (GPT), kurie yra pagrindiniai veikėjai pokalbių robotuose, kaip „ChatGPT“, staiga suteikė chemikams svarbią automatizavimo galvosūkio dalį.

 

    

 

     „Suprasdami“ natūralią žmogaus kalbą, GPT leidžia mašinoms bendrauti su žmonėmis ir taip pateikti konkrečių klausimų sprendimus.

 

    

 

     Šie dideli kalbų modeliai yra naudingi įvairioms temoms, tačiau jų chemijos įgūdžiai yra menki, todėl norint, kad jie būtų veiksmingi chemijos programoms, reikia įdiegti papildomų gudrybių – patikslinti modelius.

 

    

 

     Turint tai omenyje, Boiko ir kt. dabar ištyrė, ar įmanoma sujungti tiksliai suderintus GPT, kad būtų galima organizuoti savarankiškas laboratorijas, naudojant vieną žmogaus raginimą, pvz., „Ar galite susintetinti molekulę A? Tam reikia ne tik suprasti klausimą, bet ir nustatyti užduotis, kurias reikia atlikti, norint sėkmingai atlikti užduotį.

 

    

 

     Trumpai tariant, AI Coscientist susideda iš modulių, kurie: padeda ieškoti literatūros, siekiant išsiaiškinti sintetinius kelius ir nuspręsti dėl eksperimentinių protokolų; parašyti kodą, kad būtų galima palaikyti ryšį tarp modulių; ir ieškoti aparatinės įrangos dokumentacijos, kad robotai galėtų būti suaktyvinti ir atlikti eksperimentus nuotoliniu būdu. Boiko ir kt. palygino „Coscientist“ žiniatinklio paieškos galimybes, prašant nustatyti sintetines procedūras septynioms molekulėms, kurios yra skirtingo sudėtingumo lygio. Šie pavyzdžiai apėmė populiarius vaistus, tokius kaip paracetamolis, aspirinas ir ibuprofenas, bet ir kitas chemines medžiagas. „Coscientist“ veikė geriau, nei kiti GPT, nes patikimai sukūrė išsamias ir chemiškai tikslias sintetines procedūras.

 

    

 

     Dar įdomiau, kad Coscientist sugebėjo sukurti protokolus ir koordinuoti dviejų tipų reakcijų, žinomų kaip Sonogashira ir Suzuki-Miyaura kryžminė jungtis, vykdymą, kurie abu dažnai naudojami, ieškant vaistų, kad sudarytų anglies ir anglies ryšius. Nustačius reakcijos partnerius, reikalingus dviejų tipų kryžminiam sujungimui, Coscientist teisingai apskaičiavo kiekius, kurių prireikė ir užprogramavo pipetavimo robotą, turintį prieigą prie pradinių cheminių medžiagų tirpalų joms maišyti. Reakcijos sėkmingai davė numatytus produktus. Negana to, Coscientist pasirinko, kokius reagentus naudoti, remdamasis chemiškai pagrįstomis reaktyvumo taisyklėmis.

 

 

     Kaip paskutinis pavyzdys, Coscientist buvo pavesta optimizuoti reakcijas, kad maksimaliai padidintų produkto išeigą, procese, kurio metu buvo kartojamos reakcijos sąlygos ir rezultatai buvo naudojami geresniems eksperimentams pasiūlyti. Jo veikimas yra palankesnis, palyginti su Bajeso optimizavimu (nustatytu mašininio mokymosi metodu), kai pateikiama tik dešimt reakcijų pavyzdžių. Kai GPT nebuvo parengtas pavyzdžiais, jo pirminiai pasiūlymai dėl reakcijos sąlygų kartais buvo prasti. Tačiau kai buvo pavyzdžių, vėlesni pasiūlymai greitai tobulėjo su kiekviena iteracija – tai parodo Coscientist gebėjimą įgyti žinių ir, laikui bėgant, pritaikyti savo samprotavimus.

 

    

 

     Boiko ir kolegų išvados yra tvirtas principo įrodymas, kad dabartinė Coscientist versija gali pusiau autonomiškai atlikti eksperimentus. Tačiau jis vis dar turi tam tikrų apribojimų. Kaip pažymėjo autoriai, kartais gaunami chemiškai neteisingi atsakymai. Tačiau juos galima sušvelninti, naudojant sudėtingas raginimo strategijas (tokias kaip minčių grandinė4 ir minčių medis5) kartu su duomenų šaltiniais, orientuotais į chemiją. Taip pat reikėtų pažymėti, kad realaus pasaulio scenarijai apima daug sudėtingesnius tyrimo klausimus, nei tie, kurie buvo nagrinėjami šiame tyrime, klausimus, kurie yra dažnai apimantys koncepcijas iš kitų disciplinų, nei chemija, pavyzdžiui, biologija, vaistų kūrimo atveju. Tokie sudėtingi klausimai šiuo metu Coscientist nepasiekiami.

 

    

 

     Apibendrinant, pateikti pavyzdžiai yra esminis žingsnis, kuriant savarankiškas laboratorijas. Tačiau Coscientist ir kitos būsimos AI technologijos turi subręsti, kad mokslininkai galėtų visiškai suprasti jų trūkumus ir kaip jas geriausiai panaudoti moksle. Jei dėl didelio kalbų modelių netinkamo naudojimo chemijoje nebus įvestos slegiančios taisyklės, kurios slopina tyrimus, artimiausioje ateityje tikimės daug daugiau įdomių įvykių.

 

    

 

     Nuorodos

 

    

 

         Boiko, D. A., MacKnight, R., Kline, B. ir Gomes, G. Nature 624, 570–578 (2023).

 

    

 

         „Google Scholar“ straipsnis

 

    

 

         Seifrid, M. ir kt. Acc. Chem. Res. 55, 2454–2466 (2022).

 

    

 

         Straipsnis PubMed Google Scholar

 

    

 

         Segler, M. H. S., Preuss, M. & Waller, M. P. Nature 555, 604–610 (2018).

 

    

 

         „Google Scholar“ straipsnis

 

    

 

         Wei, J. ir kt. Išankstinis spausdinimas adresu https://arxiv.org/abs/2201.11903 (2023).

 

    

 

         Yao, S. ir kt. Išankstinis spausdinimas adresu https://arxiv.org/abs/2305.10601 (2023).

 

    

 

     Konkuruojantys interesai

 

    

 

     T.R. yra farmacijos, biotechnologijų ir technologijų pramonės konsultantas, taip pat tikras Toronto universiteto Acceleration Consortium narys." [6]



 

6. Large language models direct automated chemistry laboratory. By Ana Laura Dias & Tiago Rodrigues.  Nature 624, 530-531 (2023)

Komentarų nėra: