„Dirbtinio intelekto (AI) revoliucija netrukus išplis už pokalbių robotų ribų.
Nuo naujų, plastiką valgančių, bakterijų ir vaistų nuo vėžio iki autonominių pagalbinių robotų ir, savarankiškai važiuojančių, automobilių – generatyvinio AI technologija, kuri išpopuliarėjo, kaip ChatGPT variklis, yra pasirengusi pakeisti mūsų gyvenimą taip, kad kalbantys robotai atrodytų, kaip tik išblaškantis trukdymas.
Nors dabartinį dirbtinio intelekto bumą esame linkę tapatinti su kompiuteriais, galinčiais rašyti, kalbėti, koduoti ir kurti nuotraukas, dauguma tų išraiškos formų yra pagrįstos pagrindine technologija, vadinama „transformeriu“, kuri turi daug platesnių pritaikymų.
Pirmą kartą 2017 m. paskelbtame „Google“ tyrėjų dokumente, transformeriai yra AI algoritmai, leidžiantys kompiuteriams suprasti pagrindinę bet kokių duomenų krūvos struktūrą – ar tai būtų žodžiai, vairavimo duomenys, ar baltyme esančios aminorūgštys. Transformeris gali sukurti savo panašią išvestį.
Transformeris atvėrė kelią OpenAI paleisti ChatGPT prieš dvejus metus, o daugybė įmonių šiuo metu siekia, kaip naujoves panaudoti naujais būdais – nuo Waymo ir jos robotų taksi iki biologijos startuolio, vadinamo EvolutionaryScale, kurio AI sistemos kuria naujų baltymų molekulių struktūras.
Šio proveržio taikymo sritis yra tokia plati, kad per septynerius metus nuo „Google“ tyrimo paskelbimo jis buvo cituojamas kituose moksliniuose straipsniuose daugiau, nei 140 000 kartų.
Šiuolaikinis AI jau seniai gerai atpažįsta informacijos modelius. Tačiau ankstesni metodai turėjo rimtas ribas, ką dar galima padaryti. Pavyzdžiui, naudojant kalbą, dauguma dirbtinio intelekto sistemų galėjo apdoroti žodžius tik po vieną ir įvertinti juos tik skaitymo seka, o tai apribojo jų gebėjimą suprasti, ką tie žodžiai reiškia.
„Google“ mokslininkai, parašę šį svarbų 2017 m. straipsnį, daugiausia dėmesio skyrė kalbų vertimo procesui. Jie suprato, kad dirbtinio intelekto sistema, galinti suvirškinti visus rašto žodžius ir skirti daugiau reikšmės kai kurių žodžių reikšmėms, nei kitų, kitaip tariant, skaityti kontekste, galėtų padaryti daug geresnius vertimus.
Pavyzdžiui, sakinyje „Atvykau į krantą, perėjęs upę“ (angliškai: "I arrived at the bank after crossing the river") transformeris dirbtiniam intelekte, žinantis, kad sakinys baigiasi „upę“ (angliškai "bank"), o ne „kelią“, gali išversti „bank“ kaip žemės ruožą, o ne vietą, kur padėti savo pinigus.
Toks konteksto supratimo lygis leidžia transformeriumi pagrįstoms AI sistemoms ne tik atpažinti modelius, bet ir numatyti, kas gali būti toliau – ir taip generuoti savo naują informaciją. Ir šis gebėjimas gali apimti kitus duomenis, nei tiktai žodžius.
„Tam tikra prasme modeliai atranda latentinę duomenų struktūrą“, – sako Aleksandras Rivesas, „EvolutionaryScale“ vyriausiasis mokslininkas, kurią jis įkūrė praėjusiais metais po darbo AI organizacijai Meta Platforms, „Facebook“ kompanijos patronuojamai.
„EvolutionaryScale“ moko savo AI apie paskelbtas kiekvieno baltymo sekas, kurias įmonės mokslininkai gali rasti. Naudodamas šiuos duomenis ir be žmogaus inžinierių pagalbos, jo AI gali nustatyti ryšį tarp tam tikros molekulinių statybinių blokų sekos ir kaip jos sukuriamas baltymas veikia realiame pasaulyje.
Ankstesni su šia tema susiję tyrimai, kurie buvo labiau skirti baltymų struktūrai, o ne jų funkcijai, yra priežastis, dėl kurios „Google“ dirbtinio intelekto vadovas Demisas Hassabis pasidalijo 2024 m. Nobelio premiją chemijos srityje. Jo ir jo komandos sukurta sistema, pavadinta „AlphaFold“, taip pat pagrįsta transformeriais.
„EvolutionaryScale“ jau sukūrė vieną koncepcijos įrodymo molekulę. Tai baltymas, kuris veikia, kaip tas, dėl kurio kai kurios medūzos užsidega šviesa, tačiau, jos AI sugalvota, seka kardinaliai skiriasi nuo to, ką gamta yra išradusi.
Galutinis bendrovės tikslas – leisti visoms įmonėms – nuo farmacijos gamintojų, gaminančių naujus vaistus iki sintetinės chemijos įmonių, dirbančių su naujais fermentais – sukurti medžiagas, kurios be jų technologijos būtų neįmanoma. Tai gali apimti bakterijas, turinčias naujų fermentų, galinčių virškinti plastiką, arba naujus vaistus, pritaikytus tam tikroms vėžio formoms.
Tuo tarpu Karolio Hausmano tikslas – sukurti universalų AI, galintį valdyti bet kurį robotą. Hausmano San Franciske įsikūrusiam startuoliui „Physical Intelligence“ dar mažiau, nei metai, o pats Hausmanas anksčiau dirbo „Google“ AI sparne „DeepMind“. Jo įmonė pradeda nuo to paties didelio kalbos modelio varianto, kurį naudojate, prisijungdami prie „ChatGPT“. Naujausiuose iš šių kalbų modelių taip pat yra ir galima dirbti su vaizdais. Jie yra pagrindiniai Hausmano robotų veikimo principai.
Neseniai vykusioje demonstracijoje fizinio intelekto varomų robotų rankų pora atlieka tai, kas yra, patikėkite ar ne, viena sunkiausių užduočių visoje robotikoje: sulankstyti skalbinius. Drabužiai gali įgauti bet kokią formą, o juos tvarkyti reikia stebėtinai daug lankstumo ir miklumo, todėl robotams negalima parašyti veiksmų seką, kuri tiksliai nurodys robotui, kaip judinti jo galūnes, kad paimtų ir sulankstytų skalbinius.
Fizinio intelekto sistema gali išimti drabužius iš džiovyklės ir tvarkingai juos sulankstyti, naudodama sistemą, kuri išmoko atlikti šią užduotį pati, o žmonės neįveda jokių kitų duomenų, išskyrus kalnus duomenų, kuriuos ji galėtų virškinti. Ši demonstracija ir kitos panašios buvo pakankamai įspūdingos, kad anksčiau šį mėnesį bendrovė iš investuotojų, įskaitant Jeffą Bezosą ir OpenAI, surinko 400 mln. dolerių.
Spalio mėnesį Masačusetso technologijos instituto tyrėjai paskelbė, kad jie taiko panašią transformatoriumi pagrįstą strategiją, kad sukurtų robotų smegenis, kurios galėtų priimti didžiulius kiekius duomenų iš įvairių šaltinių ir tada lanksčiai veikti įvairiose aplinkose. Vienu atveju jie sukūrė kelis filmus, kaip įprasta roboto ranka deda šunų maistą į dubenį, tada panaudojo vaizdo įrašus, kad išmokytų atskirą dirbtinio intelekto robotą daryti tą patį.
Kaip ir robotikos srityje, tyrėjai ir įmonės, dirbančios su savarankiškai važiuojančiais automobiliais, sugalvoja, kaip naudoti transformerinius „vaizdinės kalbos modelius“, kurie gali perimti ir sujungti ne tik kalbą, bet ir vaizdus. Kalifornijoje įsikūrusios „Nuro“ ir Londone įsikūrusios „Wayve“, taip pat „Waymo“, priklausančios „Google“ patronuojančiai įmonei, yra tarp su šiais modeliais dirbančių įmonių.
Tai nukrypimas nuo prieš transformerių pritaikomo požiūrio į savarankišką vairavimą, kai jutiklių duomenims apdoroti, kad būtų galima identifikuoti, kelyje esančius, objektus, buvo naudojamos žmogaus parašytos instrukcijos ir senesni AI tipai. Naujieji transformatorių modeliai iš esmės yra nuoroda, leidžianti savarankiškai vairuojančioms sistemoms suteikti tokių bendrų žinių apie pasaulį, kurias anksčiau buvo labai sunku suteikti.
Kad ir kokios galingos jos būtų, šios sistemos vis dar turi ribas ir nenuspėjamumą, o tai reiškia, kad jos negalės visiškai automatizuoti žmonių darbo, sako Dettmer.
Pavyzdžiui, EvolutionaryScale centre esantis AI gali pasiūlyti naujų molekulių, kurias žmonės galėtų išbandyti laboratorijoje, tačiau žmonės vis tiek turi jas susintetinti ir išbandyti.
O modeliai su transformeriais toli gražu nėra pakankamai patikimi, kad visiškai perimtų vairavimą.
Fizinio intelekto sistema, kuri išmoko sulankstyti skalbinius, turėtų iš naujo išmokti šį procesą taip, kaip būdinga jūsų namams, kad galėtų perimti iš jūsų tokį darbą. Tam prireiktų daug inžinierių laiko, taip pat pinigų modeliui apmokyti.
„Noriu įsitikinti, kad protingai keliau lūkesčius“, – sako generalinis direktorius Hausmanas. „Kad ir kaip didžiuojamės savo pasiekimais, vis dar esame pradžioje.“ [1]
1. EXCHANGE --- Keywords: A Powerful AI Breakthrough Is About to Transform the World --- The technology driving ChatGPT is capable of so much more. Mims, Christopher. Wall Street Journal, Eastern edition; New York, N.Y.. 16 Nov 2024: B.2.