„Mūsų žvilgtelėjimas į naująjį Google robotikos modelį RT-2,
kuris derina dirbtinio intelekto technologijas su robotais.
Priešais stalą stovėjo vienarankis robotas. Ant stalo padėtos
trys plastikinės figūrėlės: liūtas, banginis ir dinozauras.
Inžinierius davė robotui nurodymą: „Paimk išnykusį gyvūną“.
Robotas akimirką dvejojo, tada jo ranka išsitiesė, o nagas
atsivėrė ir nusileido. Jis sugriebė dinozaurą.
Dar visai neseniai ši demonstracija, kurios liudininku buvau interviu metu „Google“ robotikos padalinyje Mauntin Vju, Kalifornijoje,
praėjusią savaitę, būtų buvę neįmanoma. Robotai negalėjo patikimai manipuliuoti
objektais, kurių jie niekada anksčiau nebuvo matę, ir jie tikrai nesugebėjo
padaryti logiško šuolio nuo „išnykusio gyvūno“ iki „plastikinio dinozauro“.
Tačiau robotikoje vyksta tyli revoliucija, kuri priklauso
nuo naujausių vadinamųjų didelių kalbų modelių pažangos – tos pačios rūšies
dirbtinio intelekto sistemos, kuri maitina ChatGPT, Bard ir kitus pokalbių
robotus.
„Google“ neseniai pradėjo prijunginėti prie jos robotus prie
pažangiausių kalbos modelių, suteikdama jiems dirbtinių smegenų atitikmenį.
Dėl slapto projekto robotai tapo daug protingesni ir tai suteikė jiems naujų
supratimo ir problemų sprendimo galių.
Aš pamačiau šią pažangą, privačiai demonstruojant naujausią
„Google“ robotikos modelį, pavadintą RT-2. Šis modelis, kuris bus pristatytas
penktadienį, yra pirmasis žingsnis link to, ką „Google“ vadovai apibūdino, kaip
didelį šuolį kuriant ir programuojant robotus.
„Dėl šio pakeitimo turėjome persvarstyti visą savo tyrimų
programą“, – sakė Vincentas Vanhoucke'as, „Google DeepMind“ robotikos vadovas.
„Daugelis dalykų, su kuriais dirbome anksčiau, tapo visiškai negaliojantys."
Robotai vis dar nepasižymi žmogaus miklumu ir nesugeba
atlikti kai kurių pagrindinių užduočių, tačiau „Google“ naudoja A.I. kalbų
modelius, suteikiančius robotams naujų samprotavimo ir improvizacijos įgūdžių,
yra daug žadantis proveržis, sakė Kalifornijos universiteto Berklio robotikos
profesorius Kenas Goldbergas.
„Labai įspūdinga yra tai, kaip jis susieja semantiką su
robotais“, - sakė jis. „Tai labai įdomu robotikai“.
Norint suprasti to mastą, naudinga šiek tiek sužinoti apie
tai, kaip įprastai buvo kuriami robotai.
Daugelį metų „Google“ ir kitų kompanijų inžinieriai mokė
robotus atlikti mechaninę užduotį, pavyzdžiui, apversti mėsainį, programuodami
juos pagal tam tikrą instrukcijų sąrašą. (Nuleiskite mentelę 6,5 colio,
stumkite ją į priekį, kol susidurs su pasipriešinimu, pakelkite 4,2 colio,
pasukite 180 laipsnių ir pan.) Tada robotai vėl ir vėl atlikdavo užduotį, o
inžinieriai kiekvieną kartą keisdavo instrukcijas, kol gautų, teisingai atliktą, užduotį.
Šis metodas veikė tam tikrais ribotais tikslais. Tačiau
robotų mokymas tokiu būdu yra lėtas ir daug darbo reikalaujantis. Tam reikia
surinkti daug duomenų iš realaus pasaulio testų. O jei norėjai išmokyti robotą
daryti ką nors naujo – tarkime, vietoj mėsainio apversti blyną – dažniausiai
tekdavo perprogramuoti nuo nulio.
Iš dalies dėl šių apribojimų aparatinės įrangos robotai
tobulėjo ne taip greitai, nei jų programinės įrangos broliai ir seserys.
„OpenAI“, „ChatGPT“ kūrėja, 2021 m. išformavo savo robotikos komandą,
motyvuodama lėta pažanga ir aukštos kokybės treniruočių duomenų trūkumu. 2017
m. „Google“ patronuojanti įmonė „Alphabet“ pardavė įsigytą robotikos įmonę
„Boston Dynamics“ Japonijos technologijų konglomeratui „SoftBank“. (Dabar
„Boston Dynamics“ priklauso „Hyundai“ ir, atrodo, daugiausia egzistuoja tam,
kad sukurtų virusinius vaizdo įrašus, kuriuose demonstruojami humanoidiniai
robotai, atliekantys baisius judrumo žygdarbius.)
Pastaraisiais metais „Google“ tyrėjai turėjo idėją. Kas
būtų, jei užuot programuojami tam tikroms užduotims po vieną, robotai galėtų
naudoti A.I. kalbos modelį – tokį, kuris buvo išmokytas, naudojant daugybę internetinių
tekstų – kad jie galėtų išmokti patys naujų įgūdžių?
„Su šiais kalbos modeliais pradėjome žaisti maždaug prieš
dvejus metus, o tada supratome, kad jie turi daug žinių“, – sakė „Google“
tyrinėtojas Karolis Hausmanas. "Taigi mes pradėjome juos sujunginėti su robotais."
Pirmasis „Google“ bandymas prisijungti prie kalbos modelių
ir fizinių robotų buvo tyrimų projektas „PaLM-SayCan“, kuris buvo atskleistas
praėjusiais metais. Jis atkreipė dėmesį, tačiau jo naudingumas buvo ribotas.
Robotams trūko gebėjimo interpretuoti vaizdus – tai yra esminis įgūdis, jei
norite, kad jie galėtų naršyti po pasaulį. Jie galėjo parašyti nuoseklias
įvairių užduočių instrukcijas, bet negalėjo tų instrukcijų paversti veiksmais.
Naujasis „Google“ robotikos modelis RT-2 gali tai padaryti.
Tai, ką bendrovė vadina „vizijos-kalbos-veiksmo“ modeliu arba A.I. sistema,
galinti ne tik matyti ir analizuoti jį supantį pasaulį, bet ir nurodyti
robotui, kaip judėti.
Tai daroma paverčiant roboto judesius į skaičių seriją
(procesą, vadinamą žetonų sudarymu) ir įtraukiant tuos žetonus į tuos pačius mokymo duomenis, kaip ir kalbos modelį. Galų gale,
lygiai kaip ChatGPT ar Bardas išmoksta atspėti, kokie žodžiai turėtų būti
poemoje ar istorijos esė, RT-2 gali išmokti atspėti, kaip turi judėti roboto
ranka, kad paimtų kamuolį arba įmestų tuščią gazuoto gėrimo skardinę į
perdirbimo šiukšliadėžę.
„Kitaip tariant, šis modelis gali išmokti,kaip kalbantis robotas“,
– sakė J. Hausmanas.
Per valandą trukusią demonstraciją, kuri vyko „Google“ biuro
virtuvėje, nusėtame daiktais iš vieno dolerio parduotuvės, mano podcast'o vedėjas ir
aš matėme, kaip RT-2 atliko daugybę įspūdingų užduočių. Vienas iš jų sėkmingai
vykdė sudėtingas instrukcijas, pvz., „perkelkite Volkswagen prie Vokietijos
vėliavos“, ką RT-2 padarė, suradęs ir sugriebęs VW autobuso modelį ir padėjęs
jį prie miniatiūrinės Vokietijos vėliavėlės, esančios už kelių pėdų.
Taip pat pasirodė, kad jis gali vadovautis instrukcijomis
kitomis kalbomis, nei anglų, ir netgi sukurti abstrakčius ryšius tarp susijusių
sąvokų.
Kartą, kai norėjau, kad RT-2 paimtų futbolo kamuolį, liepiau jam
„paimti Lionelį Messi“. RT-2 tai pavyko iš pirmo bandymo.
Robotas nebuvo tobulas. Jis neteisingai atpažino LaCroix
skardinės, padėtos ant stalo priešais jį, skonį. (Skardinė buvo citrininė; RT-2
spėjo apelsininė.) Kitą kartą paklaustas, koks vaisius yra ant stalo, robotas
tiesiog atsakė „baltas“. (Tai buvo bananas.) „Google“ atstovė sakė, kad robotas
panaudojo talpykloje saugomą atsakymą į ankstesnio testuotojo klausimą, nes jo
„Wi-Fi“ ryšys trumpam išsijungė.
„Google“ artimiausiu metu neketina parduoti RT-2 robotų ar
išleisti juos plačiau, tačiau jos mokslininkai mano, kad šios naujos kalbomis
aprūpintos mašinos, galiausiai, bus naudingos ne tik salono triukams.
Pasak jų,
robotai su įmontuotais kalbiniais modeliais galėtų būti dedami į sandėlius,
naudojami medicinoje ar net kaip pagalbininkai buityje – sulankstyti
skalbinius, iškrauti indaplovę, surinkti daiktus po namus.
"Tai tikrai atveria galimybę naudoti robotus aplinkoje,
kurioje yra žmonės", - sakė ponas Vanhoucke'as. „Biuro aplinkoje, namų
aplinkoje, visose vietose, kur reikia atlikti daug fizinių užduočių."
Žinoma, perkelti objektus netvarkingame, chaotiškame
fiziniame pasaulyje yra sunkiau, nei tai daryti kontroliuojamoje laboratorijoje.
Ir atsižvelgiant į tai, kad A.I. kalbos modeliai dažnai daro klaidas arba
sugalvoja nesąmoningus atsakymus – kuriuos mokslininkai vadina haliucinacijomis
arba konfabuliacijomis – naudojant juos, kaip robotų smegenis, gali kilti naujų pavojų.
Tačiau Berklio robotikos profesorius Goldbergas sakė, kad ši
rizika vis dar yra nedidelė.
„Mes nekalbame apie tai, kad šie dalykai bus grėsmingi“, - sakė
jis. „Šioje laboratorijos aplinkoje jie tiesiog bando stumti kai kuriuos
objektus ant stalo."
„Google“ savo ruožtu teigė, kad RT-2 buvo aprūpinta daugybe
saugos funkcijų. Be didelio raudono mygtuko ant kiekvieno roboto nugaros, kuris
sustabdo robotą paspaudus, sistema naudoja jutiklius, kad išvengtų atsitrenkimo
į žmones ar objektus.
A.I. RT-2 integruota programinė įranga turi savo apsaugos
priemones, kurias ji gali naudoti, kad robotas nepadarytų nieko žalingo. Vienas
neblogas pavyzdys: Google robotai gali būti išmokyti neimti talpyklų su
vandeniu, nes išsiliejęs vanduo gali sugadinti jų aparatūrą.
Jei esate toks žmogus, kuris nerimauja dėl A.I. nesąžiningumo
– ir Holivudas suteikė mums daug priežasčių baimintis tokio scenarijaus, nuo
originalaus „Terminatoriaus“ iki praėjusių metų „M3gan“ – idėja sukurti
robotus, galinčius mąstyti, planuoti ir improvizuoti skrydžio metu, tikriausiai,
atrodo siaubinga.
Tačiau „Google“ tai yra tokia idėja, kurią švenčia
tyrinėtojai. Po dykumoje praleistų metų aparatūros robotai grįžta – ir jie turi
padėkoti jų pokalbių robotų smegenims."
Komentarų nėra:
Rašyti komentarą