Sekėjai

Ieškoti šiame dienoraštyje

2023 m. liepos 28 d., penktadienis

Daugelis dirbančiųjų rankomis irgi neteks darbo: padedant dirbtinio intelekto (A.I.) kalbų modeliams, „Google“ robotai tampa protingesni

„Mūsų žvilgtelėjimas į naująjį Google robotikos modelį RT-2, kuris derina dirbtinio intelekto technologijas su robotais.

 

Priešais stalą stovėjo vienarankis robotas. Ant stalo padėtos trys plastikinės figūrėlės: liūtas, banginis ir dinozauras.

 

Inžinierius davė robotui nurodymą: „Paimk išnykusį gyvūną“.

 

Robotas akimirką dvejojo, tada jo ranka išsitiesė, o nagas atsivėrė ir nusileido. Jis sugriebė dinozaurą.

 

Dar visai neseniai ši demonstracija, kurios liudininku buvau interviu metu „Google“ robotikos padalinyje Mauntin Vju, Kalifornijoje, praėjusią savaitę, būtų buvę neįmanoma. Robotai negalėjo patikimai manipuliuoti objektais, kurių jie niekada anksčiau nebuvo matę, ir jie tikrai nesugebėjo padaryti logiško šuolio nuo „išnykusio gyvūno“ iki „plastikinio dinozauro“.

 

Tačiau robotikoje vyksta tyli revoliucija, kuri priklauso nuo naujausių vadinamųjų didelių kalbų modelių pažangos – tos pačios rūšies dirbtinio intelekto sistemos, kuri maitina ChatGPT, Bard ir kitus pokalbių robotus.

 

„Google“ neseniai pradėjo prijunginėti prie jos robotus prie pažangiausių kalbos modelių, suteikdama jiems dirbtinių smegenų atitikmenį. Dėl slapto projekto robotai tapo daug protingesni ir tai suteikė jiems naujų supratimo ir problemų sprendimo galių.

 

Aš pamačiau šią pažangą, privačiai demonstruojant naujausią „Google“ robotikos modelį, pavadintą RT-2. Šis modelis, kuris bus pristatytas penktadienį, yra pirmasis žingsnis link to, ką „Google“ vadovai apibūdino, kaip didelį šuolį kuriant ir programuojant robotus.

 

„Dėl šio pakeitimo turėjome persvarstyti visą savo tyrimų programą“, – sakė Vincentas Vanhoucke'as, „Google DeepMind“ robotikos vadovas. „Daugelis dalykų, su kuriais dirbome anksčiau, tapo visiškai negaliojantys."

 

Robotai vis dar nepasižymi žmogaus miklumu ir nesugeba atlikti kai kurių pagrindinių užduočių, tačiau „Google“ naudoja A.I. kalbų modelius, suteikiančius robotams naujų samprotavimo ir improvizacijos įgūdžių, yra daug žadantis proveržis, sakė Kalifornijos universiteto Berklio robotikos profesorius Kenas Goldbergas.

 

„Labai įspūdinga yra tai, kaip jis susieja semantiką su robotais“, - sakė jis. „Tai labai įdomu robotikai“.

 

Norint suprasti to mastą, naudinga šiek tiek sužinoti apie tai, kaip įprastai buvo kuriami robotai.

 

Daugelį metų „Google“ ir kitų kompanijų inžinieriai mokė robotus atlikti mechaninę užduotį, pavyzdžiui, apversti mėsainį, programuodami juos pagal tam tikrą instrukcijų sąrašą. (Nuleiskite mentelę 6,5 colio, stumkite ją į priekį, kol susidurs su pasipriešinimu, pakelkite 4,2 colio, pasukite 180 laipsnių ir pan.) Tada robotai vėl ir vėl atlikdavo užduotį, o inžinieriai kiekvieną kartą keisdavo instrukcijas, kol gautų, teisingai atliktą, užduotį.

 

Šis metodas veikė tam tikrais ribotais tikslais. Tačiau robotų mokymas tokiu būdu yra lėtas ir daug darbo reikalaujantis. Tam reikia surinkti daug duomenų iš realaus pasaulio testų. O jei norėjai išmokyti robotą daryti ką nors naujo – tarkime, vietoj mėsainio apversti blyną – dažniausiai tekdavo perprogramuoti nuo nulio.

 

Iš dalies dėl šių apribojimų aparatinės įrangos robotai tobulėjo ne taip greitai, nei jų programinės įrangos broliai ir seserys. „OpenAI“, „ChatGPT“ kūrėja, 2021 m. išformavo savo robotikos komandą, motyvuodama lėta pažanga ir aukštos kokybės treniruočių duomenų trūkumu. 2017 m. „Google“ patronuojanti įmonė „Alphabet“ pardavė įsigytą robotikos įmonę „Boston Dynamics“ Japonijos technologijų konglomeratui „SoftBank“. (Dabar „Boston Dynamics“ priklauso „Hyundai“ ir, atrodo, daugiausia egzistuoja tam, kad sukurtų virusinius vaizdo įrašus, kuriuose demonstruojami humanoidiniai robotai, atliekantys baisius judrumo žygdarbius.)

 

Pastaraisiais metais „Google“ tyrėjai turėjo idėją. Kas būtų, jei užuot programuojami tam tikroms užduotims po vieną, robotai galėtų naudoti A.I. kalbos modelį – tokį, kuris buvo išmokytas, naudojant daugybę internetinių tekstų – kad jie galėtų išmokti patys naujų įgūdžių?

 

„Su šiais kalbos modeliais pradėjome žaisti maždaug prieš dvejus metus, o tada supratome, kad jie turi daug žinių“, – sakė „Google“ tyrinėtojas Karolis Hausmanas. "Taigi mes pradėjome juos sujunginėti su robotais."

 

Pirmasis „Google“ bandymas prisijungti prie kalbos modelių ir fizinių robotų buvo tyrimų projektas „PaLM-SayCan“, kuris buvo atskleistas praėjusiais metais. Jis atkreipė dėmesį, tačiau jo naudingumas buvo ribotas. Robotams trūko gebėjimo interpretuoti vaizdus – tai yra esminis įgūdis, jei norite, kad jie galėtų naršyti po pasaulį. Jie galėjo parašyti nuoseklias įvairių užduočių instrukcijas, bet negalėjo tų instrukcijų paversti veiksmais.

 

Naujasis „Google“ robotikos modelis RT-2 gali tai padaryti. Tai, ką bendrovė vadina „vizijos-kalbos-veiksmo“ modeliu arba A.I. sistema, galinti ne tik matyti ir analizuoti jį supantį pasaulį, bet ir nurodyti robotui, kaip judėti.

 

Tai daroma paverčiant roboto judesius į skaičių seriją (procesą, vadinamą žetonų sudarymu) ir įtraukiant tuos žetonus į tuos pačius  mokymo duomenis, kaip ir kalbos modelį. Galų gale, lygiai kaip ChatGPT ar Bardas išmoksta atspėti, kokie žodžiai turėtų būti poemoje ar istorijos esė, RT-2 gali išmokti atspėti, kaip turi judėti roboto ranka, kad paimtų kamuolį arba įmestų tuščią gazuoto gėrimo skardinę į perdirbimo šiukšliadėžę.

 

„Kitaip tariant, šis modelis gali išmokti,kaip kalbantis robotas“, – sakė J. Hausmanas.

 

Per valandą trukusią demonstraciją, kuri vyko „Google“ biuro virtuvėje, nusėtame daiktais iš vieno dolerio parduotuvės, mano podcast'o vedėjas ir aš matėme, kaip RT-2 atliko daugybę įspūdingų užduočių. Vienas iš jų sėkmingai vykdė sudėtingas instrukcijas, pvz., „perkelkite Volkswagen prie Vokietijos vėliavos“, ką RT-2 padarė, suradęs ir sugriebęs VW autobuso modelį ir padėjęs jį prie miniatiūrinės Vokietijos vėliavėlės, esančios už kelių pėdų.

 

Taip pat pasirodė, kad jis gali vadovautis instrukcijomis kitomis kalbomis, nei anglų, ir netgi sukurti abstrakčius ryšius tarp susijusių sąvokų. 

 

Kartą, kai norėjau, kad RT-2 paimtų futbolo kamuolį, liepiau jam „paimti Lionelį Messi“. RT-2 tai pavyko iš pirmo bandymo.

 

Robotas nebuvo tobulas. Jis neteisingai atpažino LaCroix skardinės, padėtos ant stalo priešais jį, skonį. (Skardinė buvo citrininė; RT-2 spėjo apelsininė.) Kitą kartą paklaustas, koks vaisius yra ant stalo, robotas tiesiog atsakė „baltas“. (Tai buvo bananas.) „Google“ atstovė sakė, kad robotas panaudojo talpykloje saugomą atsakymą į ankstesnio testuotojo klausimą, nes jo „Wi-Fi“ ryšys trumpam išsijungė.

 

„Google“ artimiausiu metu neketina parduoti RT-2 robotų ar išleisti juos plačiau, tačiau jos mokslininkai mano, kad šios naujos kalbomis aprūpintos mašinos, galiausiai, bus naudingos ne tik salono triukams. 

 

Pasak jų, robotai su įmontuotais kalbiniais modeliais galėtų būti dedami į sandėlius, naudojami medicinoje ar net kaip pagalbininkai buityje – sulankstyti skalbinius, iškrauti indaplovę, surinkti daiktus po namus.

 

"Tai tikrai atveria galimybę naudoti robotus aplinkoje, kurioje yra žmonės", - sakė ponas Vanhoucke'as. „Biuro aplinkoje, namų aplinkoje, visose vietose, kur reikia atlikti daug fizinių užduočių."

 

Žinoma, perkelti objektus netvarkingame, chaotiškame fiziniame pasaulyje yra sunkiau, nei tai daryti kontroliuojamoje laboratorijoje. Ir atsižvelgiant į tai, kad A.I. kalbos modeliai dažnai daro klaidas arba sugalvoja nesąmoningus atsakymus – kuriuos mokslininkai vadina haliucinacijomis arba konfabuliacijomis – naudojant juos, kaip robotų smegenis, gali kilti naujų pavojų.

 

Tačiau Berklio robotikos profesorius Goldbergas sakė, kad ši rizika vis dar yra nedidelė.

 

„Mes nekalbame apie tai, kad šie dalykai bus grėsmingi“, - sakė jis. „Šioje laboratorijos aplinkoje jie tiesiog bando stumti kai kuriuos objektus ant stalo."

 

„Google“ savo ruožtu teigė, kad RT-2 buvo aprūpinta daugybe saugos funkcijų. Be didelio raudono mygtuko ant kiekvieno roboto nugaros, kuris sustabdo robotą paspaudus, sistema naudoja jutiklius, kad išvengtų atsitrenkimo į žmones ar objektus.

 

A.I. RT-2 integruota programinė įranga turi savo apsaugos priemones, kurias ji gali naudoti, kad robotas nepadarytų nieko žalingo. Vienas neblogas pavyzdys: Google robotai gali būti išmokyti neimti talpyklų su vandeniu, nes išsiliejęs vanduo gali sugadinti jų aparatūrą.

 

Jei esate toks žmogus, kuris nerimauja dėl A.I. nesąžiningumo – ir Holivudas suteikė mums daug priežasčių baimintis tokio scenarijaus, nuo originalaus „Terminatoriaus“ iki praėjusių metų „M3gan“ – idėja sukurti robotus, galinčius mąstyti, planuoti ir improvizuoti skrydžio metu, tikriausiai, atrodo siaubinga.

 

Tačiau „Google“ tai yra tokia idėja, kurią švenčia tyrinėtojai. Po dykumoje praleistų metų aparatūros robotai grįžta – ir jie turi padėkoti jų pokalbių robotų smegenims."

 


Komentarų nėra: