„Robotų (ypač humanoidinių) plėtra ilgą laiką stimuliuoja
technologijų entuziastų vaizduotę. Anot daugelio, tai yra viena iš pagrindinių
jų vystymosi krypčių. Tačiau robotai, su kuriais mes iki šiol susidorojome,
turėjo daugybę apribojimų. Jie buvo užprogramuoti tam, kad būtų galima atlikti
specifinę veiklą, galų gale užrogramuoti būti žmogaus kontroliuojamais.
Dirbtinio intelekto (AI) valdomi robotai yra kitokie. Modeliai, kuriuos
pristatė „Google“, tiksliau „Google“ padalinys
DeepMind, kuris specializuojasi dirbtinio intelekto darbe, yra, pasak
bendrovės, sukuriantys naujos kartos robotų pagrindus.
Robotai su AI: jie mato, girdi ir reaguoja į pokyčius nuolat
Pagal Google DeepMind, AI modeliai
robotams turi atitikti tris pagrindinius kriterijus:
interaktyvumo (t.y. instrukcijų ar aplinkos
pokyčių supratimas ir reagavimas į juos);
gebėjimas daryti bendras išvadas – prisitaikyti
prie situacijų;
vikrumas – gebėjimas atlikti veiklą,
kurią žmonės paprastai atlieka rankomis ir pirštais (pavyzdžiui, atsargiai
manipuliuoti daiktais).
„Nors mūsų ankstesnis darbas parodė pažangą šiose srityse,
Gemini Robotics yra didelis šuolis į priekį visose trijose srityse,
priartindamas mus prie tikrai bendrosios paskirties robotų“, – savo
tinklaraštyje rašė „Google DeepMind“.
Ką gali padaryti „Google“ AI varomi robotai?
„Google“ pristatomi dirbtiniu
intelektu aprūpinti robotai reaguoja į žodines komandas, geba atlikti užduotis
besikeičiančiomis aplinkybėmis (reaguoti į vizualius aplinkos signalus ir
parodyti, kad orientuojasi erdvėje), atlikti užduotis, kurioms anksčiau nebuvo
mokomi.
Kaip tai atrodo praktikoje? Google pristatomuose vaizdo
įrašuose matome, pavyzdžiui, robotą, kuris adekvačiai reaguoja į trumpas
komandas (pvz., bananų įdėjimą į konteinerį). Robotas taip pat gali atitikti
šiuos reikalavimus, kai asistentas nuolat keičia konteinerio padėtį. Savo
ruožtu robotų rankiniai įgūdžiai (jų miklumas) demonstruojami filme, kuriame
matome origami figūrėlės lankstymą. Robotai taip pat gali uždėti ant konvejerio
juostos, žaisti „tic-tac-toe“, sutvarkyti įrankius ar žaisti kortomis.
AI robotams iš Google: Gemini Robotics ir Gemini Robotics-ER
„Google DeepMind“ sukurtas AI robotams yra „Gemini Robotics“
ir „Gemini Robotics-ER“ (ER – įkūnytas samprotavimas).
Gemini Robotics yra pažangus VLA
(vision-language-action) modelis.
Jis buvo pastatytas ant Gemini 2.0, kuriame buvo papildomai
įdiegtas naujas modalumas – tiesioginis roboto valdymas fiziniame pasaulyje.
Antrasis modelis „Gemini Robotics-ER“
pasižymi pažangiu erdviniu supratimu, įskaitant 3D erdvės supratimą. Modelis
gali atlikti visus veiksmus, reikalingus robotui valdyti realiu laiku,
įskaitant suvokimą, būsenos įvertinimą, erdvinį supratimą, planavimą ir kodo
generavimą.
„Tokioje išsamioje aplinkoje modelis
pasiekia du ar tris kartus didesnį sėkmės rodiklį, palyginti su „Gemini 2.0“, o
ten, kur kodo generavimo nepakanka, „Gemini Robotics-ER“ gali netgi panaudoti
kontekstinio mokymosi galią, vadovaudamasi kelių žmogaus vadovaujamų
demonstracijų modeliais, kad rastų sprendimą“, – rašoma.
Google AI pritaikytas įvairių tipų robotams
Gemini Robotics modeliai sukurti taip, kad lengvai
prisitaikytų prie įvairių tipų robotų. "Modelį išugdėme visų pirma iš
dviejų rankų ALOHA 2 robotų platformos duomenų, bet taip pat parodėme, kad jis
gali valdyti dviejų rankų platformą, pagrįstą daugelyje akademinių laboratorijų
naudojamomis Frank rankomis. Gemini Robotics netgi gali būti specializuota į
sudėtingesnius įsikūnijimus, pvz., Apptronik sukurtą humanoidinį robotą Apollo,
kuris siekia atlikti realaus pasaulio užduotis", - sakė "Google
DeepMind".
„Google DeepMind“, bendradarbiaudama su „Apptronik“, kuria
„robotinius“ Google modelius. „Mūsų Gemini Robotics-ER modelis taip pat
prieinamas patikimiems testuotojams, įskaitant Agile Robots, Agility Robots,
Boston Dynamics ir Enchanted Tools“, - skaitome."
Komentarų nėra:
Rašyti komentarą