„Mokslininkai paverčia pokalbių robotus į internetinius agentus, kurie žaidžia žaidimus, teikia užklausas svetainėse, planuoja susitikimus, kuria juostines diagramas ir daro daugiau.
Plačiai naudojamas pokalbių robotas ChatGPT buvo sukurtas skaitmeniniam tekstui generuoti – nuo poezijos iki kursinių darbų iki kompiuterinių programų. Tačiau kai kompiuterių lustų kompanijos „Nvidia“ dirbtinio intelekto tyrėjų komanda susipažino su pokalbių roboto pagrindinėmis technologijomis, jie suprato, kad tai gali padaryti daug daugiau.
Per kelias savaites jie išmokė jį žaisti „Minecraft“ – vienu populiariausių pasaulyje vaizdo žaidimų. Skaitmeninėje „Minecraft“ visatoje jis išmoko plaukti, rinkti augalus, medžioti kiaules, kasti auksą ir statyti namus.
„Jis gali patekti į „Minecraft“ pasaulį ir tyrinėti pats, rinkti medžiagą ir įgyti vis geresnių įgūdžių“, – sakė „Nvidia“ vyresnysis mokslo darbuotojas Linxi Fanas, žinomas kaip Džimas.
Šis projektas buvo ankstyvas ženklas, kad pirmaujantys pasaulyje dirbtinio intelekto tyrinėtojai pokalbių robotus paverčia naujos rūšies autonomine sistema, vadinama A.I. agentas. Šie agentai gali ne tik kalbėtis. Jie gali naudoti programinės įrangos programas, svetaines ir kitus internetinius įrankius, įskaitant skaičiuokles, internetinius kalendorius, kelionių svetaines ir kt.
Laikui bėgant, daugelis tyrinėtojų teigia, kad A.I. agentai galėtų tapti daug sudėtingesni ir galėtų pakeisti biuro darbuotojus, automatizuodami beveik bet kokį baltųjų apykaklių darbą.
„Tai didžiulė komercinė galimybė, potencialiai trilijonai dolerių“, – sakė Jeffas Clune'as, kompiuterių mokslų profesorius iš Britų Kolumbijos universiteto, anksčiau dirbęs su tokio tipo technologijomis, kaip tyrėjas OpenAI, San Francisko startuolio, kuris pastatė. ChatGPT. „Tai turi didžiulį pranašumą ir didžiulius padarinius visuomenei“.
„Nvidia“ agentas žaidžia žaidimą. Panašūs agentai gali planuoti susitikimus, redaguoti failus, analizuoti duomenis ir kurti įvairiaspalves juostines diagramas. Idėja yra ta, kad šios automatizuotos sistemos galiausiai veiks, kaip asmeniniai asistentai, galintys atlikti daugybę užduočių internete.
Šiandienos agentai yra riboti, ir jie negali tiksliai organizuoti jūsų gyvenimo. „ChatGPT“ kelionių svetainėje „Expedia“ gali ieškoti skrydžių į Niujorką, tačiau rezervaciją vis tiek turite užsisakyti patys.
Ši technologija, tyrėjams ją tobulinant, gali padidinti biuro darbuotojų ir vartotojų efektyvumą. Tai taip pat gali pakeisti vaizdo žaidimų pobūdį, suteikdama naują robotų bangą, kurią žaidėjai gali žaisti kartu ir su jais kalbėtis.
GPT-4, technologija, kuria grindžiamas ChatGPT, yra tai, ką mokslininkai vadina didelės kalbos modeliu. Tai A.I. sistema, kuri mokosi įgūdžių, analizuodama didžiulius duomenų kiekius.
Per pastaruosius kelis mėnesius ši technologija sužavėjo šimtus milijonų žmonių tuo, kaip ji generuoja el. laiškus, rašo kalbas ir pranešimus beveik bet kokia tema. Tačiau svarbiausias jos įgūdis gali būti gebėjimas rašyti kompiuterines programas.
Jis gali akimirksniu sukurti programą, kuri nupiešia vienaragį arba numeta skaitmeninį sniegą ant nešiojamojo kompiuterio ekrano. Profesionalūs programinės įrangos kūrėjai gali paprašyti kodo, kurį galėtų sulankstyti į didesnes programas, įskaitant viską nuo socialinės žiniasklaidos programų iki paieškos sistemų. Tačiau tai tik dalis to, ką ši technologija gali padaryti. Jis taip pat gali generuoti kompiuterio kodą, kuris paliečia kitas programinės įrangos programas ir svetaines.
Taip daktaras Fanas ir kiti „Nvidia“ tyrėjai išmokė GPT-4 žaisti „Minecraft“. „Svarbiausias žodis čia yra kodas“, – sakė daktaras Fanas. „Kodas gali imtis veiksmų“.
Žmonės naudoja programinės įrangos programas ir svetaines liesdami mygtukus, meniu ir kitus grafinius valdiklius. A.I. agentai naudoja programas ir svetaines, pasiekdami savo programų programavimo sąsajas arba A.P.I.s – pagrindinį programinės įrangos kodą, leidžiantį susisiekti su kitomis internetinėmis paslaugomis.
Pavyzdžiui, jei paprašysite agento įkelti vaizdo įrašą į internetą, jis gali sugeneruoti kodą, kuris vadinamas A.P.I. „YouTube“. „A.P.I. yra tik tekstas, naudojamas kalbėtis su mašina“, – sakė tyrėjas Silenas Naihinas, padedantis valdyti nepriklausomą A.I. agento projektas, AutoGPT.
Teoriškai pokalbių robotas gali parašyti kodą prieigai prie bet kurio A.P.I. internete. Tačiau šiandieniniai pokalbių robotai dar nėra pakankamai įgudę atlikti daugiau, nei paprastas užduotis. Ir net jei taip būtų, leisti jiems laisvai naršyti internete būtų didžiulė rizika saugumui. Taigi įmonės pradeda nuo mažo.
Praėjus keliems mėnesiams po to, kai „OpenAI“ pristatė „ChatGPT“, jis tyliai išleido būdą, kaip pokalbių robotas gali padaryti daugiau, nei kurti tekstą. Įdiegę įvairius papildinius – programinę įrangą, kuri praplečia roboto galimybes – galite paprašyti jo ieškoti galimų skrydžių kelionių svetainėse, pvz., „Expedia“, paimti jūsų gimtojo miesto žemėlapį iš „Google“ žemės ar net pakeisti skaičiuoklę, kurioje išsamiai aprašomos jūsų metinės išlaidos į įvairiaspalvę juostinę diagramą.
Įrengtas papildinys, vadinamas kodo interpretatoriumi, „ChatGPT“ galėjo ne tik įrašyti kodą, bet ir jį paleisti. Tai leido technologijai akimirksniu atlikti užduotis, kurių ji negalėjo anksčiau, įskaitant redagavimą skaičiuoti skaičiuokles ir nejudančius vaizdus paversti video įrašais. „Google“, „Microsoft“ ir kitos įmonės tiria panašias technologijas.
„Tai yra projektai, kuriuose iš esmės numatome A.I. darbą su kitais A.I. jūsų vardu“, – sakė „Microsoft“ viceprezidentė Ashley Llorens.
Nepriklausomi projektai, tokie kaip AutoGPT, bando žengti kelis žingsnius toliau. Idėja yra suteikti sistemai tokius tikslus, kaip „sukurti įmonę“ arba „uždirbti pinigų“. Tada jis ieškos būdų, kaip pasiekti šį tikslą, užduodamas sau klausimus ir prisijungdamas prie kitų interneto paslaugų.
Šiandien tai neveikia taip gerai. Tokios sistemos, kaip AutoGPT paprastai įstringa begalinėse kilpose. Tačiau mokslininkai, tokie kaip daktaras Fanas, nuolat tobulina tokią technologiją, siekdami padaryti ją naudingesnę ir patikimesnę.
Kiti tyrinėtojai kuria naujo tipo A.I. agentus, skirtus naudoti programinės įrangos įrankius. 2022 m. vasarą Dr. Clune'as buvo tarp OpenAI tyrėjų komandos, kuri sukūrė agentą, galintį naudoti kompiuterio programinę įrangą taip, kaip tai naudotų žmogus – pelės paspaudimu po pelės paspaudimo, klavišo paspaudimu po klavišo paspaudimo.
Dr. Clune'as ir jo kolegos teikė sistemai valandų valandas internetinių vaizdo įrašų, kuriuose buvo rodomi žmonės, žaidžiantys „Minecraft“. Analizuodama, kaip žmonės naudojo pelę ir klaviatūrą, naršydami po Minecraft skaitmeninę visatą, sistema išmoko žaisti žaidimą pati.
Kitos įmonės, įskaitant pradedančiąją įmonę, pavadintą „Adept“, kuria panašius agentus, kurie naudoja tokias svetaines, kaip „Wikipedia“, „Redfin“ ir „Craigslist“ bei populiarias biuro programas iš tokių įmonių, kaip „Salesforce“.
Dr. Clune'as teigia, kad toks agentas ilgainiui leis dirbtiniam intelektui naudoti daug platesnį programinės įrangos programų ir svetainių spektrą. Jis sakė, kad kiekvienas turės prieigą prie skaitmeninio asistento, kuris galėtų padaryti beveik bet ką internete. Tai galėtų palengvinti gyvenimą, bet taip pat galėtų pakeisti daugybę darbų.
„Jei A.I. gali padaryti viską, ką galime padaryti, tai ne tik pakeičia nuobodžias užduotis“, – sakė jis. „Tai pakeičia visas užduotis.“ [1]
1. 'A.I. Agents' Can Play Minecraft. They're Just Getting Warmed Up.: [Business/Financial Desk]
Metz, Cade; Weise, Karen. New York Times, Late Edition (East Coast); New York, N.Y.. 18 Oct 2023: B.1.