„Šiandienos dirbtiniai intelektai yra išmanūs knygomis. Visko, ką jie žino, išmoko iš prieinamos kalbos, vaizdų ir vaizdo įrašų. Kad galėtų toliau vystytis, jie turi išmokti gatvės. Tam reikia „pasaulio modelių“.
Svarbiausia – įgalinti dirbtinį intelektą mokytis iš savo aplinkos ir tiksliai atvaizduoti abstrakčią jos versiją savo „galvose“, kaip tai daro žmonės ir gyvūnai. Norėdami tai padaryti, kūrėjai turi apmokyti dirbtinius intelektus naudodami pasaulio simuliacijas. Įsivaizduokite tai kaip mokymąsi vairuoti žaidžiant „Gran Turismo“ arba mokymąsi skraidyti iš „Microsoft Flight Simulator“. Šie pasaulio modeliai apima viską, ko reikia planuoti, imtis veiksmų ir numatyti ateitį, įskaitant fiziką ir laiką.
Pasaulio modelio metodas, kuris šiek tiek painioja tiek imituojamą mokymo aplinką, tiek abstraktų vaizdavimą, jau daro potencialiai didžiulį poveikį realiam pasauliui. Moritzas teigia, kad iš to gauna naudos dronų karas, naujų tipų robotai ir saugesnės už žmones savaeigės transporto priemonės.“ Baier-Lentz, rizikos kapitalo įmonės „Lightspeed“ partnerė ir investuotoja.
Dirbtinio intelekto pionieriai beveik vieningai įsitikinę, kad pasauliniai modeliai yra labai svarbūs kuriant naujos kartos DI. Daugelis teigia, kad jie bus labai svarbūs kada nors kuriant geresnį už žmogų „dirbtinį bendrąjį intelektą“ (DDI). Stanfordo universiteto profesorė ir DI „krikštamotė“ Fei-Fei Li surinko 230 mln. dolerių, kad įkurtų pasaulinio modelio startuolį „World Labs“.
„Nvidia“ generalinis direktorius Jensenas Huangas teigė, kad pasauliniai modeliai gali padėti išlaisvinti „fizinį DI“, kad jis galėtų savarankiškai valdyti robotus, savaeigius automobilius ir panašiai.
Nors šiuo metu visą dėmesį sulaukia DI tipas, kuris leidžia kurti didelius kalbos modelius ir „ChatGPT“, būtent pasauliniu modeliu pagrįstas DI įgauna pagreitį tarptautiniuose tyrimuose ir galėtų leisti technologijoms užimti naujus vaidmenis mūsų gyvenime.
Neaišku, ar visi šie statymai leis pasiekti superintelektą, kurį prognozuoja įmonių vadovai. Tačiau artimiausiu metu pasauliniai modeliai galėtų padėti DI geriau atlikti užduotis, kuriose jie šiuo metu stringa, ypač erdvinio suvokimo srityje. samprotavimas.
Nesvarbu, kiek duomenų apmokomi šiandienos generatyviniai dirbtiniai intelektai, jie gali išmokti tik tikimybinį pasaulio veikimo modelį, sako Gary Marcusas, buvęs „Uber“ dirbtinio intelekto pastangų vadovas ir dažnas dabartinių dirbtinio intelekto metodų kritikas. Iš esmės šiandienos dirbtiniai intelektai mokosi apie visų jiems įvedamų duomenų koreliacijas – nesvarbu, ar tai žodžiai ir vaizdai, ar molekulės ir jų funkcijos. Šis neaiškus apytikslis supratimas, regis, yra užkoduotas jų dirbtinio intelekto „smegenyse“ kaip duomenų ir milžiniško taisyklių, kaip jais manipuliuoti, sąrašo, kuris dažnai yra nepilnas arba prieštaringas sau, mišinys.
Geras to pavyzdys: „Atari 2600“, kuriame veikia 1979 m. sukurta programa, gali įveikti pažangiausius pokalbių robotus šachmatuose. Robotai linkę bandyti neleistinus ėjimus ir greitai pameta savo figūrų padėties seką. Iš esmės šiandien transformatoriais paremti dirbtiniai intelektai daro prognozes, o ne samprotauja logiškai. Visa tai nepaisant to, kad per mokymą jie buvo supažindinti su daugybe žaidimų ir daugybe taisyklių knygų. „Atari“ laimi, nes jis išlaiko figūrų padėtį tiesiai, naudodamas senovinį ir kukli vidinio pasaulio modelio versija: duomenų bazė.
Yra dirbtinių intelektų, kurie šachmatuose gali įveikti „Atari“ – ir bet kurį gyvą žmogų. „Google“ „MuZero“, išleistas 2019 m., buvo sukurtas iš esmės kitaip nei vėliau sukurti generatyvinio dirbtinio intelekto robotai. Jam pavyko išmokti sukurti tikslų žaidžiamo žaidimo atvaizdavimą.
O kaip su užduotimis, kurios vyksta realiame pasaulyje, kuris yra daug sudėtingesnis nei ribotas žaidimo pasaulis? Siekdami išspręsti šiuos iššūkius, „Google DeepMind“ tyrėjai nusprendė sukurti sistemą, kuri galėtų generuoti realaus pasaulio simuliacijas su precedento neturinčiu tikslumu.
Rezultatas – „Genie 3“, kuris vis dar yra tyrimų peržiūros stadijoje ir nėra viešai prieinamas – gali generuoti fotorealistinius, atviro pasaulio virtualius peizažus iš vien tekstinės eilutės [1]. „Genie 3“ galite įsivaizduoti kaip būdą greitai generuoti tai, kas iš esmės yra atviro pasaulio vaizdo žaidimas, kuris gali būti tiek ištikimas realiam pasauliui, kiek tik norite. Tai virtuali erdvė, kurioje maža dirbtinio intelekto kūrėja gali be galo žaisti, daryti klaidas ir mokytis, ką reikia daryti, kad pasiektų savo tikslus, lygiai taip pat, kaip realiame pasaulyje daro gyvūno ar žmogaus jauniklis.
Šis eksperimentavimo procesas vadinamas pastiprinimo mokymusi.
„Genie 3“ yra sistemos, kuri galėtų padėti apmokyti dirbtinį intelektą, kuris ateityje pilotuos robotus, savaeigius automobilius ir kitus „įkūnytus“ dirbtinius intelektus, dalis, sako projekto bendravadovas Jackas Parkeris-Holderis. Aplinkos galėtų būti pilnos žmonių ir kliūčių: dirbtinis intelektas galėtų išmokti bendrauti su žmonėmis stebėdamas juos judančius toje virtualioje erdvėje, priduria jis.
Jau yra potencialiai milžiniški duomenų šaltiniai apie tai, kaip žmonės veikia virtualioje aplinkoje. Tokios paslaugos kaip „Medal.tv“ – paslauga, fiksuojanti tiek žaidimo eigą, tiek vartotojų veiksmus vaizdo žaidimuose. Šie duomenų šaltiniai galėtų būti ypač naudingi – ir vertingi – įvairioms dirbtinio intelekto laboratorijoms, kurios bando mus nukreipti į dirbtinį dirbtinį intelektą (ADI), ir dirbtiniams intelektams, galintiems pilotuoti robotus. Galiausiai visas šis mokymasis virtualioje aplinkoje galėtų lemti ne tik išmanesnių pokalbių robotų, bet ir sistemų, kurios galėtų saugiai veikti realiame pasaulyje, atsiradimą.
Toronte įsikūrusi „Waabi“ sukūrė visą pasaulį, pavadintą „Waabi World“, kad apmokytų dirbtinius intelektus vairuoti sunkvežimius. Daug saugiau (ir pigiau) leisti jiems vėl ir vėl daužytis simuliacijoje, nei bandyti tai padaryti bent kartą realiame pasaulyje. Bendrovės generalinė direktorė Raquel Urtasun teigia, kad tai leidžia dirbtiniams intelektams registruoti milijonus virtualių važiavimo mylių. Tikimasi, kad „Waabi“ programinė įranga iki metų pabaigos galės savarankiškai vairuoti tikrą sunkvežimį realiame kelyje, priduria ji.
Atrodo, kad teisės magistro (LLM) specialistai jau perima kai kurias funkcijas baltųjų apykaklių darbuose, o dirbtiniai intelektai, kurie yra išmanūs pagal pasaulinį modelį, galėtų leisti jiems perimti dar daugiau funkcijų. Darbininkas buvo gana saugus. Tačiau dirbtinio intelekto kūrėjams vis labiau gilinantis į pasaulinius modelius, robotai gali pradėti pretenduoti į sunkvežimių vairuotojų, santechnikų ar slaugytojų darbo vietas.“ [2]
1. Kas yra „Google Genie 3“?
„Google Genie 3“ yra pažangus dirbtinio intelekto pasaulio modelis, sukurtas „Google DeepMind“, kuris generuoja dinamiškas, interaktyvias ir tyrinėjamas 3D aplinkas iš vieno teksto raginimo, leisdamas naršyti ir sąveikauti realiuoju laiku. Jis gali kurti įvairius pasaulius – nuo realistiškų peizažų iki stilizuotų aplinkų – ir gali išlaikyti pasaulio atmintį kelias minutes, taip užtikrindamas nuolatinius pokyčius ir nuoseklią sąveiką. „Genie 3“ laikomas reikšmingu žingsniu kuriant dirbtinį bendrąjį intelektą (DGI) ir turi potencialių pritaikymų vaizdo žaidimų kūrime, robotikos mokymuose, moksliniame modeliavime ir kt.
Pagrindinės savybės ir galimybės:
Teksto į pasaulį generavimas:
Vartotojai gali įvesti teksto raginimą, kad akimirksniu sugeneruotų visą, interaktyvų 3D pasaulį.
Interaktyvumas realiuoju laiku:
Aplinkos reaguoja į naudotojo veiksmus ir judesius realiuoju laiku, o modelis nuolat generuoja kadrus.
Pasaulio atmintis:
„Genie 3“ kelias minutes išlaiko aplinkos nuoseklumą ir atmintį, todėl leidžia nuolat keistis ir išlaikyti ilgesnę „pasaulio atmintį“.
Įvairūs Aplinkos:
Gali generuoti įvairias aplinkas, įskaitant fotorealistinius pasaulius ir stilizuotas, vaizduotės įkvėptas aplinkas.
Valdoma sąveika:
Vartotojai gali naršyti ir sąveikauti šiuose pasauliuose, o modelis reaguoja į jų veiksmus.
Galimos taikymo sritys:
Vaizdo žaidimų kūrimas:
„Genie 3“ gali smarkiai pagreitinti detalių žaidimų pasaulių kūrimą, pereinant prie visiškai dirbtinio intelekto generuojamų žaidimų.
DI mokymai:
Ji suteikia platformą DI agentų, įskaitant humanoidinius robotus ir autonomines sistemas, mokymui realistiškose imituojamose aplinkose.
Švietimas ir tyrimai:
Technologija gali įkvėpti gyvybės istorinėms aplinkoms, mokslinėms koncepcijoms ir kitiems dalykams, todėl mokymasis tampa įtraukiantis.
Mokslinis modeliavimas:
Tyrėjai gali naudoti „Genie 3“, kad sukurtų kontroliuojamas simuliacijas idėjoms testuoti, ekosistemoms tirti ir objektų elgesiui stebėti.
Reikšmė:
Įkūnytas DI:
„Genie 3“ laikomas dideliu įkūnyto DI proveržiu, leidžiančiu robotams mokytis sudėtingų užduočių imituojamose aplinkose.
Kelias į dirbtinį intelektą:
Jo gebėjimas generuoti neribotas, interaktyvias aplinkas Dirbtinis intelektas, kuriame galima mokytis, laikomas esminiu žingsniu plėtojant dirbtinį intelektą (DI).
Daugiau nei statinis turinys:
Skirtingai nuo ankstesnių modelių, kurie kūrė statinius vaizdus ar vaizdo įrašus, „Genie 3“ kuria dinamiškas ir valdomas 3D aplinkas, pakeisdamas DI turinio generavimo aplinką.
2. EXCHANGE --- Keywords: 'World Models' Are the Key to The Next Big Evolution in AI --- To develop knowledge beyond text and videos, artificial intelligence must have realistic virtual playgrounds to make mistakes and learn. Mims, Christopher. Wall Street Journal, Eastern edition; New York, N.Y.. 27 Sep 2025: B2.
Komentarų nėra:
Rašyti komentarą