Sekėjai

Ieškoti šiame dienoraštyje

2022 m. liepos 22 d., penktadienis

Ko dirbtinis intelektas vis dar nežino, kaip tai padaryti

„Prieš kelias savaites „Google“ inžinierius sulaukė didelio dėmesio dėl dramatiško teiginio: jis sakė, kad bendrovės LaMDA sistema, kuri dirbtinio intelekto srityje žinoma, kaip didelis kalbos modelis, tapo jautria, protinga būtybe.

 

    Dideli kalbų modeliai, tokie, kaip LaMDA arba San Fransiske veikiantis atvirojo DI varžovas GPT-3, nepaprastai gerai sukuria nuoseklų, įtikinamą rašymą ir pokalbius – pakankamai įtikina, kad apgautų inžinierių.

 

    Tačiau jie tam naudoja gana paprastą techniką: modeliai mato pirmąją kažkieno parašyto teksto dalį ir bando nuspėti, kurie žodžiai greičiausiai bus toliau. Jei galingas kompiuteris tai padarys milijardus kartų su milijardais tekstų, kuriuos sukūrė milijonai žmonių, sistema galiausiai gali sukurti gramatinį ir patikimą naujo raginimo ar klausimo tęsinį.

 

    Natūralu paklausti, ar dideli kalbų modeliai, tokie, kaip LaMDA (angl. trumpinys iš kalbos modelio dialogo taikomosios programos) arba GPT-3, yra tikrai protingi – ar tiesiog dvigubai kalbantys apgavikai, vadovaujantis didžiojo senojo komiko prof. Irwino Corey „Geriausias pasaulyje“ Valdžia“ idėjomis. (Kad suprastumėte idėją, peržiūrėkite Corey erudicijos rutiną.) Bet aš manau, kad tai neteisingas klausimas. Šie modeliai nėra nei tikrai protingi agentai, nei apgaulingai kvaili. Intelektas ir agentūra yra netinkamos kategorijos jiems suprasti.

 

    Vietoj to, šios DI sistemos yra tai, ką galėtume pavadinti kultūros technologijomis, pavyzdžiui, raštu, spausdinimu, bibliotekomis, interneto paieškos sistemomis ar net pačia kalba. Tai nauji būdai perduoti informaciją iš vienos žmonių grupės kitai. 

 

Klausimas, ar GPT-3 ar LaMDA yra protingi, ar žino apie pasaulį, prilygsta klausimui, ar Kalifornijos universiteto biblioteka yra išmani, ar „Google“ paieška „žino“ atsakymus į jūsų klausimus. Tačiau kultūros technologijos gali būti nepaprastai galingos – tai yra tiek gerai, tiek blogai.

 

    Mes, žmonės, esame natūralūs animistai – matome agentūrą visur, upėse, medžiuose, debesyse ir ypač mašinose, kaip gali paliudyti kiekvienas, kuris keikė nepaklusnią indaplovę. Taigi, mes lengvai įsivaizduojame, kad naujoji mašininio mokymosi technologija sukūrė naujus agentus, protingus ar kvailus, naudingus ar (dažniau) piktybinius. Žmonės pradėjo kalbėti apie šį „DI“, o ne apie „DI“ – tarsi tai būtų susiję su asmeniu, o ne apie skaičiavimus.

 

    Kultūros technologijos nepanašios į protingus žmones, tačiau jos yra būtinos žmogaus intelektui. Daugelis gyvūnų gali perduoti tam tikrą informaciją iš vieno individo ar vienos kartos kitai, tačiau joks gyvūnas to nedaro tiek, kiek mes darome, ir laikui bėgant nesukaupia tiek informacijos. Perfrazuojant Izaoką Niutoną, kiekvienas naujas žmogus gali matyti iki šiol, nes stovi ant pečių tų, kurie buvo prieš juos. Naujos technologijos, palengvinančios ir veiksmingesnės kultūros perdavimą, buvo vienos didžiausių žmonijos pažangos variklių.

 

    Pati kalba yra originali kultūros technologija, leidžianti vienam medžiotojui pasakyti kitam, kur rasti grobį, arba močiutei perduoti anūkei sunkiai iškovotą kepimo techniką. Įvedus rašymu transformuotą kultūrą; galėjome susipažinti su močiučių išmintimi šimtus metų anksčiau ir už šimtų mylių. Spaustuvė padėjo įgalinti tiek pramonės revoliuciją, tiek liberalios demokratijos iškilimą. Bibliotekos, jų rodyklės ir katalogai buvo būtini mokslo ir technikos raidai. Interneto paieškos sistemos dar labiau palengvino informacijos paiešką.

 

    Kaip ir šios ankstesnės technologijos, dideli kalbos modeliai padeda pasiekti ir apibendrinti milijardus sakinių, kuriuos parašė kiti žmonės, ir naudoja juos kurdami naujus sakinius. 

 

Kitos sistemos, tokios kaip OpenAI DALL-E 2, kuri ką tik sukūrė žurnalo Cosmopolitan viršelio iliustraciją, taip pat daro tai su milijardais mūsų sukurtų vaizdų. Kultūros technologijų istorija yra tokia, kad mes vis lengviau galime pasiekti vis daugiau kitų protų žinias per didesnes erdvės ir laiko tarpas, o naujosios DI sistemos yra paskutinis šio proceso žingsnis.

 

    Bet jei tiek daug to, ką žinome, ateina iš kitų žmonių kalbos, ar tikrai kažkas, pavyzdžiui, GPT-3, neturi viso reikiamo intelekto? Ar tie milijardai žodžių neapima visų žmogaus žinių? Ko trūksta?

 

    Kultūros perdavimas turi dvi puses – imitaciją ir naujoves. 

 

Kiekviena karta gali naudoti imitaciją, kad pasinaudotų ankstesnių atradimų pranašumais, o dideli kalbų modeliai yra puikūs imitatoriai. Tačiau nebūtų prasmės mėgdžioti, jei kiekviena karta nekurtų naujovių. Mes peržengiame kitų žodžius ir praeities išmintį, kad stebėtume pasaulį iš naujo ir darytume apie jį naujų atradimų. Ir čia net labai jauni žmonės įveikė dabartinį DI.

 

    Klasikiniame „Turingo teste“ Alanas Turingas 1950 m. pasiūlė, kad jei negalėtumėte atskirti žmogaus ir kompiuterio pokalbio mašinėle, kompiuteriai gali būti kvalifikuoti, kaip protingi. Dideli kalbų modeliai prie to artėja.

 

    Tačiau Turingas taip pat pasiūlė griežtesnį testą: kad būtų tikras intelektas, kompiuteris turėtų ne tik kalbėti apie pasaulį, kaip suaugęs žmogus – jis turėtų sugebėti sužinoti apie pasaulį, kaip žmogaus vaikas.

 

    Mano laboratorijoje sukūrėme naują internetinę aplinką, skirtą įgyvendinti šį antrąjį Turingo testą – vienodas sąlygas vaikams ir DI sistemoms. Parodėme 4 metų vaikams ekrane esančias mašinas, kurios užsidegs, kai ant jų įdėsite kai kuriuos virtualių blokų derinius, bet ne kitus; skirtingos mašinos veikė skirtingais būdais. Vaikai turėjo išsiaiškinti, kaip veikia mašinos ir pasakyti, ką daryti, kad jos užsidegtų. Ketverių metų vaikai eksperimentavo ir po kelių bandymų gavo teisingą atsakymą. Tada mes pateikėme tą pačią problemą pažangiausioms DI sistemoms, įskaitant GPT-3 ir kitus didelius kalbų modelius. Kalbos modeliai gavo scenarijų, kuriame aprašytas kiekvienas vaikų matytas įvykis, o tada paprašėme jų atsakyti į tuos pačius klausimus, kuriuos uždavėme vaikams.

 

    Manėme, kad dirbtinio intelekto sistemos gali išgauti teisingą atsakymą į šią paprastą problemą iš tų milijardų ankstesnių žodžių. Tačiau niekas tose milžiniškose teksto duomenų bazėse anksčiau nebuvo matęs mūsų virtualių spalvotų blokų mašinų. Tiesą sakant, GPT-3 pralaimėjo. Kai kurie kiti neseniai atlikti eksperimentai davė panašius rezultatus. 

 

Atrodo, kad GPT-3, nepaisant jos artikuliuotos kalbos, negali išspręsti priežasties ir pasekmės problemų.

 

    Jei norite išspręsti naują problemą, pirmas žingsnis gali būti jos „Google“ paieška arba apsilankymas bibliotekoje. Bet galiausiai jūs turite eksperimentuoti, kaip tai padarė vaikai.

 

    GPT-3 gali pasakyti, koks bus labiausiai tikėtinas istorijos rezultatas. Tačiau naujovės, net ir 4 metų vaikams, priklauso nuo to, kas stebina ir netikėta – nuo ​​netikėtų, o ne nuspėjamų rezultatų.

 

    Ar visa tai reiškia, kad mums nereikia jaudintis, kad DI taps sugebančiu jausti daiktus? Manau, kad nerimas dėl itin intelektualių ir piktybinių dirbtinių agentų, šiuolaikinių golemų, yra bent jau per didelis. Tačiau kultūros technologijos pakeičia pasaulį labiau, nei pavieniai agentai, ir nėra garantijos, kad pokyčiai bus į gera.

 

    Kalba leidžia meluoti, vilioti ir bauginti kitus tiek, kiek leidžia tiksliai bendrauti ir atrasti tiesą. Sokratas manė, kad rašymas buvo tikrai bloga idėja. Jis sakė, kad jūs negalite turėti sokratiškų dialogų raštu, kaip ir kalboje, ir žmonės gali patikėti, kad viskas yra tiesa vien todėl, kad jie buvo užrašyti – ir jis buvo teisus. Technologinės naujovės leido Benjaminui Franklinui spausdinti nebrangius lankstinukus, kurie skleidžia žinią apie demokratiją ir remia geriausius Amerikos revoliucijos aspektus. Tačiau, kaip parodė istorikas Robertas Darntonas, ta pati technologija taip pat išleido šmeižto ir nepadorumo potvynį ir prisidėjo prie blogiausių Prancūzijos revoliucijos aspektų.

 

    Žmonės gali būti šališki, patiklūs, rasistiniai, seksistai ir neracionalūs. Taigi santraukos apie tai, ką žmonės, kurie mus vedė, galvojo „senų žmonų pasakoje“, biblioteka ar internetas, paveldi visus tuos trūkumus. Ir tai neabejotinai gali būti tiesa ir didelių kalbų modeliams.

 

    Kiekvienai praeities kultūrinei technologijai reikėjo naujų normų, taisyklių, įstatymų ir institucijų, kad būtų užtikrinta, jog gėris nusveria blogį – nuo ​​melagių gėdinimo ir tiesos sakytojų pagerbimo iki faktų tikrintojų, bibliotekininkų, šmeižto įstatymų ir privatumo taisyklių išradimo. LaMDA ir GPT-3 nėra užmaskuoti žmonės. Tačiau tikri žmonės, kurie jas naudoja, turi peržengti praeities susitarimus ir sukurti naujoviškas institucijas, kurios gali būti tokios pat galingos, kaip ir pačios technologijos.

    ---

    Dr. Gopnik yra Kalifornijos universiteto Berklyje psichologijos profesorė ir „The Wall Street Journal“ „Mind & Matter“ apžvalgininkė.“ [1]

1. REVIEW --- What AI Still Doesn't Know How To Do --- Artificial intelligence programs that learn to write and speak can sound almost human -- but they can't think creatively like a small child can.
Gopnik, Alison. 
Wall Street Journal, Eastern edition; New York, N.Y. [New York, N.Y]. 16 July 2022: C.3.

Komentarų nėra: