„Nvidia“ generalinis direktorius paskutinio bendrovės uždarbio skambučio pabaigoje pasakė užuominą, kuri nusipelno daugiau dėmesio, nei gavo – net jei tai suprantamai nustelbė 35,1 mlrd. dolerių, jo firmos uždirbtų per ketvirtį.
„Kaip visi žinome, esame šios generacinio dirbtinio intelekto (AI) revoliucijos pradžioje“, – telefoninio pokalbio metu sakė Jensenas Huangas.
„Ir mes esame naujos kartos pamatinių modelių, galinčių įrodinėti ir ilgai mąstyti, pradžioje."
„Ilgas mąstymas“ nepateko į akiratį, kai OpenAI ChatGPT prieš dvejus metus pirmą kartą pribloškė pasaulį greitais atsakymais į klausimus apie beveik bet ką. Tačiau tai gali sumažinti arba pašalinti klaidas, kurios dažnai pasitaikydavo tuose atsakymuose.
Idėja yra tokia, kaip skamba, bent jau aukščiausiu lygiu: ilgai mąstantys AI modeliai sukurti taip, kad užtruktų daugiau laiko „apmąstyti“ rezultatus, kuriuos jie mums sukuria. Jie bus pakankamai protingi, kad galėtų mums pranešti apie jų pažangą ir paprašyti mūsų atsiliepimų.
Tai gali reikšti, kad problemai reikia skirti kelias sekundes arba daug, daug ilgiau, kaip Huangas nurodė kitoje pasakiškoje pastaboje praėjusį birželį.
„Daugeliu atvejų, kaip žinote, dabar dirbame su dirbtinio intelekto programomis, kurios veikia 100 dienų“, – sakė jis „Computex“ parodoje Taipėjuje.
Tikimasi, kad tobulėjant modelių mąstymo gebėjimams dirbtinis intelektas vystysis kur kas toliau, nei dabartinės technologijos, kurios veikia mūsų vardu klientų aptarnavimo ar automatizavimo srityse, arba dar sudėtingesni agentai, kurie tik pradeda pasirodyti.
„OpenAI“ ilgalaikio mąstymo galimybės pažengė į priekį rugsėjį, kai buvo išleisti o serijos modeliai, kurie, anot jos, skirti daugiau laiko galvoti, prieš reaguojant, samprotaujant, atliekant sudėtingas užduotis, ir sprendžiant „sunkesnes problemas, nei ankstesni mokslo, kodavimo ir modeliai.“
Catherine Brownstein, Bostono vaikų ligoninės ir Harvardo medicinos mokyklos docentė, tyrinėjanti itin retas ligas, sakė, kad naujos OpenAI samprotavimo galimybės pagreitina jos darbą.
„Dažnai naudoju jas, norėdamas smarkiai sumažinti ne itin linksmas mano darbo dalis, pavyzdžiui, apibendrinti dar vieną tyrimą, kuris gali būti susijęs arba nesusijęs su mano užduodamu klausimu“, – sakė Brownstein. „Aš taip pat galėjau užmegzti ryšius, kurių tikriausiai nebūčiau galėjęs padaryti, nes o1 sugebėjo sudėtingas genetines sąvokas paversti prieinamais paaiškinimais."
Ilgo mąstymo idėja remiasi žmogaus minties dichotomija, kurią velionis Danielis Kahnemanas pavadino 1 ir 2 sistema.
„Sistema 1 veikia automatiškai ir greitai, be didelių pastangų arba be jokių pastangų ir be savanoriškos kontrolės jausmo“, – rašė Nobelio premijos laureatas psichologas savo knygoje „Thinking, Fast and Slow“. 2 sistema „skiria dėmesį į, pastangų reikalaujančią, protinę veiklą, kuri to reikalauja, įskaitant sudėtingus skaičiavimus“.
Galite atspėti, kas šiuo metu dominuoja AI.
„Šiuo metu kuriamas AI iš esmės yra panašus į 1 sistemą“, – sako kognityvinis mokslininkas Gary Marcusas. Šiam požiūriui būdingi apribojimai yra dalis to, kodėl Marcusas mano, kad visuomenei reikia AI apsauginių turėklų, kad būtų išvengta „Burtininko mokinio“ stiliaus netvarkos.
Ilgas mąstymas yra pastangos įtraukti dirbtinį intelektą į 2 sistemą.
Pasak Srinivaso Narayanano, Open-AI inžinerijos viceprezidento, naujų modelių argumentavimo galimybės vis dar yra ankstyvosiose stadijose, tačiau ateinančiais metais jie pasieks reikšmingą pažangą.
„Turėsime dirbtinio intelekto sistemas, kurios galės sklandžiau kalbėtis su mumis, kurios taip pat gali vizualizuoti realų pasaulį“, – sakė Narayananas. „Manau, kad šis samprotavimo ir multimodalinių galimybių derinys kitais metais leis mums sukurti galingesnes agentų programas."
Pasak bendrovės vyriausiojo mokslininko ir AI tyrimų vykdomojo viceprezidento Silvio Savarese, programinės įrangos, kaip paslaugos pradininkė „Salesforce“ ir toliau didina investicijas į jos Atlas Reasoning Engine – AI agentų smegenis, kurios tapo plačiai prieinamos spalį.
„Mes skatiname agentus ir mūsų Agentforce siekti 2 sistemos tipo samprotavimų, leidžiančių AI pateikti gilesnių įžvalgų, atlikti sudėtingus veiksmus ir sukurti reikšmingą poveikį visoms verslo funkcijoms“, – sakė Savarese.
„System 2“ modeliais sukurtų taikomųjų programų atsiradimas gali padėti susigrąžinti didžiules investicijas į dirbtinį intelektą. „Sequoia Capital“ partneris Davidas Cahnas teigia, kad „Nvidia“ infrastruktūra turi bendrai uždirbti 600 mlrd. dolerių pajamų per visą gyvenimą, kad pateisintų įmonių išlaidas šioms sistemoms per vienerius metus – ir nebuvo galima greitai pasiekti šią ribą.
Tačiau samprotavimo modeliai tuo pat metu gali padidinti šios AI infrastruktūros, įskaitant lustus, programinę įrangą ir duomenų centrus, paklausą.
Jiems reikia padidinti tai, kas vadinama išvadomis, arba tam tikros rūšies skaičiavimu, apmokyti dirbtinio intelekto modeliai tai daro, kai reaguoja į vartotojų raginimus. Išvada taip pat yra sritis, kurioje šviečia Nvidia platformos.
Kaip „Nvidia“ sakė praėjusį mėnesį savo pokalbyje su investuotojais: „Ilgai mąstant, išvados apskaičiuojamos eksponentiškai."
Kitaip tariant, ilgas mąstymas yra ilgo AI ekonomikos žaidimo dalis." [1]
1. Technology & Business: Long Thinking Is Seen As Key to AIs Next Move. Rosenbush, Steven. Wall Street Journal, Eastern edition; New York, N.Y.. 12 Dec 2024: B.4.