Sekėjai

Ieškoti šiame dienoraštyje

2025 m. lapkričio 22 d., šeštadienis

Pasaulio modeliai yra sekantis žingsnis, kuriant išmanesnes ir saugesnes dirbtinio intelekto sistemas, nei dideli kalbos modeliai: vyriausiasis „Meta“ dirbtinio intelekto mokslininkas išvyksta į naują projektą

 

„Yann LeCun, „Meta“ vyriausiasis dirbtinio intelekto mokslininkas, palieka įmonę, kad pradėtų savo įmonę, kuri, jo teigimu, bendradarbiaus su socialinių tinklų milžine.

 

LeCun trečiadienį „LinkedIn“ įraše teigė, kad kuria startuolį, „kad sukeltų kitą didelę dirbtinio intelekto revoliuciją“.

 

Ši bendrovė planuoja sutelkti dėmesį į „sistemas, kurios supranta fizinį pasaulį, turi nuolatinę atmintį, gali samprotauti ir gali planuoti sudėtingas veiksmų sekas“, – rašė jis.

 

LeCun aprašyti pasaulio modeliai mokosi, priimdami vaizdinę informaciją, panašiai kaip gyvūnų jaunikliai ar maži vaikai.

 

LeCun 2013 m. sukūrė dirbtinio intelekto tyrimų organizaciją „Meta“ viduje ir ketverius metus jai vadovavo, kol tapo vyriausiuoju „Meta“ dirbtinio intelekto mokslininku. Jo požiūris į tai, kaip tobulinti dirbtinio intelekto būklę, pastaraisiais metais skyrėsi nuo „Meta“ požiūrio.

 

„Meta“, kaip ir daugelis jos pramonės konkurentų, skubėjo kurti didelius kalbos modelius ir nuolat juos keisti, tikėdamasi pasiekti superintelektą arba intelektą, kuris yra protingesnis už žmones. LeCun ne kartą sakė, kad jis netiki, kad dideli kalbos modeliai leis pasiekti tokį intelekto lygį, todėl savo įtaka remia besiformuojančius pasaulio modelius.

 

Vasarą „Meta“ savo laboratorijoje, orientuotoje į superintelekto kūrimą, paskyrė kitą vyriausiąjį mokslininką, o LeCun ėjo jo pareigas Fundamentalių dirbtinio intelekto tyrimų grupėje.

 

Praėjusią savaitę „The Wall Street Journal“ pranešė, kad LeCun neseniai kalbėjosi su kolegomis apie pasitraukimą iš „Meta“ – ieškojo kolegų savo naujai įmonei ir kalbėjosi su investuotojais. Jis planuoja palikti „Meta“ metų pabaigoje.

 

„Meta“ atstovas patvirtino šią naujieną, tačiau atsisakė plačiau komentuoti.“ [2]

 

1. Neteisinga teigti, kad pasaulio modelis yra neabejotinai geresnis už LLM, nes jie tarnauja skirtingiems, nors ir susijusiems, tikslams, o daugelis pasaulio modelius laiko būtina evoliucija, pranokstančia LLM, ypač atliekant fizines užduotis.

 

LLM puikiai apdoroja ir generuoja tekstą, atpažindami modelius, o pasaulio modeliai yra vidinės, nuspėjamosios sistemos, imituojančios realybę, leisdamos DI „įsivaizduoti“ pasekmes prieš veikiant, o tai labai svarbu robotikai, planavimui ir fizinio pasaulio supratimui.

 

Didieji kalbos modeliai (LLM)

 

Funkcija: LLM yra apmokyti dirbti su didžiuliais teksto ir kitų duomenų kiekiais, kad atliktų tokias užduotis kaip kalbos vertimas, santraukų rašymas ir turinio generavimas.

 

Stiprybė: Jie yra galingi tvarkydami kalbą ir rasdami modelius savo mokymo duomenyse, tačiau jų supratimas apie realų pasaulį gali būti ribotas ir trapus.

 

Apribojimas: Jie daugiausia remiasi šablonų atitikimu ir neturi patikimo vidinio pasaulio veikimo simuliatoriaus, todėl gali kilti netikėtų gedimų.

 

Pasaulio modeliai

 

Funkcija: Tai vidinės aplinkos simuliacijos, leidžiančios DI numatyti ir samprotauti apie veiksmų pasekmes prieš jiems įvykstant, panašiai kaip žmogus „įsivaizduoja“ karštos viryklės prisilietimo rezultatą.

 

Privalumas: Jie yra būtini užduotims, kurioms reikalingas gilus fizikos, priežastingumo ir realaus pasaulio dinamikos supratimas, reikalingas planavimui ir kontrolei fizinėje aplinkoje, pavyzdžiui, robotikoje ir įkūnytame DI.

 

Privalumas: Jie suteikia esminį gebėjimą mokytis, samprotauti ir planuoti fiziniame pasaulyje, kuris pranoksta tekstinį šablonų atitikimą, kurį naudoja LLM.

 

Ryšys tarp LLM ir pasaulio modelių

 

Pasaulio modeliai nepakeičia LLM, bet yra laikomi kitu žingsniu, kuriant išmanesnes ir saugesnes DI sistemas.

 

2. Meta's Chief AI Scientist To Depart for New Venture. Bobrowsky, Meghan.  Wall Street Journal, Eastern edition; New York, N.Y.. 20 Nov 2025: B4.  

Komentarų nėra: