„Dideliems kalbų modeliams sunku išspręsti mokslinio lygio
matematikos uždavinius. Reikia žmogaus, kad įvertintų, kiek prastai jie veikia.
Prieš kelias savaites vienas vidurinės mokyklos mokinys el.
paštu parašė Martinui Haireriui, matematikui, žinomam dėl jo stulbinančio
kūrybiškumo. Paauglys buvo siekiantis matematiko karjeros, tačiau, kylant
dirbtiniam intelektui, jis abejojo. „Sunku suprasti, kas iš tikrųjų vyksta“, –
sakė jis. „Atrodo, kad šie modeliai kiekvieną dieną tobulėja ir anksčiau, nei
vėliau, jie pavers mus beverčiais.“
Jis paklausė: „Jei turime mašiną, kuri sprendžia problemas
žymiai geriau, nei mes, ar matematika nepraranda dalies jos magijos?“
Dr. Haireris, 2014 m. laimėjęs Fieldso medalį –
prestižiškiausią matematikos apdovanojimą, o 2021 m. – pelningą „Breakthrough“
premiją, savo laiką dalija tarp Šveicarijos federalinio technologijų instituto
Lozanoje ir Londono imperatoriškojo koledžo. Atsakydamas studentui, jis
pastebėjo, kad daugelis sričių susiduria su dirbtinio intelekto sukelto
pasenimo perspektyva.
„Manau, kad matematika iš tikrųjų yra gana „saugi“, – sakė
dr. Haireris. Jis pažymėjo, kad didelių kalbų modeliai (LLM), pokalbių robotų
technologija, dabar gana gerai sprendžia išgalvotas problemas. Tačiau, pasak
jo, „nemačiau jokio patikimo pavyzdžio, kad LLM sugalvotų tikrai naują idėją ir
(arba) koncepciją.“
Dr. Haireris užsiminė apie šį pokalbį, aptardamas naują
straipsnį pavadinimu „Pirmasis įrodymas“, kurį jis parašė kartu su keliais
matematikais, įskaitant Mohammedą Abouzaidą iš Stanfordo universiteto, Lauren
Williams iš Harvardo universiteto ir Tamarą Kolda, kuri vadovauja konsultacijų
įmonei „MathSci.ai“ San Francisko įlankos regione.
Straipsnyje aprašomas neseniai
pradėtas eksperimentas, kurio metu renkami tikri testo klausimai, sudaryti iš
autorių nepublikuotų tyrimų, siekiant pateikti prasmingą dirbtinio intelekto
matematinių gebėjimų matavimą.”
Pagrindiniai „Pirmojo įrodymo“ aspektai:
Tikslas: sukurti tikslesnį, prasmingesnį ir griežtesnį
dirbtinio intelekto matematinio samprotavimo gebėjimų vertinimo kriterijų,
palyginti su standartizuotais duomenų rinkiniais.
Metodika: eksperimente naudojami tikri, nepublikuoti autorių
sukurti tyrimo klausimai.
Autoriai: Dr. Haireris (EPFL) šį darbą parašė kartu su
Mohammedu Abouzaidu (Stanfordas), Lauren Williams (Harvardas) ir Tamara Kolda
(MathSci.ai).
Šiomis
pastangomis siekiama pašalinti esamų dirbtinio intelekto etalonų apribojimus,
testuojant galimybes su naujomis problemomis, o ne duomenimis, su kuriais
modeliai jau galėjo susidurti.
Komentarų nėra:
Rašyti komentarą