Sekėjai

Ieškoti šiame dienoraštyje

2026 m. vasario 8 d., sekmadienis

Šie matematikai išbando dirbtinį intelektą

„Dideliems kalbų modeliams sunku išspręsti mokslinio lygio matematikos uždavinius. Reikia žmogaus, kad įvertintų, kiek prastai jie veikia.

 

Prieš kelias savaites vienas vidurinės mokyklos mokinys el. paštu parašė Martinui Haireriui, matematikui, žinomam dėl jo stulbinančio kūrybiškumo. Paauglys buvo siekiantis matematiko karjeros, tačiau, kylant dirbtiniam intelektui, jis abejojo. „Sunku suprasti, kas iš tikrųjų vyksta“, – sakė jis. „Atrodo, kad šie modeliai kiekvieną dieną tobulėja ir anksčiau, nei vėliau, jie pavers mus beverčiais.“

 

Jis paklausė: „Jei turime mašiną, kuri sprendžia problemas žymiai geriau, nei mes, ar matematika nepraranda dalies jos magijos?“

 

Dr. Haireris, 2014 m. laimėjęs Fieldso medalį – prestižiškiausią matematikos apdovanojimą, o 2021 m. – pelningą „Breakthrough“ premiją, savo laiką dalija tarp Šveicarijos federalinio technologijų instituto Lozanoje ir Londono imperatoriškojo koledžo. Atsakydamas studentui, jis pastebėjo, kad daugelis sričių susiduria su dirbtinio intelekto sukelto pasenimo perspektyva.

 

„Manau, kad matematika iš tikrųjų yra gana „saugi“, – sakė dr. Haireris. Jis pažymėjo, kad didelių kalbų modeliai (LLM), pokalbių robotų technologija, dabar gana gerai sprendžia išgalvotas problemas. Tačiau, pasak jo, „nemačiau jokio patikimo pavyzdžio, kad LLM sugalvotų tikrai naują idėją ir (arba) koncepciją.“

 

Dr. Haireris užsiminė apie šį pokalbį, aptardamas naują straipsnį pavadinimu „Pirmasis įrodymas“, kurį jis parašė kartu su keliais matematikais, įskaitant Mohammedą Abouzaidą iš Stanfordo universiteto, Lauren Williams iš Harvardo universiteto ir Tamarą Kolda, kuri vadovauja konsultacijų įmonei „MathSci.ai“ San Francisko įlankos regione.

 

Straipsnyje aprašomas neseniai pradėtas eksperimentas, kurio metu renkami tikri testo klausimai, sudaryti iš autorių nepublikuotų tyrimų, siekiant pateikti prasmingą dirbtinio intelekto matematinių gebėjimų matavimą.”

 

Pagrindiniai „Pirmojo įrodymo“ aspektai:

 

Tikslas: sukurti tikslesnį, prasmingesnį ir griežtesnį dirbtinio intelekto matematinio samprotavimo gebėjimų vertinimo kriterijų, palyginti su standartizuotais duomenų rinkiniais.

Metodika: eksperimente naudojami tikri, nepublikuoti autorių sukurti tyrimo klausimai.

Autoriai: Dr. Haireris (EPFL) šį darbą parašė kartu su Mohammedu Abouzaidu (Stanfordas), Lauren Williams (Harvardas) ir Tamara Kolda (MathSci.ai).

 

Šiomis pastangomis siekiama pašalinti esamų dirbtinio intelekto etalonų apribojimus, testuojant galimybes su naujomis problemomis, o ne duomenimis, su kuriais modeliai jau galėjo susidurti.

 


 

Komentarų nėra: