"Šurmulys, kilęs po "ChatGPT" viešo pristatymo praėjusiais metais, net pagal technologijų naujovių standartus buvo ekstremalus. "OpenAI" natūralios kalbos sistema kuria receptus, rašo kompiuterinį kodą ir parodijuoja literatūrinius stilius. Naujausia jos iteracija netgi gali aprašyti nuotraukas. Ji buvo pasveikinta, kaip technologinis proveržis, prilygstantis spausdinimo mašinai. Tačiau neilgai trukus atsirado ir didžiulių trūkumų. Kartais „haliucinuoja“ ne faktus, kuriuos ištaria visiškai užtikrintai, primygtinai reikalaudama tų melų, kai užklausa tikslinama, bei jam nepavyksta atlikti pagrindinių logikos testų.
Kitaip tariant, ChatGPT nėra bendras dirbtinis intelektas, nepriklausoma mąstymo mašina. Žargonu tai yra didelis kalbos modelis. Tai reiškia, kad jis labai gerai nuspėja, kokie žodžiai dažniausiai seka, išmokęs dirbti su didžiuliu tekstu – jo kūrėjas „OpenAI“ tiksliai nenurodo, iš kur – ir aptinka šablonus.
Tarp ažiotažo lengva pamiršti nedidelį stebuklą. „ChatGPT“ išsprendė problemą, kuri ilgą laiką buvo tolima inžinierių svajonė: sukurti į žmogaus panašią kalbą . Skirtingai nuo ankstesnių sistemos versijų, ji gali ir toliau tai daryti visose pastraipose, nenusileisdama į nenuoseklumą. Ir šio pasiekimo matmenys yra dar didesni, nei atrodo iš pirmo žvilgsnio. „ChatGPT“ gali ne tik sukurti nepaprastai tikrovišką anglų kalbą.
Jis taip pat gali akimirksniu išryškinti tekstą daugiau, nei 50 kalbų – tikslaus skaičiaus, matyt, pati sistema nežino.
Paklaustas (ispanų kalba), kiek kalbų gali kalbėti, „ChatGPT“ neaiškiai atsako „daugiau, nei 50“ ir paaiškina, kad jos gebėjimas kurti tekstą priklausys nuo to, kiek mokymo duomenų bus prieinama bet kuria kalba. Tada uždavus klausimą iš anksto perėjus į portugalų kalbą, pateikiamas jūsų apžvalgininko biografijos eskizas ta kalba. Didžioji dalis buvo teisinga, tačiau nurodyta, kad jis studijavo ne tą dalyką ne tame universitete. Pati kalba buvo nepriekaištinga.
Portugalų kalba yra viena didžiausių pasaulio kalbų. Išbandęs mažesnę kalbą, jūsų apžvalgininkas ištyrė „ChatGPT“ danų kalba, kuria kalba tik apie 5,5 mln. žmonių. Danai didžiąją dalį savo interneto rašo anglų kalba, todėl danų kalbos mokymo duomenys turi būti daug mažesni nei anglų, ispanų ar portugalų kalbų. „ChatGPT“ atsakymai faktiškai buvo iškreipti, bet išreikšti beveik tobula danų kalba. (Nedidelė lyties susitarimo klaida buvo vienintelė klaida, užfiksuota bet kuria iš išbandytų kalbų.)
Iš tiesų, „ChatGPT“ yra per kuklus savo sugebėjimų atžvilgiu. Pagal pageidavimą jis pateikia 51 kalbos, kuria gali dirbti, sąrašą, įskaitant esperanto, kanadų ir zulu. Ji atsisako teigti, kad gali „kalbėti“ šiomis kalbomis, o „generuoja tekstą“ jomis. Tai pernelyg nuolankus atsakymas. Adresuota katalonų kalba (kalba, kurios nėra sąraše), ji ta kalba linksmai atsako: „Taip, aš kalbu katalonų kalba – kuo galiu jums padėti? Keli tolesni klausimai jo nė kiek nesuklumpa, įskaitant užklausą, ar tai tik iš pradžių kita kalba sugeneruotų atsakymų vertimas į katalonų kalbą. ChatGPT tai neigia: „Aš neverčiu iš jokios kitos kalbos; savo duomenų bazėje ieškau geriausių žodžių ir frazių, kad atsakyčiau į jūsų klausimus“.
Kas žino, ar tai tiesa? ChatGPT ne tik sugalvoja dalykus, bet ir neteisingai atsako į klausimus apie patį pokalbį. (Jis neturi „atminties“, o sugrąžina paskutinius kelis tūkstančius kiekvieno pokalbio žodžių kaip naują raginimą. Jei jau kurį laiką kalbėjote angliškai, jis „pamirš“, kad anksčiau uždavėte klausimą danų kalba ir pasakys, kad klausimas buvo užduotas anglų kalba.) ChatGPT yra nepatikimas ne tik pasauliui, bet net pačiam sau.
Tai neturėtų užgožti modelio, kuris gali be vargo imituoti tiek daug kalbų, įskaitant tas, kurių mokymo duomenys yra riboti, pasiekimo. Mažesnėmis kalbomis kalbantys, asmenys jau daugelį metų nerimauja dėl kalbos technologijų, kurios juos praeina. Jų pagrįstą susirūpinimą lėmė dvi priežastys: mažesnė paskata įmonėms kurti produktus islandų arba maltiečių kalba ir santykinis duomenų trūkumas jomis apmokyti.
Panašu, kad ChatGPT kūrėjai tokias problemas kažkaip įveikė. Dar per anksti pasakyti, kuo ši technologija duos naudos, tačiau vien tai duoda pagrindą nusiteikti optimistiškai. Tobulėjant mašininio mokymosi technologijoms, jiems gali nereikėti didžiulių išteklių – programavimo laiko ar duomenų, kurie tradiciškai laikomi būtini, siekiant užtikrinti, kad internete nebūtų pamirštamos mažesnės kalbos." [1]
1. "ChatGPT is a marvel of multilingualism." The Economist, 29 Mar. 2023, p. NA.