„Šiuolaikinio DI centre slypi paradoksas: sudėtingi modeliai, kuriuos įmonės naudoja realiam darbui atlikti ir darbuotojų skaičiui sumažinti, nesulaukia viso dėmesio.
Vis galingesni samprotavimo modeliai ir toliau patenka į antraštes dėl kognityvinių rekordų gerinimo. Jie išlaiko teisinius ir medicininius licencijavimo egzaminus bei laimi matematikos olimpiadas. Didžiųjų dirbtinio intelekto laboratorijų vadovai – nuo „OpenAI“ Samo Altmano ir „Anthropic“ Dario Amodei iki Demiso Hassabio, iš „Google“ priklausančios, „DeepMind“ ir Elono Musko iš „xAI“ – kalba apie „DBI“, dirbtinio bendrojo intelekto, ateitį, kurioje DI yra tokie pat protingi, kaip ir žmonės.
Tariama, kad šie DI megaprotai yra tie, kurie atims visas mūsų darbo vietas.
Tačiau kai kalbatės su įmonių, kurios šiuo metu kasdien pasikliauja DI, vadovais, išgirstate kitokią istoriją.
Didžiajai daugumai užduočių, laimi ne didžiausi ir protingiausi dirbtinio intelekto modeliai, o paprasčiausi. Šie neišgarsėję dirbtinio intelekto herojai, kurie iš tikrųjų transformuoja verslo procesus ir darbo jėgą, taip pat yra mažiausi, greičiausi ir pigiausi.
„Realybė tokia, kad daugeliui operacijų, kurioms šiandien reikia skaičiavimo, mums nereikia didelių kalbų modelių“, – sako Kyle'as Lo, mokslininkas, kuriantis atvirojo kodo didelius kalbų modelius, ne pelno siekiančiame, Alleno dirbtinio intelekto institute.
Dirbtiniu intelektu paremtos, įmonės sėkmingai kuria savo programinę įrangą ir paslaugas labiau, kaip dirbtinio intelekto konvejerį: informacija patenka į vieną galą, o duomenys, veiksmai ar produktai išeina iš kito. Tarp jų daug mažesnių, paprastesnių, labiau specializuotų, greitesnių ir pigesnių dirbtinio intelekto atstovų atlieka visą darbą.
Įmonės, kurioms reikia atlikti realų darbą su vadinamaisiais dirbtinio intelekto agentais dideliu mastu, pastebi, kad „maži kalbų modeliai“ yra daugiau, nei pakankamai geri, kad jį atliktų. Be to, įmonės supranta, kad neturi kito pasirinkimo, kaip tik naudoti šiuos mažus kalbų modelius, nes jie yra labiau prieinami, o kai kuriais atvejais geriau tinka užduotims po ranka.
Štai kaip kuriama agentinio DI ateitis, pagal vieną darbo eigą.
Gali atrodyti, kad DI valdomos sistemos tampa vis pajėgesnės, nes pagrindiniai DI modeliai tampa išmanesni. Didžiausi DI modeliai neabejotinai tobulėja.
Tačiau daugeliu atvejų tiesa apie įmonių produktyvumo augimą yra ta, kad DI poveikis konkurencingumui, darbo vietoms ir panašiai, yra žmonių inžinierių gebėjimo sujungti mažesnius, paprastesnius DI rezultatas.
„Aurelian“ yra Sietle įsikūręs startuolis, kuris naudoja generatyvinį DI, kad automatizuotų atsakymus į neskubius skambučius į 911 centrus. Niujorke įsikūrusi „Hark Audio“ naudoja DI, kad atpažintų, įrašytų ir surinktų įsimintinas akimirkas iš maždaug pusės milijono aktyvių pasaulio tinklalaidžių. San Franciske „Gong“ naudoja DI, kad nuskaitytų ir suvirškintų kiekvieną skambutį, kurį kada nors įrašė jos klientų pardavimų atstovai, kad padėtų jiems parduoti daugiau.
O „Airbnb“ naudoja DI, įskaitant atvirojo kodo modelius iš Kinijos „Alibaba“, kad automatiškai išspręstų didelę dalį klientų aptarnavimo problemų greičiau, nei jos žmonės - atstovai.
Net „Meta“ naudoja mažus DI modelius šioje srityje. Naujausiame pajamų skelbimo pokalbyje finansų vadovė Susan Li teigė, kad teikdama reklamas bendrovė nenaudoja didžiausių dirbtinio intelekto modelių, „nes dėl jų dydžio ir sudėtingumo tai pernelyg brangu“. Vietoj to, „Meta“ naudoja didelius modelius, kad perduotų reikiamas žinias apie reklamų taikymą mažesniems, lengvesniems, specializuotiems modeliams, kurie naudojami gamyboje.
Visas šias bendroves vienija tai, kad jos sukūrė vidines žinių gamyklas, kurios sujungia mažus, paprastus ir greitus dirbtinius intelektus.
Gamykloje gaminiai keliauja konvejerio juosta, o darbuotojai juos pakeliui koreguoja. Tai, ką galima pavadinti dirbtinio intelekto žinių gamykla, duomenų dalys teka įprastos programinės įrangos vamzdynais ir yra perduodamos iš vieno paprasto dirbtinio intelekto kitam, o kiekvienas iš jų juos keičia, rūšiuoja ar transformuoja.
Šioje analogijoje konvejerio juosta sudaryta iš įprastos programinės įrangos – tų patikrintų ir esamų duomenų perdavimo kelių, kuriuos daugelis įmonių sukūrė per daugelį metų ar net dešimtmečius. O darbuotojai palei konvejerio juostą yra dirbtinio intelekto įrankiai, veikiantys mažų kalbos modelių pagrindu.
Naujausiame straipsnyje „Nvidia“ ir Džordžijos technologijos instituto tyrėjų grupė teigia, kad dirbtinio intelekto agentų (tokių. kaip mūsų konvejerio darbuotojai) atsiradimas „atveria daugybę programų, kuriose kalbos modeliai atlieka nedidelį skaičių specializuotų užduočių pakartotinai ir su nedideliais skirtumais“.
Jie rašė, kad maži kalbos modeliai yra „pakankamai galingi, iš esmės tinkamesni ir ypač ekonomiškesni“ tokiam darbui.
„Gong“ įkūrėjas Eilonas Reshefas teigia, kad jo klientai, tarp kurių yra „Google“ ir „Cisco“, gali užduoti pokalbių metu dirbtiniam intelektui tokius klausimus, kaip „Kodėl prarandu sandorius?“
Norėdama atsakyti, „Gong“ naudoja brangesnių, pažangesnių ir mažesnių, pigesnių dirbtinio intelekto įrankių derinį. Jos sistemos sunkesnes užduotis priskiria pažangesniems modeliams. Įsivaizduokite tai, kaip vadovą, deleguojantį užduotis darbuotojams, turintiems skirtingą kompetencijos lygį.
„Gong“ programinė įranga paprastai pradeda, siųsdama vartotojo klausimą – šiuo atveju „Kodėl mažėja mano pardavimai?“ – vienam iš „išmaniųjų“ dirbtinio intelekto modelių, tokių, kaip „Anthropic“ arba „OpenAI“.
Pradiniame raginime pateikiamas prašymas dirbtiniam intelektui parengti bendrą planą, kaip atsakyti į klausimą. Kadangi šie išmanieji modeliai yra brangūs ir užtrunka ilgiau, „galvodami“ apie klausimus, „Gong“ juos naudoja kuo mažiau.
Kai didžiausias iš didelių kalbos modelių pateikia aukšto lygio planą, „Gong“ programinės įrangos kanalas atgyja. Pirmiausia jis peržiūri dešimtis tūkstančių įrašytų pardavimo skambučių su klientais. Tada „Gong“ naudoja mažesnius kalbos modelius, kad apibendrintų tos paieškos metu rastus pokalbius. Toliau kitas kalbos modelis gali nuskaityti šias santraukas.
Šio proceso pabaigoje visi šie duomenys grąžinami vienam iš išmanių, lėtų ir brangių dirbtinių intelektų (DI), kuris juos paverčia ataskaita. Šioje ataskaitoje, kurios paruošimui paprastai, išmaniam žmogui dirbant, reikėtų praleisti šimtus valandų, aprašoma, kas veikia, o kas ne, visuose įmonės pardavimo skambučiuose.
Didžiausių ir sudėtingiausių modelių bei mažiausių ir pigiausių modelių kainų skirtumas yra didžiulis. Remiantis pramonės standarto svertiniu vidurkiu, mažiausias ir greičiausias „OpenAI“ modelis „GPT-5 Nano“ kainuoja apie 10 centų už milijoną žetonų, o visavertis ir sudėtingesnis „GPT-5“ kainuoja apie 3,44 USD už milijoną žetonų. Žetonai yra pagrindiniai teksto vienetai, kuriuos apdoroja DI.
Be to, dideli modeliai kartais gali sunaudoti tūkstančius kartų daugiau žetonų užduočiai atlikti, nes jie juos sudegina vidiniame monologe, kurį naudoja atsakymui pagrįsti.
Visose įmonėse, su kuriomis kalbėjau apie mažų modelių naudojimą, pastebimas nepaprastas jų sistemų struktūros nuoseklumas. Tai rodo, kad yra tik tam tikras skaičius būdų, kaip sukurti dirbtinio intelekto agentus, kurie iš tikrųjų ir nuosekliai veiktų – ir kad beveik visi jie apima mažus kalbų modelius.“ [1]
1. EXCHANGE --- Keywords: Large Language Models Get the Hype. Small Models Do the Real Work. --- Fast, cheap, relatively simple AI models are the unsung heroes that are transforming many workplaces. Mims, Christopher. Wall Street Journal, Eastern edition; New York, N.Y.. 01 Nov 2025: B2.
Komentarų nėra:
Rašyti komentarą