„Nepaisant trumpo investuotojų abejonių, didelių technologijų įmonių, nacionalinių vyriausybių ir rizikos kapitalistų pinigai į dirbtinį intelektą (AI) plūsta precedento neturinčiu lygiu. Norint suprasti kodėl, tai padeda įvertinti, kaip keičiasi pats AI.
Ši technologija pereina nuo įprastų didelių kalbų modelių ir prie samprotavimo modelių bei AI agentų.
Įprastų didelių kalbų modelių mokymas, su kuriais susidūrėte daugumos AI pokalbių robotų nemokamose versijose, reikalauja daug galios ir skaičiavimo laiko. Tačiau greitai sugalvojame būdus, kaip sumažinti išteklių, kurių jiems reikia, kiekį, kai žmogus kreipiasi į juos.
Didelių kalbų modeliais paremti samprotavimo modeliai skiriasi tuo, kad jų realiam veikimui sunaudojama daug kartų daugiau išteklių – tiek mikroschemų, tiek elektros energijos atžvilgiu.
Nuo tada, kai rugsėjį OpenAI peržiūrėjo savo pirmąjį samprotavimo modelį, pavadintą o1, dirbtinio intelekto įmonės skuba išleisti sistemas, kurios gali konkuruoti. Tai apima DeepSeek R1, kuris šių metų pradžioje sukrėtė dirbtinio intelekto pasaulį ir daugelio technologijų ir energijos įmonių vertinimus, ir Elono Musko xAI, kuris ką tik debiutavo savo Grok 3 samprotavimo modeliu.
„DeepSeek“ sukėlė tam tikrą paniką, nes parodė, kad dirbtinio intelekto modelis gali būti apmokytas už dalį kitų modelių kainos, o tai gali sumažinti duomenų centrų ir brangių pažangių lustų paklausą. Tačiau tai, ką iš tikrųjų padarė „DeepSeek“, dar labiau pastūmėjo dirbtinio intelekto pramonę prie daug išteklių reikalaujančių samprotavimo modelių, o tai reiškia, kad skaičiavimo infrastruktūra vis dar labai reikalinga.
Dėl savo patobulintų galimybių šios samprotavimo sistemos, greičiausiai, taps numatytuoju būdu, kuriuo žmonės naudoja dirbtinį intelektą daugeliui užduočių. „OpenAI“ generalinis direktorius Samas Altmanas sakė, kad kitas didelis jo įmonės AI modelio atnaujinimas apims pažangias argumentavimo galimybes.
Kodėl samprotavimo modeliams – ir produktams, kurių dalis jie yra, pavyzdžiui, „giliųjų tyrimų“ įrankiams ir AI agentams – reikia tiek daugiau galios? Atsakymas slypi tame, kaip jie veikia.
AI samprotavimo modeliai gali lengvai naudoti daugiau, nei 100 kartų, daugiau skaičiavimo išteklių, nei įprasti dideli kalbų modeliai, neseniai paskelbtame tinklaraščio įraše rašė „Nvidia“ AI produktų valdymo viceprezidentas Kari Briski. Šis daugiklis gaunamas iš samprotavimo modelių, praleidžiančių minutes ar net valandas, besikalbant su savimi (ne visa tai vartotojas mato), ilgoje „minčių grandinėje“. Modelio naudojamų skaičiavimo resursų kiekis yra proporcingas sugeneruotų žodžių skaičiui, todėl samprotavimo modelis, sugeneruojantis 100 kartų daugiau žodžių, atsakant į klausimą, sunaudos tiek daugiau elektros ir kitų išteklių.
Kai samprotavimo modeliai prisijungia prie interneto, reikalai gali imti dar daugiau išteklių, kaip tai daro „Google“, „OpenAI“ ir „Perplexity“ „gilaus tyrimo“ modeliai.
Šie skaičiavimo galios reikalavimai yra tik pradžia. Tai atspindi, „Google“, „Microsoft“ ir „Meta Platforms“ 2025 m. bendrai planuoja išleisti mažiausiai 215 mlrd. dolerių kapitalo išlaidoms – didžiąją dalį AI duomenų centrams.
Norėdami parodyti būsimos AI paklausos prognozes, galime išdėstyti paprastą lygtį.
Pirmoji mūsų lygties reikšmė yra skaičiavimo išteklių, reikalingų vienam informacijos tokenui apdoroti su dirbtiniu intelektu, pavyzdžiui, ChatGPT, kiekis.
Sausio mėn. pasirodė, kad kaina už tokeną – tiek skaičiavimo galia, tiek doleriais – sumažės, kai bus išleistas Kinijos dirbtinio intelekto modelis „DeepSeek R1“. „DeepSeek“ su pridedamu dokumentu parodė, kad dirbtinį intelektą galima mokyti ir pristatyti tokiu būdu, kuris yra žymiai efektyvesnis, nei anksčiau aprašyti Amerikos AI laboratorijų metodai.
Iš pirmo žvilgsnio tai rodo, kad dirbtinio intelekto skaičiavimo galios poreikis ateityje sudarys tam tikrą dalį jos dabartinės sumos – tarkime, dešimtadalį ar net mažiau. Tačiau išaugusi samprotavimo modelių paklausa, kai jie atsako į užklausas, gali tai daugiau, nei kompensuoti.
Pažvelgus paprasčiausiu būdu, jei nauji, efektyvesni AI modeliai, pagrįsti įžvalgomis, kurios buvo gautos, naudojant DeepSeek, DI skaičiavimo galios poreikį, sumažina dešimtadaliu, tačiau samprotavimo modeliai tampa standartu ir padidina tų modelių paklausą 100 kartų, tai vis tiek 10 kartų padidės AI energijos poreikis ateityje.
Tai tik išeities taškas. Verslui atrandant, kad naujieji dirbtinio intelekto modeliai yra galingesni, jis vis dažniau kreipiasi į juos. Tai perkelia skaičiavimo pajėgumų poreikį nuo mokymo modelių prie jų naudojimo – arba tai, kas vadinama „išvada“ AI pramonėje.
Tuhinas Srivastava, „Baseten“, teikiančios dirbtinio intelekto išteklius kitoms įmonėms, generalinis direktorius sako, kad šis pokytis link išvadų jau gerokai pasistūmė.
Jo klientus sudaro technologijų įmonės, kurios savo programose ir paslaugose naudoja dirbtinį intelektą, pvz., „Descript“, leidžiančią turinio kūrėjams redaguoti garsą ir vaizdo įrašus tiesiai iš įrašo nuorašo, ir „PicnicHealth“, paleisties, apdorojančios medicininius įrašus. Baseten klientai pastebi, kad jiems reikia daugiau dirbtinio intelekto apdorojimo galios, nes sparčiai auga jų pačių gaminių paklausa, sako Srivastava.
„Prieš šešis mėnesius vieno kliento išlaidas sumažinome turbūt 60 proc., o per tris mėnesius jie jau suvartojo daugiau, nei iš pradžių“, – priduria jis.
Visos didžiosios dirbtinio intelekto laboratorijos tokiose kompanijose, kaip OpenAI, Google ir Meta vis dar stengiasi tobulinti, viena daugiau už kitą, mokydamos, vis daugiau galinčių, dirbtinio intelekto modelių. Nepriklausomai nuo kainos, prizas yra užvaldyti kuo daugiau, dar besiformuojančios, AI rinkos.
„Manau, kad visiškai įmanoma, kad priešakinės laboratorijos turi nuolat kaupti stulbinančias pinigų sumas, kad galėtų stumti ribą į priekį“, – sako Chrisas Tayloras, Fractional AI, San Franciske įsikūrusio startuolio, padedančio kitoms programinės įrangos įmonėms kurti ir integruoti pritaikytas AI, generalinis direktorius. Jo įmonė, kaip ir Baseten bei daugelis kitų klestinčioje AI ekosistemoje, remiasi tais pažangiausiais modeliais, kad pasiektų rezultatus savo klientams.
Per ateinančius porą metų naujos naujovės ir daugiau AI būdingų mikroschemų gali reikšti, kad sistemos, kurios AI galutiniams klientams pristatomos, bus 1000 kartų efektyvesnės, nei šiandien, sako Tomasz Tunguz, rizikos kapitalistas ir Theory Ventures įkūrėjas. Jis priduria, kad investuotojai ir didelės technologijų įmonės lažinasi, kad per ateinantį dešimtmetį dirbtinio intelekto modelių paklausa gali padidėti trilijonu ar daugiau dėl motyvuotų modelių ir greito pritaikymo.
„Kiekvienas klaviatūros klavišo paspaudimas arba kiekviena fonema, kurią ištariate į mikrofoną, bus transkribuota arba manipuliuojama bent vieno AI“, – sako Tunguzas. Ir jei taip yra, priduria jis, dirbtinio intelekto rinka netrukus gali būti 1000 kartų didesnė, nei dabar.“ [1]
1. EXCHANGE --- Keywords: Why AI Spending Isn't Going to Slow Down --- Soaring demand for reasoning models will consume electricity, microchips and data-center real estate for the foreseeable future. Mims, Christopher. Wall Street Journal, Eastern edition; New York, N.Y.. 22 Feb 2025: B2.
Komentarų nėra:
Rašyti komentarą