"SINGAPŪRAS. Paimkite jaunų kinų inžinierių komandą, kurią pasamdė viršininkas, niekinantis patirtį. Pridėkite keletą protingų programavimo sparčiųjų manevrų ir JAV taisyklių spragą, leidžiančią jiems gauti pažangius lustus.
Būtent tokią formulę Kinijos „DeepSeek“ naudojo, kad šokiruotų pasaulį savo dirbtinio intelekto (AI) programomis.
Įprastas mąstymas manė, kad, kuriant pirmaujančią dirbtinį intelektą reikia daugybės brangių, pažangiausių kompiuterių lustų, o Kinijos įmonėms kiltų problemų konkuruoti, nes jos negalėtų gauti tų lustų. „DeepSeek“ išradingai nepaisė šios prognozės, dėl ko Volstryte nusiaubė 1 trilijoną dolerių, ir paskatino Silicio slėnį permąstyti savo požiūrį.
Pasak prezidento Trumpo, Kinijos bendrovė pažadino Vašingtoną. Jo administracija artimiausiais mėnesiais nuspręs, ką daryti dėl Bideno eros politikos, ribojančios Kinijos prieigą prie geriausių dirbtinio intelekto lustų.
„DeepSeek“ lyderis Liang Wenfeng įkūrė savo įmonę Hangdžou technologijų centre, tame pačiame mieste, kuriame yra technologijų milžinė „Alibaba“. AI įmonė išaugo iš rizikos draudimo fondo, kurį bendrai įkūrė Liangas, kuris naudoja dirbtinį intelektą pelningiems sandoriams finansų rinkose rasti.
Duodamas interviu vienam Kinijos leidiniui 2023 m., Liangas teigė, kad daugumą techninių pareigybių užima ką tik baigę absolventai arba žmonės, turintys vienerių ar dvejų metų patirtį.
Patirtis, pasak jo, buvo galima kliūtis. „Kai ką nors darydami, patyrę žmonės nedvejodami pasakys, kad reikia daryti taip, o nepatyrę žmonės turės ne kartą tyrinėti ir rimtai galvoti, kaip tai padaryti, o tada rasti sprendimą, atitinkantį esamą faktinę situaciją, Liang pasakė.
Tai, ką jie sugalvojo, dabar tiria Silicio slėnio geriausi ir ryškiausi.
Dar visai neseniai novatoriški AI modeliai, kurie yra už tokių program, kaip „OpenAI ChatGPT“, buvo mokomi dėl daugybės teksto, vaizdų ir kitų duomenų rinkinio. Jie naudojo specializuotus algoritmus, kad surastų modelius, kuriuos pokalbių robotas galėtų naudoti pokalbiui palaikyti.
„DeepSeek“ taktika buvo sumažinti duomenų apdorojimą, reikalingą modeliams parengti, naudojant kai kuriuos savo išradimus ir metodus, kuriuos priėmė panašiai suvaržytos Kinijos AI įmonės.
Įsivaizduokite ankstesnes ChatGPT versijas kaip bibliotekininką, perskaičiusį visas bibliotekoje esančias knygas, sakė Lennartas Heimas, tyrinėjantis dirbtinį intelektą tyrimų centre „Rand“. Kai užduodamas klausimas, jis pateikia atsakymą pagal daugybę perskaitytų knygų.
Šis procesas yra daug laiko ir brangus. Norint skaityti tas knygas, reikia elektros ištroškusių kompiuterių lustų.
DeepSeek pasirinko kitą požiūrį. Jos bibliotekininkas neperskaitė visų knygų, bet yra išmokytas surasti tinkamą knygą, kad gautų atsakymą, kai jam užduotas klausimas.
Sluoksniuota ant to yra kita technika, vadinama „ekspertų mišiniu“.
Užuot bandę surasti bibliotekininką, galintį atsakyti į klausimus bet kuria tema, „DeepSeek“ ir kai kurie kiti dirbtinio intelekto kūrėjai daro kažką panašaus į klausimų delegavimą konkrečių sričių, pvz., grožinės literatūros, periodinių leidinių ir kulinarijos, ekspertų sąrašui. Kiekvienam ekspertui reikia mažiau mokymų, todėl sumažėja lustų poreikis atlikti viską iš karto.
DeepSeek metodas reikalauja mažiau laiko ir galios, prieš užduodant klausimą, tačiau atsakant sunaudojama daugiau laiko ir energijos. Atsižvelgiant į viską, Heimas sakė, kad „DeepSeek“ spartieji klavišai padeda mokyti dirbtinį intelektą už nedidelę konkuruojančių modelių kainą.
„Inžinerija yra apie suvaržymus“, – X. rašė buvęs „Intel“ vadovas Patas Gelsingeris. „Kinijos inžinieriai turėjo ribotus išteklius ir jie turėjo rasti kūrybiškų sprendimų.
Išradingumas paaiškina tik dalį „DeepSeek“ sėkmės.
Kita dalis yra sudėtingas JAV eksporto kontrolės įvedimas, dėl kurio „DeepSeek“ galėjo įsigyti galingų amerikietiškų lustų.
Bideno administracija 2022 metais pradėjo kontroliuoti, į Kiniją eksportuojamus, lustus. JAV bendrovės, kurios norėjo parduoti Kinijai, pirmiausia, turėjo sumažinti lusto funkciją, vadinamą interconnect bandwidth, kuri nurodo duomenų perdavimo greitį.
Reaguodama į tai, „Nvidia“, pasaulyje pirmaujanti dirbtinio intelekto lustų kūrėja, pasiūlė Kinijai naują produktą, kuris atitiko šį parametrą, tačiau kompensavo jį kitais būdais, išlaikydamas aukštą našumą. Taip atsirado lustas, kuris, pasak kai kurių analitikų, buvo beveik toks pat galingas, kaip tuo metu geriausias Nvidia lustas.
JAV pareigūnai viešai ir privačiai išreiškė, kad nors „Nvidia“ nepažeidė įstatymo, tačiau pažeidė jo dvasią. Vyriausybė tikėjosi, kad pramonės lyderiai bendradarbiaus, kurdami veiksmingą greitai kintančių technologijų eksporto kontrolę, sakė buvęs aukštas Bideno administracijos pareigūnas.
„Nvidia“ atstovas pirmadienį sakė, kad „DeepSeek yra puiki dirbtinio intelekto pažanga“, pademonstravus naujovišką AI techniką, naudojant skaičiavimo galią, „kuri yra visiškai eksportui leistina”.
Praėjus metams po pradinės kontrolės, vyriausybė sugriežtino taisykles. Vis dėlto „DeepSeek“ turėjo maždaug metus laiko įsigyti galingą „Nvidia“ Kinijos rinkos lustą, vadinamą H800. Gruodį paskelbtame moksliniame darbe „DeepSeek“ teigė, kad naudojo 2 048 šiuos lustus, kad apmokytų vieną iš savo AI modelių.
Nuo tada, kai taisyklės buvo peržiūrėtos 2023 m., „Nvidia“ sukūrė naują su eksporto kontrole suderinamą lustą, skirtą Kinijai, kuris yra žymiai mažesnis, nei H800.
Kai kurie JAV AI pramonės lyderiai skeptiškai vertina tai, kad „DeepSeek“ atskleidė visas savo paslaptis. Jie teigė, kad Kinijos mokslininkai galėjo sukaupti pažangiausių „Nvidia“ lustų atsargas prieš JAV apribojimus arba naudoti sprendimus, pvz., prieigą prie „Nvidia“ įgalintos skaičiavimo galios iš šalių, esančių už JAV ir Kinijos ribų. Bideno administracija paskutinėmis dienomis įgyvendino naujas taisykles, skirtas tokioms akloms zonoms pašalinti.
„DeepSeek“ neatsakė į prašymus komentuoti. [1]
1. DeepSeek Used Bevy of Tactics To Outfox U.S. --- AI startup relied on inexperienced engineers, loophole in export controls. Woo, Stu; Huang, Raffaele. Wall Street Journal, Eastern edition; New York, N.Y.. 29 Jan 2025: A1.
Komentarų nėra:
Rašyti komentarą