Sekėjai

Ieškoti šiame dienoraštyje

2025 m. sausio 27 d., pirmadienis

Kinijos namų darbo dirbtinis intelektas „DeepSeek“ pritrenkia Silicio slėnį


 „SINGAPŪRAS – Kinijos dirbtinio intelekto (AI) įmonė Silicio slėnį stebina, kaip jos programuotojai beveik prilygo amerikiečių konkurentams, nors naudojo prastesnius lustus.

 

 Remiantis populiariu reitingu, Kinijos bendrovės „DeepSeek“ dirbtinio intelekto modeliai pateko į 10 geriausių pasaulyje, o tai rodo, kad Vašingtono eksporto apribojimai sunkiai blokuoja sparčią Kinijos pažangą.

 

 Sausio 20 d. DeepSeek pristatė R1 – specializuotą modelį, skirtą sudėtingoms problemoms spręsti.

 

 „Deepseek R1“ yra vienas nuostabiausių ir įspūdingiausių proveržių, kokį aš kada nors mačiau“, – penktadienį X poste sakė Silicio slėnio rizikos kapitalistas Marcas Andreessenas, patarinėjęs prezidentui Trumpui.

 

 „DeepSeek“ plėtrai vadovavo Kinijos rizikos draudimo fondo valdytojas Liangas Wenfengas, kuris tapo šalies dirbtinio intelekto skatinimo veidu. Sausio 20 d. Liangas susitiko su Kinijos premjeru ir aptarė, kaip vietinės įmonės galėtų sumažinti atotrūkį nuo JAV.

 

 Specialistai teigė, kad „DeepSeek“ technologija vis dar atsilieka nuo „OpenAI“ ir „Google“. Tačiau ji yra artima varžovė, nepaisant to, kad naudoja mažiau pažangių lustų, o kai kuriais atvejais praleidžia veiksmus, kuriuos JAV kūrėjai laikė esminiais.

 

 „DeepSeek“ teigė, kad vieno iš naujausių modelių mokymas kainavo 5,6 mln. dolerių, palyginti su 100–1 mlrd. dolerių pernai modelio kūrimo sąnaudomis, kurias AI kūrėjo „Anthropic“ vadovas Dario Amodei nurodė.

 

 Barrettas Woodside'as, vienas iš San Francisko AI techninės įrangos įmonės „Positron“ įkūrėjų, sakė, kad jis ir jo kolegos buvo susirūpinę dėl „DeepSeek“. „Tai labai šaunu“, – sakė Woodside'as, nurodydamas „DeepSeek“ atvirojo kodo modelius, kuriuose AI modelio programinės įrangos kodas yra prieinamas nemokamai.

 

 Naujausio „DeepSeek“ pavyzdinio modelio, pavadinto V3, išleisto gruodį, vartotojai pastebėjo, kad jis atsisako atsakyti į jautrius politinius klausimus apie Kiniją ir lyderį Xi Jinpingą. Kai kuriais atvejais produktas pateikia atsakymus pagal oficialią Pekino propagandą, o ne į vyriausybės kritikų požiūrį, kaip tai daro ChatGPT.

 

 „Vienintelis smūgis prieš jį yra tam tikra KLR cenzūra“, – sakė Woodside'as, turėdamas omenyje Kinijos Liaudies Respubliką, tačiau jis teigė, kad tai gali būti pašalinta, nes kiti kūrėjai gali laisvai keisti kodą.

 

 „DeepSeek“ teigė, kad R1 ir V3 veikė geriau, nei pirmaujantys Vakarų modeliai arba beveik taip pat. Nuo šeštadienio jiedu pateko į 10 geriausių „Chatbot Arena“, platformoje, kurią valdo Kalifornijos universiteto Berklis tyrėjai, vertinantys pokalbių robotų našumą. „Google Gemini“ modelis užėmė aukščiausią vietą, o „DeepSeek“ aplenkė „Anthropic“ Claude'ą ir Groką iš Elono Musko xAI.

 

 „DeepSeek“ išaugo iš „High-Flyer“ AI tyrimų padalinio, rizikos draudimo fondo valdytojo, turinčio 8 mlrd. dolerių.

 

 "Kai žmonės priima investicinius sprendimus, tai yra menas, ir jie tai daro tiesiog nuo kelnių sėdynės. Kai kompiuterinės programos priima tokius sprendimus, tai yra mokslas, ir jis turi optimalų sprendimą", - sakė Liangas 2019 m.

 

 1985 m. gimęs Liangas užaugo Guangdongo provincijoje ir specializuojasi mašininio matymo srityje prestižiniame Kinijos Džedziango universitete. Jis su dviem kolegijos draugais įkūrė „High-Flyer“ 2015 m.

 

 Pasak jam artimų žmonių, Liangas labiau mėgsta būti laikomas inžinieriumi, o ne prekybininku. „High-Flyer“ buvo pradininkas Kinijoje, pritaikant gilų mokymąsi kompiuterinėje prekyboje. Ši technika, sukurta pagal žmogaus smegenų modelį, leidžia kompiuteriams analizuoti įvairesnių tipų duomenis.

 

 Nors „DeepSeek“ pavyzdinis modelis yra nemokamas, bendrovė apmokestina vartotojus, kad jie prijungtų jų programas prie „DeepSeek“ modelio ir skaičiavimo infrastruktūros. Pavyzdys yra įmonė, kuri nori pasinaudoti technologija, kad pateiktų AI atsakymus į klientų užklausas.

 

 Praėjusių metų pradžioje „DeepSeek“ sumažino šios paslaugos kainas iki dalies to, ką taiko kiti pardavėjai, todėl Kinijoje kilo kainų kova.

 

 Anthony Poo, Silicio slėnyje įsikūrusio startuolio, naudojančio generatyvųjį dirbtinį intelektą finansinei grąžai prognozuoti, įkūrėjas, sakė, kad jo įmonė rugsėjį perėjo į DeepSeek iš Anthropic's Claude. Testai parodė panašų našumą už maždaug ketvirtadalį išlaidų.

 

 „OpenAI modelis yra geriausias savo našumu, bet mes taip pat nenorime mokėti už mums nereikalingus pajėgumus“, - sakė Poo.

 

 Sausio 20 d. susitikime DeepSeek's Liang Kinijos premjerui Li Qiangui pasakė, kad nors Kinijos įmonės stengėsi pasivyti, Amerikos apribojimai pažangių lustų eksportui į Kiniją vis dar yra kliūtis, pasak žmonių, susipažinusių su susitikimu.

 

 2019 m. „High-Flyer“ pradėjo kurti lustų grupę dirbtinio intelekto tyrimams, iš dalies su lėšomis, gautomis iš jos finansų verslo. Bendrovė teigė vėliau sukūrusi didesnę, maždaug 10 000 „Nvidia“ grafikos apdorojimo įrenginių grupę, kuri gali būti naudojama didelių kalbos modeliams mokymui.

 

 Tik nedaugelis Kinijos įmonių turėjo pakankamai galingą skaičiavimo infrastruktūrą, kad galėtų sukurti tokius modelius iki 2022 m. pabaigos, kai „OpenAI“ išleido „ChatGPT“.

 

 „DeepSeek“ techninėje ataskaitoje teigė, kad naudojo daugiau, nei 2000 „Nvidia“ lustų, kad apmokytų savo V3 modelį, palyginti su dešimtimis tūkstančių kitų panašaus dydžio modelių mokymui.

 

 Keletas JAV AI specialistų neseniai suabejojo, ar „High-Flyer“ ir „DeepSeek“ naudojasi daugiau skaičiavimo galios, nei buvo paskelbta.

 

 Kai kurie išorės tyrinėtojai teigė, kad „DeepSeek“ modeliui trūksta tam tikrų brangiau apmokytų konkurentų galimybių, pavyzdžiui, sekti ilgų pokalbių kontekstą.

 

 Savo naujausiame samprotavimo modelyje, išleistame sausio 20 d., „DeepSeek“ praleido procesą, vadinamą prižiūrimu koregavimu, kurio metu programuotojai naudojasi žmonių ekspertų žiniomis, kad suteiktų modeliui pranašumą. „DeepSeek“ teigė, kad jos modelis, sukurtas sudėtingoms pasaulio problemoms matematikoje ir panašiems iššūkiams spręsti, buvo panašus į „OpenAI“ samprotavimo modelį o1, nors jame buvo praleistas prižiūrimas koregavimas ir dėmesys buvo sutelktas į mokymąsi su sustiprinimu, iš esmės nukreipiamus bandymus ir klaidas.

 

 Jimas Fanas, vyresnysis „Nvidia“ mokslo darbuotojas, „DeepSeek“ dokumente, kuriame pranešama apie rezultatus, gyrė, kaip proveržį. Jis sakė X, kad tai jam priminė ankstesnes novatoriškas AI programas, kurios įvaldė stalo žaidimus, tokius, kaip šachmatai, „nuo nulio, pirmiausia nemėgdžiodami žmonių didmeistrių“.

 

 Zackas Kassas, buvęs OpenAI vadovas, sakė, kad DeepSeek pažanga, nepaisant JAV apribojimų „pabrėžia platesnę pamoką: išteklių apribojimai dažnai skatina kūrybiškumą.“ [1]

 

1. China's Homemade AI Wows Silicon Valley. Huang, Raffaele.  Wall Street Journal, Eastern edition; New York, N.Y.. 27 Jan 2025: B1.

Komentarų nėra: