Sekėjai

Ieškoti šiame dienoraštyje

2025 m. sausio 23 d., ketvirtadienis

Kinų atvirojo kodo generuojantis dirbtinis intelektas yra geras ir pigesnis naudoti


 „Kinų bendrovė sukūrė pigesnį, konkurencingą pokalbių robotą su mažiau aukščiausios klasės kompiuterių lustų, nei JAV behemotai, tokie, kaip Google ir OpenAI, parodant lustų eksporto kontrolės ribas.

 

 Kitą dieną po Kalėdų nedidelis Kinijos startuolis „DeepSeek“ pristatė naują dirbtinio intelekto (A.I.) sistemą, kuri atitiktų pažangiausių pokalbių robotų iš tokių kompanijų, kaip OpenAI ir Google galimybes.

 

 Vien tai būtų buvęs svarbus etapas.

 

 Tačiau sistemos komanda, pavadinta „DeepSeek-V3“, apibūdino dar didesnį žingsnį. Tyrimo dokumente, kuriame paaiškinama, kaip jie sukūrė šią technologiją, „DeepSeek“ inžinieriai teigė, kad naudojo tik dalį labai specializuotų kompiuterių lustų, kurie pirmaujančios A.I. įmonės rėmėsi, mokydamos savo sistemas.

 

 Šie lustai yra įtemptos technologinės konkurencijos tarp JAV ir Kinijos centre. JAV vyriausybei stengiantis išlaikyti šalies lyderystę pasaulinėse A.I. lenktynėse, ji bando apriboti galingų lustų, pvz., Silicio slėnio firmos „Nvidia“ gaminamų lustų, kurie gali būti parduodami Kinijai ir kitiems konkurentams, skaičių.

 

 Tačiau „DeepSeek“ modelio veikimas kelia klausimų apie nenumatytas Amerikos vyriausybės prekybos apribojimų pasekmes. Valdikliai privertė Kinijos mokslininkus kūrybiškai naudotis įvairiais įrankiais, kurie yra laisvai prieinami internete.

 

 „DeepSeek“ pokalbių robotas atsakinėjo į klausimus, sprendė logikos problemas ir rašė savo kompiuterines programas taip gerai, kaip ir bet kas, jau esantis rinkoje, remiantis etaloniniais testais, kuriuos amerikiečių A.I. įmonės naudojo.

 

 Ir jis buvo sukurtas pigiai, metant iššūkį vyraujančiai idėjai, kad tik didžiausios technologijų pramonės įmonės – visos jos įsikūrusios Jungtinėse Valstijose – gali sau leisti gaminti pažangiausias A.I. sistemas. Kinijos inžinieriai teigė, kad naujajai sistemai sukurti jiems prireikė tik apie 6 mln. dolerių neapdorotos skaičiavimo galios. Tai yra maždaug 10 kartų mažiau, nei technologijų milžinė „Meta“ išleido, kurdama naujausią A.I. technologiją.

 

 „Įmonių, kurios turi išleisti 6 mln. dolerių, skaičius yra daug didesnis, nei įmonių, kurios turi išleisti 100 mln. dolerių arba 1 mlrd. dolerių“, – sakė rizikos kapitalo įmonės „Page One Ventures“ investuotojas Chrisas V. Nicholsonas, kuris daugiausia dėmesio skiria A.I. technologijoms.

 

 Kadangi OpenAI sukėlė A.I. 2022 m. bumą, išleidus ChatGPT, daugelis ekspertų ir investuotojų padarė išvadą, kad jokia įmonė negalėtų konkuruoti su rinkos lyderiais, neišleisdama šimtų milijonų dolerių specializuotiems lustams.

 

 Pirmaujantis pasaulyje A.I. įmonės treniruoja savo pokalbių robotus, naudodamos superkompiuterius, kurie naudoja net 16 000 lustų, jei ne daugiau. Kita vertus, „DeepSeek“ inžinieriai teigė, kad jiems reikia tik apie 2000 specializuotų kompiuterių lustų iš „Nvidia“.

 

 Lustų apribojimai Kinijoje privertė „DeepSeek“ inžinierius „apmokyti juos efektyviau, kad ji vis dar galėtų būti konkurencinga“, – sakė Džordžo Vašingtono universiteto docentas Jeffrey Dingas, besispecializuojantis naujų technologijų ir tarptautinių santykių srityse.

 

 Anksčiau šį mėnesį Bideno administracija paskelbė naujas taisykles, kuriomis siekiama neleisti Kinijai gauti pažangių A.I. lustų per kitas šalis. Taisyklės grindžiamos daugybe ankstesnių apribojimų, kurie neleidžia Kinijos įmonėms pirkti ar gaminti pažangiausių kompiuterių lustų. Prezidentas Trumpas dar nenurodė, ar naudosis šiomis taisyklėmis, ar jas atšauks.

 

 JAV vyriausybė stengėsi, kad pažangūs lustai nepatektų į Kinijos kompanijų rankas dėl susirūpinimo, kad jie gali būti naudojami kariniams tikslams. Reaguodamos į tai, kai kurios Kinijos įmonės sukaupė tūkstančius lustų, o kitos jas įsigijo iš klestinčios nelegalios kontrabandininkų rinkos.

 

 „DeepSeek“ valdo kiekybinė akcijų prekybos įmonė „High Flyer“. Iki 2021 m. ji nukreipė savo pelną į tūkstančius „Nvidia“ lustų, kuriuos naudojo savo ankstesnių modelių mokymui, įsigijimui. Bendrovė, kuri neatsakė į prašymus pakomentuoti, Kinijoje išgarsėjo tuo, kad iš geriausių universitetų atrinko talentus, žadėdama didelius atlyginimus ir galimybę sekti tyrimų klausimus, kurie labiausiai kelia jų susidomėjimą.

 

 Zihanas Wangas, kompiuterių inžinierius, dirbęs su ankstesniu „DeepSeek“ modeliu, sakė, kad bendrovė taip pat samdo žmones, neturinčius jokio informatikos išsilavinimo, kad padėtų technologijoms suprasti ir sugebėti generuoti poeziją ir spręsti kitus klausimus per sunkumu žinomą Kinijos kolegijos egzaminą.

 

 „DeepSeek“ negamina jokių produktų vartotojams, todėl jos inžinieriai visą dėmesį skiria moksliniams tyrimams. Tai reiškia, kad jos technologija nėra apribota griežčiausių Kinijos A.I. taisyklių aspektų, pagal kuriuos reikalaujama, kad vartotojams skirtos technologijos atitiktų vyriausybės informacijos kontrolę.

 

 Pirmaujančios Amerikos kompanijos toliau tobulina A.I. Gruodžio mėnesį OpenAI pristatė naują „samprotavimo“ sistemą, pavadintą o3, kuri viršija  esamų technologijų našumą, nors ji dar nėra plačiai prieinama už įmonės ribų.

 

 Tačiau „DeepSeek“ ir toliau rodo, kad neatsilieka. Šį mėnesį ji išleido įspūdingą savo samprotavimo modelį.

 

 („The New York Times“ padavė į teismą OpenAI ir jos partnerę „Microsoft“, apkaltindama juos naujienų turinio, susijusio su AI sistemomis, autorių teisių pažeidimu. „OpenAI“ ir „Microsoft“ šiuos teiginius atmetė.)

 

 Esminė šios greitai besikeičiančios pasaulinės rinkos dalis yra sena idėja: atvirojo kodo programinė įranga. Kaip ir daugelis kitų kompanijų, „DeepSeek“ savo naujausią A.I. sistemą daro atvirojo kodo, o tai reiškia, kad ji bendrino pagrindinį kodą su kitomis įmonėmis ir mokslininkais. Tai leidžia kitiems kurti ir platinti savo produktus, naudojant tas pačias technologijas.

 

 Nors didelių Kinijos technologijų įmonių darbuotojai apsiriboja bendradarbiavimu su kolegomis, „jei dirbate su atviruoju šaltiniu, dirbate su talentais visame pasaulyje“, - sakė Yineng Zhang, Baseten San Franciske vadovaujantis programinės įrangos inžinierius, dirbantis su atvirojo kodo SGLang projektu. Jis padeda kitiems žmonėms ir įmonėms kurti produktus, naudojant DeepSeek sistemą.

 

 Atvirojo kodo ekosistema, skirta A.I. suaktyvėjo 2023 m., kai Meta laisvai pasidalino A.I. sistema vadinama LLama. Daugelis manė, kad ši bendruomenė klestės tik tuomet, jei tokios kompanijos kaip Meta – technologijų gigantai, turintys didžiulius duomenų centrus, užpildytus specializuotais lustais – ir toliau naudos atvirojo kodo technologijas. Tačiau DeepSeek ir kiti parodė, kad jie taip pat gali išplėsti atvirojo kodo technologijų galias.

 

 Daugelis vadovų ir ekspertų teigė, kad didžiosios JAV įmonės neturėtų siūlyti atviro kodo savo technologijų, nes jos gali būti naudojamos dezinformacijai skleisti ar padaryti kitokią rimtą žalą. Kai kurie JAV įstatymų leidėjai tyrė galimybę užkirsti kelią tokiai praktikai arba ją sustabdyti.

 

 Tačiau kiti teigia, kad jei reguliavimo institucijos slopins atvirojo kodo technologijų pažangą Jungtinėse Valstijose, Kinija įgis reikšmingą pranašumą. Jie teigia, kad jei geriausios atvirojo kodo technologijos bus iš Kinijos, JAV kūrėjai kurs savo sistemas ant tų technologijų. Ilgainiui dėl to Kinija gali tapti A.I. mokslinių tyrimų ir plėtros pagrindiniu pasauliniu centru.

 

 „Atvirojo kodo bendruomenės svorio centras persikėlė į Kiniją“, – sakė Kalifornijos universiteto Berklio informatikos profesorius Ionas Stoica. „Tai gali būti didžiulis pavojus JAV“, nes tai leidžia Kinijai paspartinti naujų technologijų kūrimą.

 

 Praėjus kelioms valandoms po inauguracijos, prezidentas Trumpas atšaukė Bideno administracijos vykdomąjį įsakymą, grasinantį pažaboti atvirojo kodo technologijas.

 

 Daktaras Stoica ir jo mokiniai neseniai pastatė A.I. sistema, vadinama Sky-T1, kuri konkuruoja su naujausios OpenAI sistemos, vadinamos OpenAI o1, našumu, atliekant tam tikrus etaloninius testus. Jiems prireikė tik 450 dolerių skaičiavimo galios.

 

 Jie tai padarė remdamiesi dviem atvirojo kodo technologijomis, kurias išleido Kinijos technologijų milžinė „Alibaba“.

 

 Jų 450 dolerių kainuojanti, sistema nėra tokia galinga, kaip „OpenAI“ technologija ar nauja „DeepSeek“ sistema. Ir mažai tikėtina, kad, jų naudojami, metodai sukurs sistemas, viršijančias pirmaujančių technologijų našumą. Tačiau projektas parodė, kad, net ir naudojant nedidelius išteklius, galima sukurti konkurencingas sistemas.

 

 Reuvenas Cohenas, technologijų konsultantas Toronte, „DeepSeek-V3“ naudoja nuo gruodžio pabaigos. Jis sako, kad jis yra panašus į naujausias OpenAI, Google ir San Francisko startuolio Anthropic sistemas ir yra daug pigesnis.

 

 „DeepSeek yra būdas man sutaupyti pinigų“, – sakė jis. „Tai tokia technologija, kurią nori naudoti daug kas, pavyzdžiui, aš.“ [1] [2]

 

 1. „Remiantis turima informacija, minimalios išlaidos, naudojant „DeepSeek“ technologiją, ypač „DeepSeek V3“ modelį, yra maždaug 0,14 dolerių už milijoną žetonų už talpyklos pataikymą, todėl jis yra žymiai pigesnis, nei kitų didelių kalbų modelių, tokių, kaip GPT-4 ar Claude 3.5 Sonnet, kuris gali kainuoti kelis kartus daugiau už milijoną žetonų.”

 

2.  How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants. Metz, Cade; Tobin, Meaghan.  New York Times (Online) New York Times Company. Jan 23, 2025.

Komentarų nėra: