Sekėjai

Ieškoti šiame dienoraštyje

2025 m. vasario 2 d., sekmadienis

Aiškus bandymų sustabdyti Kinijos dirbtinio intelekto plėtrą kvailumo aprašymas


 

 „Timas Dettmersas yra vienas iš pažangiausių dirbtinio intelekto mokslininkų, prisidėjusių prie „DeepSeek“ proveržio, kuris praėjusią savaitę patraukė pasaulio dėmesį.

 

 Jis niekada neturėjo ryšių su Kinijos komanda, kuri jį sukūrė.

 

 Dettmersas, Sietlo Alleno dirbtinio intelekto instituto tyrėjas, anksčiau dirbęs „Meta Platforms“, sukūrė naują būdą treniruoti ir paleisti dirbtinio intelekto (AI) modelį, naudojant mažiau galingą aparatinę įrangą. Jis paskelbė savo darbą 2021 m. Kai „DeepSeek“ komanda neseniai paskelbė savo dokumentus apie tai, kaip ji sukūrė modelius, jis atrado jo straipsnį tarp jų citatų. Pasirodo, jie buvo uolūs jo kūrybos skaitytojai.

 

 AI tyrimų bendruomenė turi kultūrą, leidžiančią publikuoti mokslinius straipsnius, kuriuose išsamiai paaiškinami nauji laimėjimai, ir sudaryti sąlygas visiems naudoti modelius. Būtent tokį požiūrį „Meta“ taikė, valdant Markui Zuckerbergui, ir kurį naudoja „DeepSeek“. Tai taip pat skatina šurmuliuojantį prancūzų AI startuolį „Mistral“ ir daugelį kitų pažangiausių dirbtinio intelekto įmonių ir tyrimų institucijų.

 

 Pristatydami naujausius „DeepSeek“ dirbtinio intelekto modelius matome, kaip dalijimasis visomis tomis žiniomis leido jos komandai, kuri savo darbui panaudojo visame pasaulyje išplitusių inžinierių sukurtas technikas, peršokti per, daug geresnius išteklius turinčias, AI komandas. JAV kursto aukšto lygio diskusijas apie tai, kiek amerikiečiai turėtų pasidalyti apie savo AI proveržius.

 

 „Jaučiasi gerai“, – sakė Dettmersas, kai paklausiau, kaip jautėsi, prisidėjęs prie to, ką kai kurie vadina „Sputniko akimirka“ dirbtinio intelekto srityje. Tačiau, pridūrė jis, geriausia buvo ne tik matyti, kaip jo darbas buvo įgyvendintas. Gali būti, kad DeepSeek komanda taip pat paskelbė išsamų dokumentą apie tai, kaip jie panaudojo jo naujoves, todėl jis ir kiti galėjo remtis jos darbu ir sukurti dar geresnį modelį.

 

 Dirbtinio intelekto jėgainė „OpenAI“ tam tikra prasme yra išskirtinė šios dalijimosi kultūros išimtis, ir yra kaltinimų, kad, galbūt, „DeepSeek“ padarė didelį šuolį į priekį iš dalies „distiliuodama“ OpenAI modelius. Distiliavimas yra modelio žinių išgaudymas ir gali būti naudojamas vietoj tradicinių mokymo modelių arba juos papildyti. Tačiau neleiskite, kad tai atitrauktų nuo diskusijų apie akademinio stiliaus dalijimąsi žiniomis, tokių modelių, kaip „DeepSeek“ kūrimą, kuriuos galima nemokamai atsisiųsti ir naudoti, ir atvirojo kodo, skirto jiems kurti, paskelbimą. Tai yra dalykai, kurie nulems AI lenktynių nugalėtojus ir pralaimėjusius tolimoje ateityje.

 

 Investuotojai, tokie, kaip Marcas Andreessenas, AI tyrimų srities dekanai, tokie kaip Yann Lecunn, ir daugelis kitų, finansuojančių ir kuriančių AI, teigia, kad dalijimasis, galiausiai, bus naudingas visai žmonijai.

 

Priešininkų stovykloje yra žmonių, ypač investuotojų, kaip Vinod Khosla, kurie teigia, kad tai kelia pavojų nacionaliniam saugumui.

 

 Jiems turėti geriausią dirbtinį intelektą prilygsta geriausiems variklius ar automobilius – dalykus, kurie praeityje lėmė, kurios šalys buvo turtingiausios, ir galėjo diktuoti verslo sąlygas kitoms. O kalbant apie ginklus, Holivudo filmai ir mokslinės fantastikos romanai dešimtmečius skatina mus suprasti pažadą ir pavojų, kad dirbtinis superintelektas mūsų pusėje. Kai kurie AI startuolių įkūrėjai sako, kad ši fikcija artėja prie realybės.

 

 Khosla, rizikos kapitalo įmonės Khosla Ventures įkūrėjas ir pirmasis išorės investuotojas į OpenAI, palygino atvirojo kodo metodą su tuo, kad pasidalintų Manheteno projekto detalėmis.

 

 Dario Amodei, „OpenAI“ konkurento „Anthropic“ vadovas, netrukus po „DeepSeek“ išleidimo parašė, kad tai sustiprina pažangių AI lustų eksporto kontrolę. Ši kontrolė prasidėjo, vadovaujant Bideno administracijai, siekiant pažaboti Kinijos dirbtinio intelekto plėtrą, uždraudžiant tam tikrų tipų pažangių lustų eksportą, ir laikui bėgant jie buvo sugriežtinti.

 

 Sąžininga sakyti, kad dauguma inžinierių, kuriančių AI, nesutinka su idėja, kad dirbtinio intelekto kūrimas turėtų būti laikomas paslaptyje.

 

 „Vienintelė priežastis, dėl kurios JAV buvo AI inovacijų centras, yra ta, kad dešimtmečius laikomės atviros leidybos etosu“, – sako AI investuotojas Anjney Midha, rizikos kapitalo įmonės Andreessen Horowitz partneris.

 

 Pavyzdys: naujo tipo dirbtinis intelektas, įgalinantis dabartinį bumą, buvo išrastas „Google“ 2017 m. Tačiau netrukus po to, kai įmonės inžinieriai pabandė pritaikyti šią techniką kalbai, rezultatas buvo dokumentas, kuriame daroma išvada, kad masiniai kalbų modeliai, tikriausiai, nebuvo tinkamas kelias. Kadangi jie paskelbė savo rezultatus, OpenAI inžinieriai padarė priešingą išvadą ir rezultatas buvo GPT-3, proveržis, paskatinęs sukurti ChatGPT, sako Midha.

 

 Tačiau „OpenAI“ neišleidžia savo modelių atvirai taip, kad kiti galėtų juos paleisti. Iš investuotojų surinkusi milijardus dolerių, bendrovė turi verslo modelį, pagal kurį apmokestinama prieiga prie tų modelių.

 

 Anksčiau nemokamų modelių, tokių, kaip „DeepSeek“ išleistas, našumas, net ir iš „Meta“, buvo ne toks geras, kaip tų, kuriuos siūlo įmonės, kurios savo modelius ir naujoves pasilieka sau, pvz., „OpenAI“.

 

 Užtaisydama pirmaujančių AI modelių našumo atotrūkį ir tariamai naudodama daug mažiau išteklių, „DeepSeek“ įmonė atvėrė duris į ateitį, kurioje daug daugiau organizacijų ir šalių galės kurti pažangiausius modelius, sako Dettmersas.

 

 „DeepSeek“ išsamiai neaprašė, kaip ji ketina pasipelnyti iš AI, tačiau generalinis direktorius Liangas Wenfengas aiškiai pasakė, kad šiuo metu tai nėra jo prioritetas. Jis mano, kad svarbiau pirmiausia sukurti stiprią ekosistemą, nes jei įmonė išleis savo programinės įrangos kodą, ji pritrauks daugiau vartotojų, kurie vėliau galės pasiūlyti kodo patobulinimus. Liangas teigė, kad norint išlaikyti konkurencinį pranašumą nėra taip svarbu išlaikyti programinės įrangos nuosavybę, kaip daugelis mano.

 

 „Uždaro šaltinio suformuotas griovys yra trumpalaikis, kai susiduriama su ardančiais technologijomis“, – praėjusiais metais Kinijos technologijų leidiniui 36Kr sakė jis. „Net jei OpenAI yra uždarojo kodo, tai netrukdys kitiems jį pasivyti.”

 

 Midha sako manantis, kad iš esmės AI džinas iškrito iš butelio. Bandymai išlaikyti JAV AI tyrimų paslaptį tik sumažintų JAV įmonių ir dirbtinio intelekto laboratorijų konkurencingumą, nes jie būtų atkirsti nuo pasaulinio keitimosi žiniomis.

 

 „AI tapo infrastruktūra daugeliui šiuolaikinių šalių“, – priduria jis. „Manau, kad jei mes tai uždrausime, vienintelis dalykas, kurį darome, yra užtikrinti, kad kitos šalys, kurioms reikia sąjungininkų partnerių, eitų pas Kinijos komunistų partiją arba pas tą, kuris joms pateiks geriausius atvirus modelius.“ [1]

 

AI principai yra visiems žinomi, kas nori ir gali žinoti. Už juos gauta Nobelio premija. Tik kvailys gali tikėtis čia ką nors paslėpti. Tam jis ir yra kvailys.

 

Mokslinė AI problema dar neišspręsta. Neturime AI, kuris viskuo būtų geresnis už žmones. Tai mokslinė problema. Tokią problemą geriau išsprendžia visa žmonija, jei iš viso išsprendžia.

 

1.  EXCHANGE --- Keywords: The Manhattan Project Was Secret. Should Our AI Work Be Too? --- Scientists at AI's cutting edge liked to share their work. Then came DeepSeek. Mims, Christopher.  Wall Street Journal, Eastern edition; New York, N.Y.. 01 Feb 2025: B4. 

Komentarų nėra: