Sekėjai

Ieškoti šiame dienoraštyje

2025 m. sausio 17 d., penktadienis

Kinijos dirbtinio intelekto startuoliai įveikia JAV konkurentus

 

 „SINGAPŪRAS – Kinijos startuoliai rodo, kad greičiau, nei daugelis pramonės atstovų tikėjosi, gali pasivyti pirmaujančius Amerikos dirbtinio intelekto modelius, nepaisant apribojimų, su kuriais Kinija susiduria, pirkdama pažangius lustus.

 

 Vienas sėkmingiausių Kinijos rizikos draudimo fondų valdytojų finansuojamas startuolis „DeepSeek“ lapkritį išleido naujausio didelio kalbinio modelio peržiūros versiją. Jame teigiama, kad programos gebėjimai yra palankesni, lyginant su OpenAI samprotavimo modeliu, pavadintu o1, kuris buvo išleistas rugsėjo mėnesį.

 

 Kitos Kinijos bendrovės pastarosiomis savaitėmis pareiškė panašius teiginius. Kinijos interneto gigantų „Alibaba“ ir „Tencent“ remiamas startuolis „Moonshot AI“ teigė, kad sukūrė matematikos modelį, kurio galimybės yra artimos „o1“, o „Alibaba“ teigė, kad vienas iš jos eksperimentinių tyrimų modelių pralenkė JAV modelio peržiūros versiją matematikos srityje.

 

 Įmonės nepaskelbė dokumentų, kuriuose būtų aprašyti jų modeliai, o vertinti teiginius sunku, nes nėra nė vieno sutarto AI modelio gebėjimų testo. Vis dėlto kai kurie JAV specialistai teigė esantys sužavėti.

 

 Kinija „greičiau vejasi“, – sakė buvęs OpenAI bendradarbis ir šiuo metu dirbtinio intelekto verslininkas Andrew Carras. Jis sakė, kad „DeepSeek“ tyrėjai, bandantys atkartoti „OpenAI“ samprotavimo modelį, „tai suprato per kelis mėnesius, ir, tiesą sakant, daugelis mano kolegų dėl to nustebę“.

 

 Vienas palyginimui naudojamas testas yra Amerikos kviečiamasis matematikos egzaminas (AIME), kuris skirtas iššūkiams ryškiausiems vidurinių mokyklų matematikos studentams.

 

 „DeepSeek“ teigė, kad jos modelis yra geriausias „OpenAI“ AIME. The Wall Street Journal atliktas eksperimentas, naudojant 15 problemų iš šių metų AIME, parodė, kad OpenAI o1 peržiūros modelis atsakymus gavo greičiau, nei DeepSeek, Moonshot ir eksperimentinis Alibaba modelis. Vieno žodžio galvosūkis, apimantis strategiją hipotetiniame dviejų žaidėjų žaidime, OpenAI programa pateikė atsakymą per 10 sekundžių, o DeepSeek užtruko daugiau, nei dvi minutes.

 

 Gauti teisingą atsakymą iš pirmo karto vis dar yra žygdarbis, nes tekstinės problemos dažnai trikdo dirbtinio intelekto programas.

 

 Kinijos dirbtinio intelekto kūrėjai nuo 2022 m. susidūrė su JAV apribojimais pasiekti pažangiausius pasaulyje AI lustus, įskaitant lustų lyderės Nvidia. Bideno administracija gruodį vėl sugriežtino eksporto kontrolės taisykles.

 

 Tačiau kūrėjai rado išeitį.

 

 „Moonshot“, startuolio, remiamo „Alibaba“ ir „Tencent“, įkūrėjas Yang Zhilin teigė, kad bendrovė daugiausia dėmesio skiria mokymuisi, kuris imituoja žmonių bandymus ir klaidas. Šis metodas gali ne taip intensyviai naudoti skaičiavimo galią, gerinant našumą.

 

 Nuo praėjusių metų pabaigos dirbtinio intelekto kūrėjai vis dažniau naudoja techniką, vadinamą „ekspertų mišiniu“ arba MoE, kai pradinis maršruto nustatymo mechanizmas nukreipia problemą į specializuotą eksperto modelį, pavyzdžiui, vyriausiasis virėjas, nukreipiantis spagečių užsakymą virtuvės italų virėjui. .

 

 „Tencent“ teigė, kad jo lapkritį išleisto MoE modelio našumas panašus į „Llama 3.1“ modelį, kurį liepą pristatė „Facebook“ savininkė Meta Platforms. Tyrėjai, peržiūrėję dviejų įmonių publikuotus dokumentus, teigė, kad Tencent modelis, greičiausiai, buvo apmokytas su maždaug dešimtadaliu Meta naudojamos skaičiavimo galios.

 

 „DeepSeek“ pradėjo veikti, kaip „High-Flyer“, kiekybinio rizikos draudimo fondo valdytojo, turinčio 8 mlrd. dolerių turto, kuris yra žinomas dėl AI panaudojimo prekybai, AI tyrimų padalinys. 2021 m. „DeepSeek“ sujungė apie 10 000 „Nvidia“ A100 lustų, kad sudarytų dirbtinio intelekto mokymų grupę, kurią pavadino „Fire-Flyer 2“.

 

 Šį rugpjūtį paskelbtame dokumente „DeepSeek“ teigė, kad „Fire-Flyer 2“ našumas panašus į „Nvidia“ sistemą, kurioje yra panašių lustų, tačiau Kinijos sistema kainuoja mažiau ir sunaudojo mažiau energijos. „DeepSeek“ gegužės mėn. dokumentas apie savo Vidaus reikalų ministerijos modelį, kuriame buvo efektyviau apdoroti duomenis, buvo plačiai pastebėtas pramonėje.

 

 „Vienas būdas Kinija apeis eksporto kontrolę – sukurs itin gerą programinės ir aparatinės įrangos mokymo krūvą, naudodama aparatinę įrangą, kurią gali pasiekti“, – savo tinklaraštyje rašė Jackas Clarkas, AI startuolio Anthropic įkūrėjas, kalbėdamas apie „DeepSeek“ grupę. „Pagaminta Kinijoje bus tinkama dirbtinio intelekto modeliams, kaip ir elektromobiliams, dronams ir kitoms technologijoms“, – rašė jis.

 

 Daugelis Kinijos AI kūrėjų rado būdų, kaip pasiekti ribotus Nvidia lustus, įskaitant prekybą su tarpininkais ir užsienio duomenų centrais.

 

 Nepaisant to, Kinijos vadovų teigimu, pažangiausių lustų trūkumas Kinijos startuoliams yra skausmingas, o atotrūkis gali didėti. „Nvidia“ klientai ruošiasi dideliu mastu įdiegti naujausią AI duomenų centro lustą, vadinamą „Blackwell“.

 

 Elono Musko xAI sukonstravo duomenų centrą su 100 000 „Nvidia“ lustų ir neseniai surinko 5 mlrd. dolerių, kad padarytų daugiau. „Amazon Web Services“ planuoja sukurti didžiulį dirbtinio intelekto superkompiuterį su šimtais tūkstančių vietinių lustų. Kinijos AI startuoliai šiuo metu vertinami tik dalimi JAV vertės tokioms įmonėms, kaip OpenAI, nes finansininkai nėra tikri dėl savo galimybių užsidirbti pinigų iš savo avansų.“ [1]

 

1. China's AI Startups Are Gaining on U.S. Rivals. Huang, Raffaele; Qu, Tracy.  Wall Street Journal, Eastern edition; New York, N.Y.. 27 Dec 2024: B4. 

Komentarų nėra: