Sekėjai

Ieškoti šiame dienoraštyje

2026 m. sausio 19 d., pirmadienis

„Dar vienas „DeepSeek“ momentas“: Kinijos dirbtinio intelekto modelis Kimi K2 kelia jaudulį


„Naujausia pokalbių roboto versija, sukurta startuolio „Moonshot AI“, yra atvira tyrėjams, kad galėtų ją tobulinti.

 

Tyrėjai vis labiau nerimauja dėl dar vieno galingo dirbtinio intelekto (DI) modelio, atsiradusio Kinijoje, po to, kai „DeepSeek“ sausio mėnesį šokiravo pasaulį pristatydama R1.

 

Pekine įsikūrusios bendrovės „Moonshot AI“ liepos 11 d. pristatyto „Kimi K2“ našumas įvairiuose testuose prilygsta arba pranoksta Vakarų konkurentų, taip pat kai kurių „DeepSeek“ modelių, rezultatus, teigia įmonė. Visų pirma, atrodo, kad jis puikiai programuoja ir gauna aukštus balus tokiuose testuose kaip „LiveCodeBench“.

 

Mokslininkai plūsta į „DeepSeek“: kaip jie naudoja populiarųjį DI modelį

 

Kaip ir „DeepSeek“ modeliai, „Kimi K2“ yra atvirojo svorio, tai reiškia, kad tyrėjai gali jį nemokamai atsisiųsti ir kurti. Prie jo galima prisijungti per taikomųjų programų programavimo sąsają (API) už nedidelę kainos dalį, palyginti su pagrindiniais patentuotais modeliais, tokiais kaip „Claude 4“ iš... „Anthropic“ San Franciske, Kalifornijoje.

 

„Bendruomenė gali laisvai jį naudoti, tiksliai derinti ir kurti toliau, nešokdama savo modelio nuo nulio“, – sako Adina Yakefu, dirbtinio intelekto tyrėja atvirojo mokslo platformoje „Hugging Face“ Niujorke. Vos vieną dieną po paleidimo „Kimi K2“ buvo atsisiųsta greičiau nei bet kuris kitas platformos modelis, rodo „Hugging Face“ duomenys. Jo išleidimas yra „dar viena „DeepSeek“ akimirka“, – sako Yakefu.

 

Skirtingai nuo daugelio kitų galingų modelių, „K2“ nėra „samprotavimo“ modelis – modelis, apmokytas spręsti užklausas naudojant žingsnis po žingsnio logiką. Vietoj to, jis specializuojasi kaip agentinis didelės kalbos modelis (LLM), o tai reiškia, kad žada atlikti daugiapakopes užduotis naudojant įvairius įrankius, pavyzdžiui, naršant internete arba kreipiantis į matematikos programinę įrangą. Kai kurie modeliai, įskaitant kai kurias „ChatGPT“ versijas, jau gali tai padaryti, tačiau jie yra patentuoti. Dirbtinio intelekto tyrėjai vis dar tikrina, ar gali atkartoti agentinio elgesio pavyzdžius, kuriuos, anot „Moonshot AI“, gali atlikti „Kimi K2“.

 

Kitas populiariausias modelis

 

Tai, kad per šešis mėnesius Kinijoje pasirodė antras įspūdingas modelis, rodo, kad šis žygdarbis nebuvo anomalija. „DeepSeek R1 išleidimas anksčiau šiais metais buvo labiau įžanga nei vienkartinis atsitiktinumas DI trajektorijoje“, – savo naujienlaiškyje „Interconnects“ rašė Nathanas Lambertas, mašininio mokymosi tyrėjas iš Alleno DI instituto Sietle, Vašingtone. Kimi K2 yra „naujas geriausias atviras modelis pasaulyje“, – jis paskelbė socialinės žiniasklaidos svetainėje „Bluesky“.

 

„Moonshot AI“, įkurta 2023 m. kovo mėn., yra startuolis, kuris iki šiol Vakaruose buvo mažai žinomas. Tačiau jos pokalbių robotas „Kimi“, pagrįstas ankstesniu teisės magistro laipsniu, iki lapkričio mėnesio jau buvo trečias pagal dydį Kinijoje, teigia Honkongo rinkodaros tyrimų įmonė „Counterpoint“. Pranešama, kad tarp investuotojų yra Kinijos technologijų gigantai „Alibaba“ ir „Tencent“.

 

NAUJIENOS, 2025 m. liepos 10 d. „OpenAI“ o3 užima pirmąją vietą naujoje DI lygos lentelėje pagal atsakymus į mokslinius klausimus

 

Kimi K2 yra toks pat stambios kaip ir jos rėmėjai, vienas trilijonas parametrų – reguliuojamos vertės, žyminčios asociacijų stiprumą modelyje. Lamberto teigimu, mažesnėms laboratorijoms būtų labai sudėtinga valdyti tokį parametrų skaičių. Tačiau K2 vienu metu aktyvuoja tik 32 milijardus parametrų, naudodamas „ekspertų mišinio“ architektūrą, kuri leidžia kiekvienai užduočiai naudoti tik atitinkamas modelio dalis, o tai padeda suvaldyti reikiamą skaičiavimo galią.

 

Be programavimo, Kimi K2, regis, turi rašymo talentą. Kai kurie dirbtinio intelekto komentatoriai socialinės žiniasklaidos platformoje X gyrė jo rašymo stilių už tai, kad jis skamba kitaip nei įprastas dirbtinis intelektas. Šiuo metu modelis pirmauja „Creative Writing v3“ etaloniniame teste, kuriame tikrinami tokie kriterijai kaip veikėjų autentiškumas ir klišių vengimas, ir „EQ-bench 3“, kuriame nagrinėjamas modelių emocinis intelektas vaidmenų žaidimo scenarijuose.

 

Ne taip moksliška

 

Tačiau K2 nepralenkia kiekvienos užduoties. „SciMuse“ – etaloniniame teste, kuris vertina, kaip gerai dirbtinis intelektas prognozuoja, kurios idėjos žmonėms tyrėjams bus įdomios, – jis atsiliko nuo pažangiausių „Google“ „Gemini“ algoritmų ir „OpenAI“ samprotavimo modelių rinkinio, teigia jis. Mario Krennas, vadovaujantis Dirbtinio mokslininko laboratorijai Maxo Plancko šviesos mokslo institute Erlangene, Vokietijoje.

 

Vis dėlto, „Moonshot AI“ yra viena iš kelių Kinijos įmonių, nusprendusių viešai skelbti savo modelius, sako Yakefu. Jungtinėms Valstijoms reikia atviro modelio, panašaus kalibro, kokį kuria „DeepSeek“ ir „Moonlight AI“, kad būtų galima atsverti mažėjančią šalies įtaką atvirojo kodo ir akademinėse bendruomenėse, priduria Lambertas, ką jis vadina Amerikos „DeepSeek“ projektu.

 

„Visiškai aišku, kad už šių pastangų stovi daugybė geriausių mašininio mokymosi tyrėjų ir inžinierių, turinčių išskirtinę įrangą“, – sako Krennas. „Nenustebčiau, jei per ateinančius mėnesius [iš Kinijos] atsirastų daugiau.“ [1]

 

1. Nature 643, 889-890 (2025) By Elizabeth Gibney

Komentarų nėra: