„Dvi Kinijos dirbtinio intelekto lustų bendrovės siekia pritraukti 1,66 mlrd. JAV dolerių per pradinius viešus akcijų siūlymus (IPO), Kinijai dedant daugiau pastangų, siekiant lustų nepriklausomybės, didėjant JAV ir Kinijos technologijų konkurencijai.
Pekine įsikūrusi „Moore Threads“ planuoja pritraukti 8 mlrd. juanių, tai atitinka 1,12 mlrd. JAV dolerių, o Šanchajuje įsikūrusi „MetaX“ siekia 3,9 mlrd. juanių, teigiama pirmadienį Šanchajaus vertybinių popierių biržai pateiktuose prospektuose.
2020 m. buvusio „Nvidia“ vadovo Zhang Jianzhongo įkurta „Moore Threads“ specializuojasi grafikos apdorojimo įrenginių, skirtų dirbtinio intelekto mokymams, projektavime. Bendrovė planuoja panaudoti IPO lėšas naujų dirbtinio intelekto lustų tyrimams ir plėtrai finansuoti bei apyvartiniam kapitalui didinti.
„MetaX“, kurią taip pat 2020 m. įkūrė buvę AMD darbuotojai, įskaitant pirmininką Chen Weiliang, daugiausia dėmesio skiria pilno paketo [1] GPU lustams ir susijusiems sprendimams. Ji ketina panaudoti lėšas didelio našumo GPU tyrimams ir plėtrai remti.
Abi bendrovės siekia įtraukti savo akcijas į Šanchajaus STAR rinką – į technologijas orientuotą Šanchajaus biržos valdybą.
„Moore Threads“ buvo įtraukta į JAV subjektų sąrašą 2023 m. spalio mėn., o tai riboja jos prieigą prie amerikietiškų technologijų ir įrangos.
Nepaisant spartaus pajamų augimo, abi bendrovės ir toliau patiria didelių nuostolių, nes plečiasi ir daug investuoja į mokslinius tyrimus ir plėtrą.
„Moore Threads“ pajamos 2024 m. išaugo daugiau, nei tris kartus, iki 438,85 mln. juanių, o grynasis nuostolis sumažėjo, bet išliko 1,49 mlrd. juanių.
„MetaX“ pajamos 2024 m. išaugo daugiau, nei dešimt kartų, iki 743,1 mln., palyginti su 53 mln. juanių prieš metus. Tačiau ji patyrė 232,5 mln. juanių grynąjį nuostolį, kurį lėmė maža vietinės gamybos lustų skverbtis į rinką, ribotas savarankiškai sukurtų GPU pardavimo mastas ir didelės mokslinių tyrimų ir plėtros išlaidos.“ [3]
1. Pilno paketo GPU lustai – tai bendrovių, kurios siūlo ne tik grafikos procesoriaus (GPU) silicį, produktai. Jie teikia visapusišką sprendimą, įskaitant lustą, susijusias sistemas ir jį palaikančią programinės įrangos ekosistemą.
„NVIDIA“ yra puikus įmonės, teikiančios pilno paketo sprendimus, ypač dirbtinio intelekto srityje, pavyzdys.
Pilno paketo GPU sprendimas apima:
Lustus: patį GPU (pvz., „Blackwell GPU“) kartu su pagalbiniais lustais, tokiais, kaip procesoriai („Grace CPU“), duomenų apdorojimo įrenginiai („BlueField“), tinklo sąsajos plokštės („ConnectX“) ir komutatoriai („NVLink Switch“, „Spectrum Ethernet“ komutatorius, „Quantum InfiniBand“ komutatorius).
Sistemas: Aparatinės įrangos platformas, kuriose talpinami ir integruojami įvairūs lustai, pvz., „NVIDIA GB200 NVL72“ stelažinis sprendimas.
Programinę įrangą: Programinės įrangos ekosistema leidžia kūrėjams išnaudoti aparatinės įrangos galią. Tai apima:
Optimizavimą konkretiems darbo krūviams, pvz., dirbtinio intelekto išvados.
Programinės įrangos bibliotekas ir įrankius tokioms užduotims, kaip kvantavimas [2].
Įrankių rinkinius, bibliotekas ir kompiliatorius, skirtus kurti didelio našumo programas, pvz., „CUDA“ („NVIDIA“), „ROCm“ (AMD) ir „oneAPI“ („Intel“).
Derinimo ir našumo analizės įrankius.
Įmonės, siūlančios pilno paketo GPU sprendimus:
NVIDIA: Pirmaujanti pilno paketo GPU sprendimų, ypač skirtų dirbtiniam intelektui ir didelio našumo skaičiavimams, tiekėja. NVIDIA integruoja aparatinę ir programinę įrangą, kad optimizuotų našumą sudėtingoms programoms.
Kiti pretendentai: Kitos įmonės taip pat kuria integruotus aparatinės ir programinės įrangos sprendimus, kad galėtų konkuruoti GPU rinkoje.
Pilno paketo GPU lustas (arba sprendimas) apima ne tik aparatinę įrangą, bet ir programinę įrangą bei sistemas, reikalingas visapusiškai, optimizuotai skaičiavimo platformai sukurti. Šis metodas ypač aktualus tokiose srityse, kaip dirbtinis intelektas.
2. Kvantavimas – tai nepertraukiamų duomenų konvertavimo į atskirus, skaitmeninius vaizdus procesas. Tai apima duomenų tikslumo mažinimą, dažnai iš didesnio tikslumo formato (pvz., 32 bitų slankiojo kablelio) į mažesnio tikslumo formatą (pvz., 8 bitų sveikuosius skaičius). Ši technika plačiai naudojama atminties naudojimui sumažinti, skaičiavimo efektyvumui pagerinti ir diegimui įrenginiuose, kuriuose trūksta išteklių.
Išsamiau:
Pagrindinė koncepcija:
Kvantavimas susieja nepertraukiamą reikšmių diapazoną su mažesniu, atskiru reikšmių rinkiniu. Įsivaizduokite tai, kaip skaičių apvalinimą iki artimiausio sveikojo skaičiaus arba spalvų atvaizdavimą, naudojant ribotą paletę.
Taikymas:
Mašininis mokymasis: sumažina modelio dydį, pagreitina išvadų darymą (apmokyto modelio naudojimo prognozėms daryti procesą) ir leidžia diegti periferiniuose įrenginiuose.
Signalų apdorojimas: konvertuoja nuolatinius signalus (pvz., garsą ar vaizdą) į skaitmeninį formatą, kurį gali apdoroti kompiuteriai.
Muzikos kūrimas: suderina muzikos natas su laiko tinkleliu, kad ištaisytų laiko netikslumus.
Vaizdų apdorojimas: sumažina vaizde naudojamų spalvų skaičių, dažnai glaudinimui arba vaizdų rodymui įrenginiuose, kuriuose ribotas spalvų palaikymas.
Fizika: kvantinėje fizikoje energija, impulsas ir kiti dydžiai yra kvantuojami, o tai reiškia, kad jie gali įgauti tik tam tikras diskrečias vertes.
Privalumai:
Mažesni modelio dydžiai: mažesnis atminties kiekis saugojimui ir greitesnis įkėlimo laikas.
Greitesnis išvadų darymas: sveikųjų skaičių skaičiavimas aritmetinėse operacijose paprastai yra greitesnis, nei slankiojo kablelio operacijos, todėl prognozės pateikiamos greičiau.
Mažesnės energijos sąnaudos: duomenims apdoroti mažesniu tikslumu reikia mažiau energijos.
Kompromisai:
Tikslumo praradimas: tikslumo sumažinimas sukelia kvantavimo paklaidą, kuri gali turėti įtakos modelio tikslumui.
Tinkamos pusiausvyros paieška: tikslas – rasti tinkamą pusiausvyrą tarp modelio dydžio mažinimo ir priimtino tikslumo išlaikymo.
Metodai:
Kvantavimas po mokymo (PTQ): modelis kvantuojamas po jo apmokymo, nereikalaujant papildomų mokymo duomenų.
Kvantavimo sąmoningas mokymas (QAT): kvantavimas įtraukiamas į mokymo procesą, siekiant sumažinti tikslumo praradimą.
Įvairūs duomenų tipai: kvantavime dažniausiai naudojami duomenų tipai yra 8 bitų sveikieji skaičiai (int8), 16 bitų slankiojo kablelio skaičiai (fp16) ir smegenų slankiojo kablelio skaičiai 16 (bf16).
3. Chinese AI Chipmakers Plan IPOs. Qin, Sherry. Wall Street Journal, Eastern edition; New York, N.Y.. 02 July 2025: B3.
Komentarų nėra:
Rašyti komentarą