Mokslas, studijos ir ekonomika: JAV prekybos sekretorius Howardas Lutnickas teigia, kad „Nvidia“ lustai Kinijoje naudingi JAV

„Antradienį prekybos sekretorius Howardas Lutnickas paaiškino Trumpo administracijos sprendimą užtikrinti „Nvidia“, kad ji gali parduoti savo H20 dirbtinio intelekto lustą Kinijoje, sakydamas, kad JAV nori, jog Kinija priklausytų nuo Amerikos technologijų.

Lutnickas CNBC sakė, kad JAV nori būti vienu žingsniu priekyje to, ką gali sukurti Kinija, todėl Kinija ir toliau pirks JAV puslaidininkius.

„Norime, kad kinai ir toliau naudotųsi Amerikos technologijų rinkiniu, nes jie vis dar juo pasikliauja“, – sakė jis ir pridūrė, kad „Nvidia“ parduoda Kinijai senesnį dirbtinio intelekto lustą.

Santa Klaroje, Kalifornijoje, įsikūrusi „Nvidia“ teigė, kad Trumpo administracija jai patikino, kad ji gali parduoti savo H20 dirbtinio intelekto lustą Kinijoje.

Tai įvyko praėjus kelioms dienoms po to, kai generalinis direktorius Jensenas Huangas susitiko su prezidentu Trumpu, ir po to, kai balandžio mėnesį Prekybos departamentas ėmėsi veiksmų apriboti H20 lusto pardavimus Kinijoje.

JAV sprendimas leisti daugiau „Nvidia“ lustų sraute į Kiniją buvo vertinamas, kaip geros valios gestas prekybos derybose, teigė šaltiniai, artimi oficialiems asmenims. Prieiga prie lustų ir pažangių technologijų buvo pagrindinis Kinijos derybininkų prioritetas.

Praėjusią savaitę „Nvidia“ tapo pirmąja bendrove, kurios vertė viršija 4 trilijonus dolerių. Antradienį jos akcijų kaina užsidarė ties 170,70 dolerių, t. y. 4 % daugiau.

Administracija teigė, kad „Nvidia“ bus leista parduoti „H20“ lustą, kai Prekybos departamentas suteiks licencijas, teigia bendrovė. „Nvidia“ teigė, kad netrukus atnaujins lusto, kuris buvo sukurtas klientams Kinijoje, kur jis yra perkamiausias nuo 2024 m., tiekimą.

Be to, Huangas teigė, kad „Nvidia“ sukūrė naują dirbtinio intelekto lustą Kinijai, kuris, jo teigimu, būtų naudingas gamyklų automatizavimui ir logistikai. Lustas sukurtas naudojant „Blackwell“ architektūrą [1] – pažangiausią „Nvidia“ architektūrą rinkoje – tačiau kai kurios jo funkcijos yra pakeistos, siekiant išspręsti JAV pareigūnų susirūpinimą dėl eksporto į Kiniją, teigė šaltiniai, susipažinę su lustu.

Huangas ilgą laiką norėjo likti nuošalyje nuo politikos, tačiau tapo pagrindiniu žaidėju JAV ir Kinijos santykiuose, pastaraisiais mėnesiais, šokinėdamas iš Pekino į Vašingtoną ir atgal, tikėdamasis maksimaliai padidinti „Nvidia“ prieigą prie Kinijos ir pasaulinių rinkų.

Praėjusią savaitę jis susitiko su Trumpu ir, anot su susitikimu susipažinusių šaltinių, pareiškė, kad jo įmonei turėtų būti leista toliau plėtoti verslą su Kinija ir ten pasitelkti dirbtinio intelekto talentus.

Huangas Trumpui sakė, kad „Nvidia“ turėtų būti leista laisvai parduoti savo technologijas daugumoje pasaulio šalių, kad Amerikos įmonės galėtų dominuoti dirbtinio intelekto srityje, o ne Kinijos įmonės, tokios, kaip „Huawei“, teigė šaltiniai. Generalinis direktorius taip pat aptarė panašias temas su Lutnicku, teigė jie.

Gegužę Trumpas renginyje Saudo Arabijoje pavadino Huangą „mano draugu“ ir gyrė „Nvidia“ rinkos dalies dominavimą lustų dizaino srityje.

Šią savaitę šis generalinis direktorius yra Pekine, bent jau trečią kartą šiais metais besilankantis Kinijoje. Susitikimuose su aukščiausiais pareigūnais Huangas siekė patikinti Pekiną, kad jo įmonė toliau plėtos verslą Kinijoje tiek, kiek tai leidžia JAV reglamentai, teigė šaltiniai.

„Nvidia“ lustai yra gyvybiškai svarbūs pažangiausiems duomenų centrams, kurie apmoko dirbtinio intelekto modelius ir valdo dirbtinio intelekto programas, todėl Huangas yra populiari asmenybė pasaulyje.

Naujausia Huango kelionė į Kiniją jau sulaukė dėmesio Vašingtone. Praėjusią savaitę du JAV senatoriai – Jimas Banksas (respublikonas, Indiana) ir Elizabeth Warren (demokratė, Masačusetsas) – išsiuntė Huangui laišką apie jo kelionę, prašydami susilaikyti nuo susitikimų su įmonėmis, kurios bendradarbiauja su karinėmis ar žvalgybos įstaigomis Kinijoje.

Tokie nuogąstavimai reiškia, kad geopolitinė rizika „Nvidia“ išlieka didelė. Bendrovė daugelį metų modifikavo dizainą, kad jis atitiktų JAV eksporto taisykles Kinijai, tačiau vartų stulpai buvo nuolat perkeliami.

Gegužės mėnesį Huangas pavadino JAV eksporto kontrolės politiką nesėkme.“ [2]

1. „Blackwell“ architektūra yra naujausia NVIDIA GPU architektūra, skirta generatyviniam dirbtiniam intelektui ir pagreitintam skaičiavimui, pakeičianti „Hopper“ architektūrą.

Ji sukurta taip, kad apdorotų didelius kalbos modelius (LLM) ir kitus sudėtingus dirbtinio intelekto darbo krūvius, pagerindama našumą, efektyvumą ir mastelio didinimą.

„Blackwell“ funkcijos apima naujos klasės dirbtinio intelekto superlustą su 208 milijardais tranzistorių, pritaikytą TSMC 4NP procesą ir didelės spartos lustų sujungimą. Jame taip pat yra tokių funkcijų, kaip antros kartos „Transformer Engine“, konfidencialūs skaičiavimai ir pažangi NVLink.

Pagrindinės savybės ir patobulinimai:

Naujas dirbtinio intelekto superlustas:

„Blackwell“ GPU sukurti, naudojant pritaikytą TSMC 4NP procesą, kuriame yra du tinklelio riboti kristalai, sujungti 10 TB/s lustų sujungimu, teigia NVIDIA.

Antros kartos „Transformer Engine“:

„Blackwell“ apima pažangesnę „Transformer Engine“ versiją, palaikančią naujas 4 bitų slankiojo kablelio dirbtinio intelekto išvados [3] galimybes ir įgalina didesnius modelius bei greitesnį apdorojimą.

Penktos kartos NVLink:

Ši nauja NVLink technologija užtikrina novatorišką 1,8 TB/s dvikryptį pralaidumą vienam GPU, palengvindama ryšį tarp iki 576 GPU didelio masto LLM, teigia NVIDIA.

Konfidencialus skaičiavimas:

„Blackwell“ GPU siūlo konfidencialias skaičiavimo galimybes, apsaugodami jautrius duomenis ir DI modelius nuo neteisėtos prieigos.

RAS variklis:

„Blackwell“ architektūroje taip pat yra specialus variklis, užtikrinantis patikimumą, prieinamumą ir aptarnavimą.

5 nm procesų technologija:

„Blackwell“ sukurta, naudojant 4NP procesą, kuris yra pritaikytas 5 nm procesas, leidžiantis pasiekti didesnį tranzistorių tankį ir pagerinti našumą.

Poveikis ir taikymas:

DI gamyklos:

„Blackwell“ sukurta „DI gamykloms“ maitinti, leidžiant efektyviai mokyti ir realiuoju laiku daryti išvadas generatyviniam DI ir LLM.

Mažesnės išlaidos ir energijos suvartojimas:

„Blackwell“ turėtų leisti organizacijoms atlikti realaus laiko išvadas trilijonų parametrų LLM su 25 kartus mažesnėmis sąnaudomis ir energijos suvartojimu, nei jos pirmtakai, pažymi „Hyperstack Cloud“.

Mastelio didinimas:

Architektūra sukurta taip, kad susidorotų su didėjančiu DI modelių mastu, turinti tokias funkcijas kaip penktosios kartos NVLink, skirtą pagerinti GPU ryšį.

Įvairios pramonės šakos:

Tikimasi, kad „Blackwell“ bus naudingas tokioms pramonės šakoms, kaip sveikatos apsauga, debesų kompiuterija ir kitoms, kurios remiasi didelio masto dirbtiniu intelektu ir duomenų apdorojimu.

„Blackwell“ ir „Hopper“:

„Blackwell“ pakeičia „Hopper“ architektūrą, kuri buvo pristatyta 2022 m.

„Blackwell“ siūlo reikšmingus našumo patobulinimus, palyginti su „Hopper“, dirbtinio intelekto mokymo ir išvadų darymo srityse, ypač didelių kalbų modeliams.

„Blackwell“ apima tokius patobulinimus, kaip antros kartos „Transformer Engine“, patobulintą NVLink ir konfidencialų skaičiavimą, kurių nebuvo „Hopper“.

Prieinamumas:

„NVIDIA“ dar nepaskelbė konkrečių visų „Blackwell“ pagrindu sukurtų produktų prieinamumo terminų, tačiau tikimasi, kad jie bus pradėti tiekti vėliau šiais metais.

Kai kurie „Blackwell“ pagrindu sukurti produktai, pvz., „HGX B200“ ir „GB200 NVL72“, jau yra prieinami.

2. U.S. News: Lutnick Says Nvidia Chips in China Benefit U.S. Hatcher, Nicholas; Huang, Raffaele. Wall Street Journal, Eastern edition; New York, N.Y.. 16 July 2025: A2.

3. 4 bitų slankiojo kablelio DI išvada

4 bitų slankiojo kablelio (FP4) išvada DI yra technika, skirta apmokytiems neuroniniams tinklams paleisti, naudojant skaičius, vaizduojamus tik keturiais bitais, smarkiai sumažinant skaičiavimo ir atminties reikalavimus, palyginti su didesnio tikslumo formatais, tokiais, kaip FP32 arba FP16.

Kaip tai veikia

Kvantavimas, pagrindinis procesas, apima originalių, didelio tikslumo slankiojo kablelio verčių (svorių ir aktyvacijų) susiejimą su ribotu 16 skirtingų verčių rinkiniu, kurį galima pavaizduoti keturiais bitais. Šis susiejimas paprastai naudoja mastelio koeficientą, kad skaičiai atitiktų 4 bitų diapazoną. Yra įvairių šio susiejimo metodų, įskaitant FP4 (standartinį slankiojo kablelio skaičių su ženklu, eksponente ir mantisa) ir NF4 (normalizuotą slankiojo kablelio skaičių), kuris yra optimizuotas normaliai pasiskirsčiusiems kintamiesiems, pvz., neuroninių tinklų svoriams, remiantis „Medium“. Kvantuotas vertes modelis apdoroja išvados darymo metu.

Privalumai:

Mažesnis modelio dydis: žymiai sumažina dirbtinio intelekto modelio dydį, todėl jį lengviau saugoti ir diegti, ypač įrenginiuose su ribota atmintimi. Pavyzdžiui, modelis, kuriam reikia 32 GB vaizdo atminties FP32 formatu, su FP4 kvantavimu gali sunaudoti mažiau nei 10 GB.

Padidintas išvadų greitis: sumažinus duomenų dydį ir skaičiavimo sudėtingumą, FP4 išvadų darymas gali lemti greitesnes prognozes ir mažesnę delsą, o tai ypač svarbu realaus laiko programoms ir periferiniams įrenginiams.

Energijos vartojimo efektyvumas: mažiau skaičiavimų reiškia mažesnes energijos sąnaudas, o tai labai svarbu mobiliosioms ir įterptosioms sistemoms.

Mastelio keitimas: leidžia diegti galingus dirbtinio intelekto modelius vartotojų lygio įrangoje ir efektyviau naudoti debesų kompiuterijos išteklius.

Iššūkiai ir svarstytini dalykai

Tikslumo praradimas: pagrindinis trūkumas yra galimas modelio tikslumo sumažėjimas, nes skaičių vaizdavimas su mažesniu bitų skaičiumi savaime praranda tam tikrą tikslumą. Šio praradimo mastas gali priklausyti nuo konkretaus modelio, duomenų rinkinio ir naudojamų kvantavimo metodų. Pavyzdžiui, 4 bitų kvantavimas paprastai lemia 2–5 % tikslumo sumažėjimą, palyginti su mažiau, nei 1 % sumažėjimu 8 bitų kvantavimo atveju.

Aparatinės įrangos palaikymas: Efektyviam FP4 išvadų teikimui dažnai reikalinga specializuota aparatinė įranga mažo tikslumo operacijoms, pvz., „Nvidia“ „Tensor Cores“, rašoma „zach's“ technologijų tinklaraštyje.

Įgyvendinimo sudėtingumas: Kvantavimo metodus gali būti sudėtinga įgyvendinti teisingai ir efektyviai.

Nuokrypių poveikis: Ekstremalios vertės pradiniuose slankiojo kablelio duomenyse gali kelti iššūkių kvantavimui, todėl gali prireikti specialaus apdorojimo, kad būtų sumažintas poveikis tikslumui.

Taikymo sritys

FP4 išvadų teikimas ypač tinka scenarijams, kai efektyvumas, greitis ir diegimas įrenginiuose su ribotais ištekliais yra svarbiausi. Tai apima:

Perimetro įrenginius: mobiliuosius telefonus, daiktų interneto įrenginius ir įterptąsias sistemas, kuriose atmintis ir apdorojimo galia yra riboti.

Didelių kalbų modelius (LLM): žymiai sumažinant šių modelių atminties užimamą dalį, todėl įmanomas lengvas tolesnis diegimas vartotojų GPU.

Kompiuterinė rega: užduotys, tokios kaip objektų klasifikavimas, veidų atpažinimas ir segmentavimas, kai priimtiną tikslumą galima pasiekti su sumažintu tikslumu.

Kalbos ir natūralios kalbos apdorojimas: programos, tokios kaip raktinių žodžių atpažinimas ir transformatoriais pagrįsti modeliai.

Išvada

4 bitų slankiojo kablelio išvados yra, sparčiai besivystanti, dirbtinio intelekto tyrimų ir plėtros sritis. Nors ji kelia tam tikrų iššūkių, ypač valdant tikslumo kompromisus, jos potencialas sudaryti sąlygas greitesniems, efektyvesniems ir, plačiau diegiamiems, dirbtinio intelekto modeliams įvairiose platformose daro ją labai perspektyvia ir įtakinga technologija.

Mokslas, studijos ir ekonomika

2025 m. liepos 16 d., trečiadienis

JAV prekybos sekretorius Howardas Lutnickas teigia, kad „Nvidia“ lustai Kinijoje naudingi JAV

Komentarų nėra:

Rašyti komentarą