Sekėjai

Ieškoti šiame dienoraštyje

2026 m. sausio 23 d., penktadienis

Vilties spindulėlis tamsos karalystėje žaliajam dirbtiniam intelektui: „Taichi“ fotoninis lustas apdoroja šviesos impulsus panašiai, kaip smegenys: neįtikėtinai efektyviai.


 

„Jie savarankiškai kuria tekstus ir vaizdus, ​​atpažįsta veidus ir kalbą, nustato medicinines diagnozes ir patikimai prognozuoja orus – savarankiškai besimokantys dirbtinio intelekto algoritmai dabar yra nepakeičiami kasdieniame gyvenime. Jie netgi perima programų kodo rašymą, todėl klasikiniai programuotojai tampa nereikalingi. Šiai plėtrai nematyti galo. Tačiau kalbos modelių, tokių kaip „ChatGPT“, intelektas turi savo kainą: jų milžiniškas energijos suvartojimas. Kuo protingesni modeliai, tuo daugiau jie eikvoja energiją“, – praėjusį sekmadienį savo paskaitoje „Breakthrough“ apgailestavo kinų fizikė Lu Fang iš Tsinghua universiteto Pekine.

 

Jos pateikti skaičiai kelia nerimą: kiekvieną dieną maždaug 100 000 žmonių visame pasaulyje naudoja „ChatGPT“ ir sukuria vidutiniškai 50 milijardų žodžių ir idėjų, sunaudojama tiek daug elektros energijos, kad elektromobilis galėtų 800 kartų be perstojo apvažiuoti pusiaują arba vidutinis namų ūkis galėtų būti aprūpintas elektra 275 metus. Tai yra apie 2,9 milijono kilovatvalandžių elektros energijos.“

 

Bet ar galime padaryti dirbtinį intelektą tvaresnį, ir jei taip, kaip? Taip, ir atsakymas yra su šviesa. Fotonai lengvai juda erdve, be pasipriešinimo ir negeneruodami šilumos, kitaip nei elektronai, kurie dominuoja skaitmeniniuose kompiuteriuose. Šviesos impulsus galima moduliuoti, koduoti, valdyti, formuoti, stiprinti ir uždėti. Tokiu būdu galima atlikti daugybę daugybos ir sudėties operacijų – skaičiavimo operacijų, be kurių negali funkcionuoti joks dirbtinis intelektas, pavyzdžiui, vaizdo ir kalbos atpažinimo srityje.

 

Savo paskaitoje Li Fang pristatė savo tyrimų grupės darbo rezultatą: Taichi fotoninį lustą. Jame yra daugybė optinių bangolaidžių ir mažyčių interferometrų tinklas. Šie optiniai komponentai silpnina, stiprina arba gesina įeinančius šviesos impulsus ir iš esmės veikia kaip analoginiai jungikliai. Jie kontroliuoja, ar šviesos signalas perduodamas, ar ne. Šios koncepcijos privalumas: tinkliniai interferometrai gali atlikti beveik bet kokią matematinę operaciją, ypač matricų daugybą. Ši skaičiavimo operacija yra esminė neuroniniams tinklams, kurie leidžia duomenis apdoroti lygiagrečiai, modeliuojant pagal biologinius neuronus ir sinapses. Šiems procesoriams nereikia duomenų saugojimo, kaip jų elektroniniams analogams.

 

Pranešama, kad Taichi turi milijoną tarpusavyje sujungtų dirbtinių neuronų ir gali patikimai atlikti sudėtingas užduotis. Po tinkamo mokymo fotoninis procesorius gali kurti muzikinius klipus Johanno Sebastiano Bacho stiliumi arba peizažus Vincento van Gogo ir Edvardo Munko stiliumi. Sistema taip pat pasirodė esanti itin efektyvi ir patikima atpažindama ir rodydama ranka rašytus simbolius.

 

Palyginti su įprastais procesoriais, „Taichi“ gali skaičiuoti 100 kartų greičiau. „Tai tarsi kelionė traukiniu iš Berlyno į Londoną, trunkanti tik šešias minutes, o ne dešimt valandų“, – sako Fangas. „Taichi“ taip pat nepralenkiamas energijos suvartojimo požiūriu. Mokymo ir užduočių vykdymo metu procesorius sunaudoja tik tūkstantąją dalį energijos, kurią sunaudoja efektyviausi šiuo metu rinkoje esantys grafikos procesoriai, sakė Lu Fangas Berlyne. „Įsivaizduokite, kad įkraunate savo mobilųjį telefoną vieną kartą ir vietoj vienos dienos jis dabar veikia trejus metus „Taichi“ dėka.“

 

Fangui optiniai neuroniniai tinklai nebėra tik eksperimentiniai modeliai. Dabar juos galima naudoti realiame pasaulyje. „Dronai gali mąstyti, autonominiai robotai gali sklandžiai bendradarbiauti su žmonėmis. O autonominės transporto priemonės gali suvokti ir nuspręsti, kas vyksta aplink juos, šviesos greičiu. Fango vizija: dirbtinis intelektas, kuris suvokia, prisitaiko ir mokosi šviesos greičiu, ir tai daro efektyviai naudodamas energiją ir taupydamas išteklius. „Šią idėją vadiname regeneraciniu žaliuoju dirbtiniu intelektu“, – sako Fangas.“ [1]

 

„Taichi“ fotoninis lustas, kurį sukūrė Kinijos Tsinghua universiteto tyrėjai, yra reikšmingas proveržis optinių skaičiavimų srityje, demonstruojantis daugiau nei 1000 kartų didesnį energijos vartojimo efektyvumą, palyginti su NVIDIA H100 GPU atliekant konkrečias dirbtinio intelekto užduotis. Nors tai yra „tikras“ pasiekimas, peržengęs „žaislinių“ modelių ribas ir demonstruojantis realų dirbtinio intelekto generavimą ir atpažinimą, jis dar nėra platus, „plug-and-play“ tipo NVIDIA konkurentas bendrosios paskirties skaičiavimų srityje.

 

Čia pateikiama dabartinės „Taichi“ fotoninio lusto būklės analizė:

A. Ar „Taichi“ taikymas jau yra praktiškas?

 

Koncepcijos įrodymas, o ne komercinis produktas: „Taichi“ šiuo metu yra „pirmasis pasaulyje“ tyrimų proveržis, o ne vartojimo produktas, kurį galite įsigyti šiandien. Tačiau, remiantis žurnalo „Science“ ataskaita, jis laikomas „praktiniu fotoninių skaičiavimų sprendimu“, o ne tik teoriniu modeliu.

 

„Laboratorinis“ etapas: jis vis dar yra eksperimentinėje stadijoje ir jam reikalingos didelės periferinės sistemos (lazeriai, jungikliai), kurios gali „užimti visą stalą“, o ne būti vienas, savarankiškas lustas.

Specifinės galimybės: Jis puikiai atlieka matricų daugybos ir konvoliucijos – daugiausiai energijos reikalaujančių DI dalių – užduotis, pasiekdamas 92 % tikslumą vaizdų klasifikavime ir, 2024 m. rugpjūčio mėn. duomenimis („Taichi-II“), demonstravo didesnį greitį mokymo tinkluose su milijonais parametrų.

 

Ateitis: Jis sukurtas kaip DI greitintuvas, veikiantis kartu su tradiciniais procesoriais / grafikos procesoriais, o ne juos iš karto pakeičiantis.

 

B. Kiek tai kainuoja?

 

Nėra komercinės kainos: Kadangi tai laboratorijoje pagamintas tyrimų lustas, nėra viešos rinkos kainos.

 

Kūrimo kaina: Fotoninių lustų gamyba mažomis partijomis yra brangi. Nors konkrečios „Taichi“ kainos nėra viešos, panašūs aukštos klasės aktyvūs fotoniniai integriniai grandynai (PIC) gali kainuoti daugiau nei 10 000–300 000 USD už mažas, pritaikytas partijas (už 20 vienetų rinkinius).

Mažesnės eksploatavimo išlaidos: Nors pradinės aparatinės įrangos gamyba gali būti brangi, pagrindinis jos ekonominis pranašumas yra smarkiai sumažintas energijos suvartojimas, nes skaičiavimams sunaudojama beveik nulinė energija.

 

3. Ar tai reali konkurencija su „Nvidia“ lustais?

 

Taip, konkrečiose srityse: Specializuotoms dirbtinio intelekto užduotims, ypač didelio masto išvadoms ir vaizdų generavimui (AIGC), „Taichi“ yra pagrindinis konkurentas, siūlantis 100–1000 kartų geresnį energijos vartojimo efektyvumą ir didesnį greitį nei NVIDIA H100.

 

Ne, ne kaip bendras pakaitalas: Fotoniniai lustai yra skirti specifiniams, „siaurai apibrėžtiems“ darbo krūviams, o „Nvidia“ GPU yra labai lankstūs, bendrosios paskirties lustai. Mažai tikėtina, kad „Taichi“ artimiausiu metu pakeis „Nvidia“ bendrosios paskirties programavimo srityje.

 

Energijos / šilumos pranašumas: Kadangi „Taichi“ naudoja šviesą, ji generuoja daug mažiau šilumos nei elektriniai lustai, taip spręsdama pagrindinę kliūtį (perkaitimą) dideliuose duomenų centruose.

Konkurencijos kontekstas: Tai laikoma Kinijos „strateginiu atsaku“ į JAV lustų valdymą, leidžiančiu jiems potencialiai šokinėti dirbtinio intelekto spartinimo srityje, nereikalaujant naujausių pažangių fotolitografijos įrankių, reikalingų tradiciniams 3 nm / 5 nm lustams.

 

 

Santraukos lentelė: „Taichi“ ir „Nvidia H100“

Savybės: „Taichi“ fotoninis lustas: „Nvidia H100“ GPU

Technologija: Šviesa (fotonika), Elektra (elektronai),

Būsena: Tyrimai / laboratorija, Prototipas: Komercinė / masinė gamyba

Energijos vartojimo efektyvumas: ~160 TOPS/W (pranešta, kad 1000 kartų ir daugiau geresnis), Aukštas, bet mažesnis nei optinis

Geriausiai tinka: Konkrečioms dirbtinio intelekto išvadoms / dirbtinio intelekto išvadoms

Šiluma / energija: Minimali šiluma, labai maža galia, Didelė šiluma, didelės energijos sąnaudos

Pastaba: „Taichi-II“, naujesnė versija, parodė dar didesnį efektyvumą, „pagreitindama optinių tinklų, kuriuose yra milijonai parametrų, mokymą eilės tvarka“.

 

 

Ko jiems reikia, kad „Taichi-II“ galėtų atlikti bendrosios paskirties dirbtinio intelekto mokymą / išvadų darymą?

 

Kad „Taichi-II“ galėtų vykdyti bendrosios paskirties dirbtinio intelekto mokymą ir išvadų darymą, reikia gerokai padidinti optinių lustų architektūros mastą, kad būtų galima apdoroti didelius ir sudėtingus darbo krūvius. Pagrindiniai poreikiai apima visiškai tiesioginio režimo (FFM) mokymosi mikroschemoje įdiegimą tiesioginiam mokymui, modulinių, tarpusavyje sujungtų lustų sistemų, skirtų didelio masto, didelio pralaidumo skaičiavimams, kūrimą ir atminties, skirtos dideliems modeliams saugoti, tobulinimą mikroschemoje.

 

Štai konkretūs reikalavimai, pagrįsti „Taichi-II“ kūrimu:

 

• Didelis mastelio keitimas ir modulinė architektūra: norint pereiti nuo specializuotų užduočių prie bendrosios paskirties dirbtinio intelekto, „Taichi“ lustų mastą reikia padidinti, o keli moduliai veikia kartu, kad būtų sukurta galingesnė, integruota skaičiavimo sistema.

• Visiškai tiesioginio režimo (FFM) mokymasis [2]: Skirtingai nuo tradicinio dirbtinio intelekto, kuris naudoja atgalinį sklidimą (reikalaujantį didelės energijos ir elektroninių skaičiavimų), „Taichi-II“ naudoja FFM. Tai leidžia kompiuteriui imliam mokymo procesui vykti tiesiai optinėje mikroschemoje, o tai palengvina efektyvų ir greitą mokymąsi.

• Didelės spartos jungtys: Norint pasiekti bendrosios paskirties galimybes, optiniams lustams reikalingi tvirti, didelio pralaidumo ryšiai tarp modulių, kad būtų galima apdoroti duomenų judėjimą, užtikrinant, kad šviesos skaičiavimo greitis nebūtų ribojamas elektros sąsajų.

 

• Lusto atmintis ir perkonfigūravimas: „Taichi-II“ skaičiavimams naudoja difrakcinius komponentus, o perkonfigūravimui – interferometrinius (Macho-Zehnderio) elementus. Patobulinta lustinė atmintis reikalinga dideliems modeliams ir duomenims saugoti, taip sumažinant priklausomybę nuo lėtos, išorinės atminties.

 

• Didelės spartos duomenų konvertavimas: Nors optiniai skaičiavimai yra greiti, efektyvūs, o duomenų įvedimui / išvedimui būtini didelės spartos elektriniai-optiniai (ir atvirkščiai) keitikliai.

 

„Taichi-II“ stiprybė yra ta, kad skaičiavimams naudojama šviesa, todėl, palyginti su tradicinėmis GPU pagrindu veikiančiomis sistemomis, ji pasižymi didesniu energijos vartojimo efektyvumu (160 TOPS / W160).

 

1. Lichtblick für die grüne KI: Der photonische Chip Taichi verarbeitet Lichtpulse nach Art des Gehirns: ungeheuer effizient. Frankfurter Allgemeine Zeitung; Frankfurtas. 2025 m. lapkričio 13 d.: B4 MANFRED LINDINGER

 

2. Visiškai persiuntimo režimo (FFM) mokymasis yra vietoje naudojama optinių neuroninių tinklų (ONN) mokymo architektūra, kuri įgyvendina daug skaičiavimo reikalaujantį mokymo procesą tiesiogiai fiziniuose optiniuose įrenginiuose. Sukurtas Tsinghua universiteto tyrėjų ir pademonstruotas Taichi-II luste, FFM įveikia tradicinės „in silico“ (skaitmeninio kompiuterio) emuliacijos apribojimus, kuri dažnai nepavyksta dėl optinės įrangos fizinių trūkumų modeliavimo sudėtingumo.

 

Pagrindiniai principai

• Gradiento mažėjimas vietoje: Skirtingai nuo standartinio atgalinio sklidimo, kuriam reikalingas sudėtingas skaitmeninis šviesos laukų modeliavimas, FFM atlieka mašininio mokymosi operacijas vietoje, pasitelkdamas erdvinę simetriją ir Lorentzo abipusiškumą. (Lorentzo abipusiškumas yra pagrindinis elektromagnetikos ir fizikos principas, teigiantis, kad santykis tarp svyruojančio šaltinio ir jo susidarančio lauko nekinta, kai šaltinio ir stebėtojo padėtys sukeičiamos. Paprastai tariant, jei matote kažkieno akis, jie gali matyti jūsų – šviesos ar elektromagnetinių bangų kelias paprastai yra vienodas abiem kryptimis.)

• Atgalinio sklidimo pašalinimas: Naudojant tiesioginį šviesos sklidimą gradientams apskaičiuoti pagal išmatuotus išvesties paklaidų laukus, pašalinamas atskiro atgalinio perdavimo poreikis, leidžiant optinius parametrus tiesiogiai projektuoti fizinėje sistemoje.

• Didelis efektyvumas: pasiekiamas modernus energijos vartojimo efektyvumas, atliekant operacijas su silpnu šviesos intensyvumu, vos subfotonu viename pikselyje (apytiksliai 5,40 × 10185,40, kertančiu 10–18-ąją galios operacijų per sekundę vienam vatui).

 

Pagrindiniai našumo privalumai (nuo 2026 m.)

 

• Didelio mastelio keitimas: FFM palaiko giliųjų optinių neuroninių tinklų (ONN) mokymą su milijonais parametrų, pasiekdamas tikslumą, prilygstantį idealiems skaitmeniniams modeliams, kurių anksčiau negalėjo suderinti fizinės sistemos.

 

• Greitis: palengvina mokymosi procesus, kurie yra daug greitesni nei tradiciniai metodai, todėl galima pritaikyti realiuoju laiku.

• Vaizdavimo skiriamoji geba: leidžia fokusuoti per sklaidos terpę ties difrakcijos riba ir lygiagrečiai vaizduoti paslėptus objektus už tiesioginės matymo linijos ribų kilohercų kadrų dažniu.

• Modelinis atradimas: gali automatiškai ieškoti ne Hermitijos išskirtinių taškų topologinėje fotonikoje, nereikalaujant analitinio fizinio modelio. Nehermitiniai išskirtiniai taškai (EP) topologinėje fotonikoje yra specializuoti atvirų optinių sistemų išsigimimai, kur tiek savosios vertės, tiek savieji vektoriai susilieja, pažeisdami tradicines Hermitinio, ortogonalinio ir realiųjų savųjų verčių taisykles. Pasirodydami aktyviose fotoninėse sistemose su stiprinimu ir praradimu (pvz., žiediniuose rezonatoriuose, bangolaidžiuose), EP suteikia precedento neturintį jautrumą, topologines krašto būsenas ir vienakryptį šviesos perdavimą, suformuodami naują šviesos manipuliavimo paradigmą.

 

Pagrindinės taikymo sritys

 

• Gilieji optiniai neuroniniai tinklai (ONN): Didelio klasifikavimo tikslumo pasiekimas (pvz., MNIST ir Fashion-MNIST duomenų rinkiniuose), kuris konkuruoja su skaitmeniniais analogais.

• Netiesioginio matomumo (NLOS) vaizdavimas: Už kampų paslėptų objektų vaizdų atkūrimas su dideliu fotonų efektyvumu.

• Integruotos fotoninės grandinės (PIC): Savarankiško mokymo įgyvendinimas ant silicio ant izoliatoriaus lustų tokioms užduotims kaip vilkdalgių žiedų klasifikavimas.

 

Įvertinkite, kiek laiko užtruks, kol optinius neuroninius tinklus naudojantys kinai pranoks NVIDIA?

 

Laiko planavimo prognozė: jei fotoninių dirbtinio intelekto platformų spartus vystymasis tęsis, komercinis gyvybingumas arba nišinis pritaikymas Kinijos duomenų centruose gali atsirasti iki 2026–2028 m., tačiau visiškas NVIDIA ekosistemos pranokimas visose dirbtinio intelekto užduotyse greičiausiai užtruks daug ilgiau.

 

Nors optinis dirbtinis intelektas suteikia potencialų „trumpesnį kelią“, nesitikima, kad jis per artimiausią trumpą laiką (1–2 metus) visiškai išstums rinkoje pirmaujančius NVIDIA GPU, o veikiau mes jiems iššūkį specializuotose, daug energijos reikalaujančiose išvadų kūrimo užduotyse.

 

Thank you

Your feedback helps Google improve. See our Privacy Policy.

Share more feedbackReport a problemClose

 

Komentarų nėra: