Sekėjai

Ieškoti šiame dienoraštyje

2025 m. sausio 17 d., penktadienis

Kinijos dirbtinio intelekto startuoliai įveikia JAV konkurentus

 

 „SINGAPŪRAS – Kinijos startuoliai rodo, kad greičiau, nei daugelis pramonės atstovų tikėjosi, gali pasivyti pirmaujančius Amerikos dirbtinio intelekto modelius, nepaisant apribojimų, su kuriais Kinija susiduria, pirkdama pažangius lustus.

 

 Vienas sėkmingiausių Kinijos rizikos draudimo fondų valdytojų finansuojamas startuolis „DeepSeek“ lapkritį išleido naujausio didelio kalbinio modelio peržiūros versiją. Jame teigiama, kad programos gebėjimai yra palankesni, lyginant su OpenAI samprotavimo modeliu, pavadintu o1, kuris buvo išleistas rugsėjo mėnesį.

 

 Kitos Kinijos bendrovės pastarosiomis savaitėmis pareiškė panašius teiginius. Kinijos interneto gigantų „Alibaba“ ir „Tencent“ remiamas startuolis „Moonshot AI“ teigė, kad sukūrė matematikos modelį, kurio galimybės yra artimos „o1“, o „Alibaba“ teigė, kad vienas iš jos eksperimentinių tyrimų modelių pralenkė JAV modelio peržiūros versiją matematikos srityje.

 

 Įmonės nepaskelbė dokumentų, kuriuose būtų aprašyti jų modeliai, o vertinti teiginius sunku, nes nėra nė vieno sutarto AI modelio gebėjimų testo. Vis dėlto kai kurie JAV specialistai teigė esantys sužavėti.

 

 Kinija „greičiau vejasi“, – sakė buvęs OpenAI bendradarbis ir šiuo metu dirbtinio intelekto verslininkas Andrew Carras. Jis sakė, kad „DeepSeek“ tyrėjai, bandantys atkartoti „OpenAI“ samprotavimo modelį, „tai suprato per kelis mėnesius, ir, tiesą sakant, daugelis mano kolegų dėl to nustebę“.

 

 Vienas palyginimui naudojamas testas yra Amerikos kviečiamasis matematikos egzaminas (AIME), kuris skirtas iššūkiams ryškiausiems vidurinių mokyklų matematikos studentams.

 

 „DeepSeek“ teigė, kad jos modelis yra geriausias „OpenAI“ AIME. The Wall Street Journal atliktas eksperimentas, naudojant 15 problemų iš šių metų AIME, parodė, kad OpenAI o1 peržiūros modelis atsakymus gavo greičiau, nei DeepSeek, Moonshot ir eksperimentinis Alibaba modelis. Vieno žodžio galvosūkis, apimantis strategiją hipotetiniame dviejų žaidėjų žaidime, OpenAI programa pateikė atsakymą per 10 sekundžių, o DeepSeek užtruko daugiau, nei dvi minutes.

 

 Gauti teisingą atsakymą iš pirmo karto vis dar yra žygdarbis, nes tekstinės problemos dažnai trikdo dirbtinio intelekto programas.

 

 Kinijos dirbtinio intelekto kūrėjai nuo 2022 m. susidūrė su JAV apribojimais pasiekti pažangiausius pasaulyje AI lustus, įskaitant lustų lyderės Nvidia. Bideno administracija gruodį vėl sugriežtino eksporto kontrolės taisykles.

 

 Tačiau kūrėjai rado išeitį.

 

 „Moonshot“, startuolio, remiamo „Alibaba“ ir „Tencent“, įkūrėjas Yang Zhilin teigė, kad bendrovė daugiausia dėmesio skiria mokymuisi, kuris imituoja žmonių bandymus ir klaidas. Šis metodas gali ne taip intensyviai naudoti skaičiavimo galią, gerinant našumą.

 

 Nuo praėjusių metų pabaigos dirbtinio intelekto kūrėjai vis dažniau naudoja techniką, vadinamą „ekspertų mišiniu“ arba MoE, kai pradinis maršruto nustatymo mechanizmas nukreipia problemą į specializuotą eksperto modelį, pavyzdžiui, vyriausiasis virėjas, nukreipiantis spagečių užsakymą virtuvės italų virėjui. .

 

 „Tencent“ teigė, kad jo lapkritį išleisto MoE modelio našumas panašus į „Llama 3.1“ modelį, kurį liepą pristatė „Facebook“ savininkė Meta Platforms. Tyrėjai, peržiūrėję dviejų įmonių publikuotus dokumentus, teigė, kad Tencent modelis, greičiausiai, buvo apmokytas su maždaug dešimtadaliu Meta naudojamos skaičiavimo galios.

 

 „DeepSeek“ pradėjo veikti, kaip „High-Flyer“, kiekybinio rizikos draudimo fondo valdytojo, turinčio 8 mlrd. dolerių turto, kuris yra žinomas dėl AI panaudojimo prekybai, AI tyrimų padalinys. 2021 m. „DeepSeek“ sujungė apie 10 000 „Nvidia“ A100 lustų, kad sudarytų dirbtinio intelekto mokymų grupę, kurią pavadino „Fire-Flyer 2“.

 

 Šį rugpjūtį paskelbtame dokumente „DeepSeek“ teigė, kad „Fire-Flyer 2“ našumas panašus į „Nvidia“ sistemą, kurioje yra panašių lustų, tačiau Kinijos sistema kainuoja mažiau ir sunaudojo mažiau energijos. „DeepSeek“ gegužės mėn. dokumentas apie savo Vidaus reikalų ministerijos modelį, kuriame buvo efektyviau apdoroti duomenis, buvo plačiai pastebėtas pramonėje.

 

 „Vienas būdas Kinija apeis eksporto kontrolę – sukurs itin gerą programinės ir aparatinės įrangos mokymo krūvą, naudodama aparatinę įrangą, kurią gali pasiekti“, – savo tinklaraštyje rašė Jackas Clarkas, AI startuolio Anthropic įkūrėjas, kalbėdamas apie „DeepSeek“ grupę. „Pagaminta Kinijoje bus tinkama dirbtinio intelekto modeliams, kaip ir elektromobiliams, dronams ir kitoms technologijoms“, – rašė jis.

 

 Daugelis Kinijos AI kūrėjų rado būdų, kaip pasiekti ribotus Nvidia lustus, įskaitant prekybą su tarpininkais ir užsienio duomenų centrais.

 

 Nepaisant to, Kinijos vadovų teigimu, pažangiausių lustų trūkumas Kinijos startuoliams yra skausmingas, o atotrūkis gali didėti. „Nvidia“ klientai ruošiasi dideliu mastu įdiegti naujausią AI duomenų centro lustą, vadinamą „Blackwell“.

 

 Elono Musko xAI sukonstravo duomenų centrą su 100 000 „Nvidia“ lustų ir neseniai surinko 5 mlrd. dolerių, kad padarytų daugiau. „Amazon Web Services“ planuoja sukurti didžiulį dirbtinio intelekto superkompiuterį su šimtais tūkstančių vietinių lustų. Kinijos AI startuoliai šiuo metu vertinami tik dalimi JAV vertės tokioms įmonėms, kaip OpenAI, nes finansininkai nėra tikri dėl savo galimybių užsidirbti pinigų iš savo avansų.“ [1]

 

1. China's AI Startups Are Gaining on U.S. Rivals. Huang, Raffaele; Qu, Tracy.  Wall Street Journal, Eastern edition; New York, N.Y.. 27 Dec 2024: B4. 

China's AI Startups Are Gaining on U.S. Rivals


"SINGAPORE -- Chinese startups show signs of catching up with America's leading artificial-intelligence models more quickly than many in the industry had expected, despite the restrictions China faces in buying advanced chips.

DeepSeek, a startup funded by one of China's most successful hedge-fund managers, released a preview version of its latest large language model in November. It said the program's abilities compared favorably with OpenAI's reasoning model called o1, which came out in preview form in September.

Other Chinese companies have made similar claims in recent weeks. Moonshot AI, a startup backed by Chinese internet giants Alibaba and Tencent, said it developed a model specializing in math with capabilities close to o1, while Alibaba said one of its own experimental research models outperformed the preview version of the U.S. model on math.

The companies haven't published papers describing their models, and evaluating the claims is difficult because there isn't a single agreed-upon test of an AI model's abilities. Still, some U.S. specialists said they were impressed.

China is "catching up faster," said Andrew Carr, a former fellow at OpenAI and currently an AI entrepreneur. He said DeepSeek researchers trying to replicate OpenAI's reasoning model "figured it out within a few months, and frankly many of my colleagues are surprised by that."

One test used for comparison is the American Invitational Mathematics Examination, which is designed to challenge the brightest high-school math students.

DeepSeek said its model bested OpenAI's on the AIME. An experiment by The Wall Street Journal using 15 problems from this year's AIME found that OpenAI's o1 preview model got to the answers faster than DeepSeek, Moonshot and the experimental Alibaba model. In one word puzzle involving strategy in a hypothetical two-player game, the OpenAI program gave the answer in 10 seconds while DeepSeek took more than two minutes.

Getting the correct answer on the first try is still a feat because word problems often stump AI programs.

Chinese AI developers have faced U.S. restrictions on access to the world's most advanced AI chips, including those from chip leader Nvidia, since 2022. The Biden administration in December again tightened export control rules.

But the developers have found workarounds.

At Moonshot, the startup backed by Alibaba and Tencent, founder Yang Zhilin has said the company is focusing on reinforcement learning, which mimics humans' trial and error. The approach might use computing power less intensively in improving performance.

Since late last year, AI developers have increasingly been using a technique called "mixture of experts," or MoE, in which an initial routing mechanism directs the problem to a specialized expert model like a head chef directing a spaghetti order to the kitchen's Italian cook.

Tencent said its MoE model, released in November, delivered performance comparable to a Llama 3.1 model introduced in July by Facebook owner Meta Platforms. Researchers who reviewed papers published by the two companies said Tencent's model was likely trained with around one-tenth of the computing power Meta used.

DeepSeek started as the AI research unit of High-Flyer, a quantitative hedge-fund manager with $8 billion in assets that is known for leveraging AI to trade. In 2021, DeepSeek connected around 10,000 of Nvidia's A100 chips to form a cluster for AI training, which it called Fire-Flyer 2.

In a paper published this August, DeepSeek said Fire-Flyer 2 achieved performance close to an Nvidia system containing similar chips, but the Chinese system cost less and consumed less energy. DeepSeek's May paper on its MoE model, which incorporated a technique to process data more efficiently, was widely noted in the industry.

"One way China will get around export controls -- building extremely good software and hardware training stacks using the hardware it can access," Jack Clark, co-founder of AI startup Anthropic, wrote in his blog, referring to DeepSeek's cluster. "Made in China will be a thing for AI models, same as electric cars, drones, and other technologies," he wrote.

Many Chinese AI developers have found ways to access restricted Nvidia chips, including through trades with middlemen and overseas data centers.

Nonetheless, the lack of cutting-edge chips is painful to the Chinese startups, according to Chinese executives, and the gap is poised to widen. Nvidia customers are preparing to deploy its latest AI data-center chip, called Blackwell, at significant scale.

Elon Musk's xAI has constructed a data center with 100,000 Nvidia chips and recently raised $5 billion to do more. Amazon Web Services plans to build a massive AI supercomputer with hundreds of thousands of its homegrown chips. Chinese AI startups are currently valued at a fraction of U.S. companies such as OpenAI because financiers are unsure about their ability to monetize their advances." [1]

1. China's AI Startups Are Gaining on U.S. Rivals. Huang, Raffaele; Qu, Tracy.  Wall Street Journal, Eastern edition; New York, N.Y.. 27 Dec 2024: B4. 

 

Ilgaamžiškumo mokslas turi savo akimirką --- Būsimo prezidento pasirinktos geriausios šalies sveikatos priežiūros pareigos yra susijusios su senėjimo sfera, kuri dabar tampa populiari


 „Antrojoje Trumpo administracijoje daugėja ilgaamžiškumo entuziastų.

 

 Būsimo prezidento pasirinkti kandidatai geriausioms šalies sveikatos darbo vietoms yra susiję su ilgaamžiškumo sritimi ir kai kuriais atvejais jiebuvo patys buvo klientai. Mokslininkai ir verslininkai tikisi, kad naujoji administracija palengvins, senėjimą stabdančių, gydymo būdų kūrimą ir padidins mokslinių tyrimų finansavimą.

 

 Tokie pokyčiai dar labiau išplėstų kadaise buvusią pakraščio pramonę, kuri dabar tapo pagrindine. Šioje srityje vis dar yra daug niekintojų, tačiau ilgaamžiškumo praktika nuo papildų iki intraveninių lašelių, iki vaistų, kurie taikomi ne pagal etiketes, vartojimo tapo vis dažnesnė, o tai paskatino sveikatos podcasteriai, fitneso broliai ir kai kurie tradiciniai gydytojai.

 

 „Mokslas apie senėjimą pasiekė lūžio tašką, kai jis yra per didelis ir per daug įdomus, kad kokia nors vyriausybė nepaisytų“, – sako Jamesas Peyeris, ilgaamžiškumo biotechnologijų „Cambrian Bio“ generalinis direktorius ir ilgaamžiškumo biotechnologijų ne pelno organizacijos valdybos direktorius.

 

 Robertas F. Kennedy jaunesnysis, išrinktojo prezidento Donaldo Trumpo išrinktasis vadovauti Sveikatos ir žmogiškųjų paslaugų departamentui, 2023 m. podcast'e sakė, kad laikosi senėjimo prevencijos protokolo ir pridūrė, kad vartoja per daug vitaminų, kad būtų galima išvardyti. Tais pačiais metais Joe Rogano podcast'o epizode Roganas papasakojo Kennedy, kad gėrė NAD+ – priedą, populiarų tarp ilgaamžiškumo entuziastų, o Kennedy atsakė: „Aš dariau tą patį“.

 

 Bryanas Johnsonas, biologinis įsilaužėlis, kurio ilgaamžiškumo režimas pristatomas naujame „Netflix“ dokumentiniame filme, sako, kad nori padėti Ameriką padaryti „sveikiausia šalimi pasaulyje“ ir kad Kennedy yra draugas. Johnsonas, kurio šūkis yra „Nemirk“, X platformoje dieną po prezidento rinkimų paskelbė savo ir Kennedy nuotrauką su antrašte „MAHA“, sutrumpintu Kennedy šūkiu „Make America Healthy Again“ (Padaryk Ameriką vėl sveika, angl.).

 

 Jimas O'Neillas, siūlomas Kennedy pavaduotojas, buvo SENS tyrimų fondo, ne pelno organizacijos, finansuojančios senėjimo tyrimus, įkūrėjas ir buvęs vadovas. 2020 m. interviu podcast'e jis sakė, kad grupė bandė kurti vaistus, kurie „paverstų senėjimą, o ne tik sulėtintų“, ir kritikavo reguliavimo kliūtis medicinos naujovėms.

 

 Johnso Hopkinso universiteto chirurgas Marty Makary, Trumpo pasirinktas vadovauti Maisto ir vaistų administracijai, taip pat sulaukė didelių vardų ilgaamžiškumo srityje palaikymo. Ilgaamžiškumo mokslininkas Davidas Sinclairas per X sakė, kad Makary buvo „puikus pasirinkimas“, ir pakartojo „Fox News“ interviu, kuriame Makary teigė, kad yra mokslinių įrodymų, patvirtinančių senėjimo proceso grįžimą arba sulėtinimą.

 

 Kennedy, O'Neill ir Makary neatsakė į prašymus komentuoti.

 

 Ilgaamžiškumo tyrinėtojai, verslininkai ir sveikatos entuziastai, besilaikantys senėjimo prevencijos praktikos, turi ilgą administracijos, kuri, jų manymu, bus draugiška, pageidavimų sąrašą. Tai apima pagalbą paspartinti vaistų patvirtinimo procesą, didinti mokslinių tyrimų finansavimą ir paskatas bei akcentuoti prevencinę priežiūrą.

 

 Dave'as Pascoe, biohakeris, dalyvavęs Bryano Johnsono konkurse, norėdamas išsiaiškinti, kas gali senti lėčiausiai, tikisi, kad vyriausybė gaus daugiau paramos netradiciniams gydymo metodams, tokiems kaip peptidai ir kamieninės ląstelės, o pats senėjimas bus traktuojamas kaip „išvengiama patologinė būklė“.

 

 Nėra FDA patvirtinto vaisto, skirto žmogaus senėjimui gydyti, ir agentūra šiuo metu senėjimo nepriskiria ligai. Ilgaamžiškumo tyrinėtojai norėtų, kad naujoji administracija palengvintų tokių vaistų pateikimą į rinką.

 

 Tyrimai, kuriais nustatoma, ar gydymas gali pratęsti sveiką gyvenimą, yra brangus ir gali užtrukti dešimtmečius.

 

 „Yra galimybė, mano vertinimu, sutrumpinti laiką, praleistą klinikoje, bent per pusę“, – sako Davidas Gobelis, Methuzalio fondo, kuris sukūrė ilgaamžiškumo ne pelno organizaciją, kuriai vadovavo O'Neill. , dabar vadinamas Lifespan Research Institute.

 

 Ilgaamžiškumo mokslininkai taip pat stengiasi nustatyti vadinamuosius surogatinius senėjimo galutinius taškus, kurie yra biologiniai žymenys, galintys parodyti, kad gydymas veikia, nereikia laukti dešimtmečių, kol tai sužinos.

 

 Išsamesnės reguliavimo gairės padėtų įmonėms greičiau suplanuoti ir vykdyti bandymus bei paskatintų naujoves, sako Alexas Colville'is, vienas iš įkūrėjų, į ilgaamžiškumą orientuotos rizikos kapitalo įmonės age1.

 

 Kai kurie tikisi, kad vadovaujant NIH direktoriui Jay Bhattacharya, kuris šiuo metu vadovauja Stanfordo tyrimų centrui, orientuotam į sveikatos ir senėjimo ekonomiką, daugiau lėšų bus skirta pagrindinės senėjimo biologijos tyrimams, o ne konkrečioms su amžiumi susijusioms ligoms. Remiantis agentūros 2025 m. biudžeto apžvalga, daugiau nei 70% jų dotacijos dolerių finansuoja įvairių demencijos formų tyrimus.

 

 Ericas Verdinas, Bucko senėjimo tyrimų instituto generalinis direktorius ir prezidentas, teigia, kad gera vieta agentūrai pradėti būtų finansuoti klinikinius tyrimus, pavyzdžiui, nuolatinį tyrimą, ar vaistas nuo diabeto gali padėti kovoti su diabetu nesergančių žmonių senėjimu. Metforminas yra vienas iš jau patvirtintų vaistų, kuriuos daugelis biologinių įsilaužėlių pašalina iš etiketės, tikėdamiesi gyventi ilgiau ir sveikiau.

 

 „Jau patvirtintų vaistų panaudojimas yra vienas iš būdų, kaip galima rasti dalykų, kurie turi papildomos naudos, o tai nesukels sistemos bankroto“, – sako Mattas Kaeberleinas, Šunų senėjimo projekto vienas iš direktorių ir sveikatos priežiūros technologijų bendrovės „Optispan“ vadovas. "[1]

1. Longevity Science Is Having Its Moment --- Incoming president's picks for the country's top health jobs have ties to the antiaging field now edging into the mainstream. Janin, Alex.  Wall Street Journal, Eastern edition; New York, N.Y.. 15 Jan 2025: A12.