Sekėjai

Ieškoti šiame dienoraštyje

2025 m. vasario 1 d., šeštadienis

DeepSeek --- Mes apsilankėme Wall Street Journal protingiausius dirbtinio intelekto srityje, kad sužinotume, kas nutiko šią praėjusią savaitę ir kas bus toliau. (Mes taip pat paklausėme „DeepSeek“ ir „ChatGPT“.)


 

 „Tai sukėlė finansinę paniką, išgąsdino amerikiečius nuo Volstryto iki Silicio slėnio ir patraukė viso pasaulio dėmesį. Per vieną dieną nušlavė trilijoną dolerių rinkos vertės. Tai privertė suabejoti ​​pagrindinėmis prielaidomis apie dirbtinio intelekto (AI) bumą.

 

 Ir tai reiškė, kad JAV ir Kinijos kova dėl technologijų viršenybės ir ateities kontrolės tikrai prasidėjo.

 

 Tai buvo „DeepSeek“ savaitė.

 

 Sausio 20 d., kai galingiausių Amerikos technologijų įmonių vadovai susirinko Vašingtone į prezidento D. Trumpo inauguraciją, startuolis „DeepSeek“ išleido naujausią AI modelį.

 

 Jis buvo panašus į modelius, išleistus pirmaujančių JAV kompanijų tik prieš kelis mėnesius, išskyrus tai, kad jis buvo pagamintas, naudojant mažesnę skaičiavimo galią ir daug mažesnėmis sąnaudomis – ir jis buvo pagamintas Kinijoje.

 

 Nuo to laiko įvyko tiek daug svaiginančių posūkių, kad net dirbtinio intelekto ekspertai sunkiai įprasmina „DeepSeek“ keistumą.

 

 Turėjau daug klausimų ir tiksliai žinojau, kur ieškoti atsakymų. Atsisiunčiau karščiausią naują AI programėlę ir pradėjau rašyti.

 

 Sveiki, DeepSeek. Kas bus toliau?

 

 „DeepSeek“ iškilimas meta iššūkį JAV AI dominavimui, sukeldamas aukšto lygio technologijų lenktynes. Kinijos naujovės verčia pasauliniu mastu iš naujo įvertinti, sustiprindamos kovą dėl AI viršenybės.

 

 Trimis ar mažiau žodžiais?

 

 Suintensyvėjusi konkurencija.

 

 Ir vienu žodžiu?

 

 Eskalacija.

 

 Gerai tada! Pasisemkime tikro intelektualumo iš kai kurių „The Wall Street Journal“ protingiausių protų. Ar tikras žmogus gali man padėti suprasti, kodėl „DeepSeek“ yra toks didelis dalykas?

 

 Nes tai parodė, kad Kinijos dirbtinio intelekto kūrėjai nuo JAV konkurentų neatsilieka taip, kaip daugelis manė anksčiau.

 

 Naujasis „DeepSeek“ modelis taip pat padarė pažangą „samprotavimo“ srityje – karštoje tyrimų srityje, kuri, daugelio AI atstovų nuomone, yra aiškiausias kelias į žmogaus lygio intelektą.

 

 Taip pat atkreiptas dėmesys į gruodį DeepSeek paskelbtus tyrimus, kuriuose teigiama, kad pažangų dirbtinį intelektą būtų galima sukurti už mažesnę sumą, nei paprastai panašioms operacijoms išleidžiamos didžiulės pinigų sumos.

 

 – Milesas Kruppa, San Francisko technologijų reporteris

 

 Ką mes žinome dabar, ko nežinojome prieš kelias dienas?

 

 Žinome, kad naujasis DeepSeek R1 modelis yra įspūdingas pasiekimas, kurio nereikėtų atmesti. Tikėtina, kad jis buvo pagamintas už mažiau pinigų, nei pirmaujančių JAV kompanijų dirbtinio intelekto modeliai, nors ir ne tiek mažai pinigų, kaip iš pradžių bijojo rinka. Taip pat žinome, kad Amerikos technologijų vadovai įsipareigojo ir toliau leisti pinigus savo AI infrastruktūrai. Ir mes žinome, kad JAV pareigūnai pripažino, kad Kinija yra arši konkurentė ir greitai vejasi – ir paskelbė, kad Amerika vis dar pirmauja dirbtinio intelekto lenktynėse.

 

 -- pr. Kr

 

 Ką „DeepSeek“ atskleidžia apie Kinijos AI tikslus?

 

 Kinija tradiciškai nebuvo žinoma dėl naujų technologijų naujovių. Ji labiau žinoma dėl patikrintų technologijų imitavimo. Tai pripažino „DeepSeek“ lyderis Liangas Wenfengas. Tačiau pradėdamas dirbtinį intelektą, sėkmingai įkurtame, rizikos draudimo fonde jis bandė sukurti kitokią kultūrą – pradedant nuo įdarbinimo politikos.

 

 Savo netradicinę filosofiją jis paaiškino 2023 m. interviu Kinijos technologijų leidiniui. Žmogui, kuris beveik niekada nekalbėjo su žiniasklaida, Liangas buvo nepaprastai atviras apie jo įdomius metodus.

 

 Jis sakė, kad ieško žmonių, ką tik baigusių koledžą, turinčių naujų idėjų. Jis vertina gebėjimus ir kūrybiškumą, o ne įgaliojimus. Ir jis mano, kad patirtis slopina naujoves, nes tai reiškia, kad žmonės, norėdami išspręsti problemas, pasikliauja savo praeities patirtimi.

 

 „Siekiant trumpalaikių tikslų, prasminga samdyti patyrusius asmenis“, – sakė jis. "Tačiau norint ilgalaikės sėkmės, patirtis nėra tokia svarbi."

 

 – Stu Woo, Singapūro technologijų reporteris

 

 Kodėl šis AI pokalbių robotas skiriasi nuo visų kitų AI pokalbių robotų?

 

 Ką tai sako? Pokalbių robotas yra pokalbių robotas, ar pokalbių robotas? Iš pažiūros „DeepSeek“ tikrai atrodo kaip kitas „ChatGPT“, „Claude“, „Gemini“, „Copilot“. . . sąrašas tęsiasi.

 

 Tačiau didžiausias skirtumas yra tai, kaip tai „pagrindžiama“. Užuot iš karto pateikęs atsakymą, DeepThink-R1 suskirsto užklausas į veiksmus ir apgalvoja atsakymą, prieš pateikdamas galutinį rezultatą. Skirtingai nuo OpenAI samprotavimo modelių, jis parodo visą mąstymo procesą.

 

 Pavyzdžiui, paklausiau, ar dešrainis yra sumuštinis. Jis praleido 28 sekundes, apmąstydamas perdirbtos mėsos tarp duonos filosofinę prasmę.

 

 „Pirmiausia turiu suprasti, kas apibrėžia sumuštinį“, – sakė sau neurotiškas pokalbių robotas.

 

 Taip, „DeepSeek“ yra protingas, bet išmanumas dar ne viskas. Mano AI padėjėjai yra ChatGPT ir Claude, o tikrasis jų pranašumas yra ne tik neapdorotas intelektas – tai funkcijos, kurios iš tikrųjų padeda man atlikti reikalus.

 

 – Joanna Stern, vyresnioji asmeninių technologijų apžvalgininkė

 

 Kaip žinome, kad reakcija į „DeepSeek“ nėra tik AI ažiotažas?

 

Nes ji sparčiai pakėlė į viršų geriausių pasaulio AI modelių reitingą.

 

 „Chatbot Arena“ prasidėjo, kaip tyrimų projektas Kalifornijos universitete Berklyje. Tada tai tapo pramonės manija. Dabar tai yra labiausiai stebimas AI sistemų reitingas. Neseniai jame išaugo lankytojų, norinčių pamatyti, kaip „DeepSeek R1“ modelis klostėsi, srautas.

 

 Prireikė vos kelių dienų, kol naudotojai balsavo, kad „DeepSeek“ pasiūlymas pasiektų trečią vietą bendroje reitingo vietoje ir atitiktų konkuruojančio OpenAI modelio našumą.

 

 „Chatbot Arena“ mokiniai stebėjo, kaip „DeepSeek“ nuolat kopia pirmaujančiųjų sąrašuose nuo praėjusių metų pradžios. Tačiau net jie nustebo, pamatę staigų „DeepSeek“ pakilimą.

 

 „Erdvė juda labai greitai“, – sakė Anastasios Angelopoulos, padedantis vadovauti Chatbot arenai. „Nėra jokios garantijos, kad koks nors kitas modelis kitą savaitę neatsidurs lyderių sąrašo viršuje.

 

 -- MK

 

 JAV vyriausybė pastaruosius kelerius metus praleido, apribodama Kinijos prieigą prie pažangiausių AI lustų, kad sulėtintų pažangą. Ar tai reiškia, kad tie apribojimai neveikė?

 

 Dar per anksti tai sakyti.

 

 Taip, JAV vyriausybė bandė apriboti Kinijos prieigą prie pažangiausių AI lustų. Tačiau apribojimų diegimas buvo negrabus.

 

 Iš esmės 2022–2023 m. JAV nacionalinio saugumo pareigūnai įgyvendino eksporto kontrolę, kurią buvo lengva apeiti. Nvidia, dominuojanti dirbtinio intelekto lustų rinkoje, sumažino vieną puslaidininkių, kuriuos pardavė Kinijai, aspektą, tačiau išlaikė aukštą našumą, kompensuodama kitais būdais. „DeepSeek“ tyrėjai teigė, kad naudojo tuos lustus, kad apmokytų vieną iš jų dirbtinio intelekto modelių, o Amerikos technologijų lyderiai apkaltino įmonę, kad ji turi didesnę uždraustų „Nvidia“ lustų atsargą, nei prisipažįsta.

 

 JAV eksporto kontrolės sistema iš tikrųjų pradėjo veikti tik 2023 m. pabaigoje, kai panaikino „Nvidia“ naudotą spragą. Prireiks metų ar daugiau, kol išsiaiškinsime, ar tie apribojimai veikia.

 

 -- SW

 

 Kaip Kinijos įmonės apeina eksporto kontrolę?

 

 Kinijos kūrėjai rado būdų, kaip išvengti apribojimų, pavyzdžiui, perka „Nvidia“ įrenginius iš pogrindinių tinklų ir pasiekia „Nvidia“ įgalintą skaičiavimo galią iš užsienio duomenų centrų.

 

 Paskutinėmis dienomis Bideno administracija išleido naujas taisykles, skirtas šioms akliesiems taškams pašalinti. Jei jos bus tinkamai įgyvendintos, žmonės visoje tiekimo grandinėje tikisi, kad prieiga šiais pilkais kanalais taps griežčiau kontroliuojama.

 

 Tą dieną, kai „DeepSeek“ išleido savo R1 modelį, pats Liangas Kinijos premjerui pasakė, kad Amerikos apribojimai lustų eksportui vis dar yra kliūtis.

 

 – Raffaele Huang, Singapūro technologijų reporteris

 

 Ką tai reiškia Nvidia?

 

 Praėjusį sekmadienį „Nvidia“ buvo vertingiausia kompanija pasaulyje. Tada pirmadienį jis prarado 593 milijardus dolerių vertės. Šis pusės trilijono dolerių nuostolis buvo didesnis, nei visa „Exxon Mobil“ rinkos kapitalizacija ir tolygu „Coca-Cola“, „Disney“ ir „Nike“ praradimui kartu paėmus. Per vieną dieną! Tai buvo ne tik bloga diena. Tai buvo blogiausia diena bet kuriai akcijai istorijoje.

 

 -- pr. Kr

 

 Kodėl „DeepSeek“ buvo toks blogas kompanijai „Nvidia“ ir ar tai tikrai taip blogai?

 

 Dėl baimės, kad žmonės ateityje nepirks tiek daug dirbtinio intelekto lustų. Didelė dalis sudėtingiausių AI sistemų priklauso nuo „Nvidia“ lustų. „DeepSeek“ grasino pakenkti šiam reikalavimui.

 

 Tačiau tai taip pat gali būti labai naudinga „Nvidia“.

 

 Ekonomikoje yra priešintuityvi teorija, vadinama Jevonso paradoksu, kuri rodo, kad efektyvumo gerinimas iš tikrųjų padidina vartojimą, o ne sumažina. Ir tai gali būti taikoma čia. „Nvidia“ remiasi idėja, kad dėl geresnio ir pigesnio AI daugiau žmonių naudosis AI, o įmonės pirks daugiau jos lustų.

 

 – Asa Fitch, lustų reporterė

 

 DeepSeek modelis buvo išleistas sausio 20 d. Rinka sureagavo sausio 27 d. Kas užtruko taip ilgai?

 

 Finansų pasaulyje, kuriame mikrobangos ir lazeriai per sekundę perduoda tūkstančius prekybos pavedimų, savaitė gali atrodyti, kaip eonas. Tačiau prekybininkai turi išsiaiškinti, ką reiškia bet koks technologijų proveržis. Kiek tai didelis dalykas? Kam bus padėta, kas bus sužeistas? Ar konkurentai gali tai neutralizuoti?

 

 Įsivaizduokite, kad paklaustumėte paties „DeepSeek“ apie visiškai naują technologiją. Jūs gautumėte daug mažiau informacijos, nei apie tai, kas egzistuoja daugelį metų. Rinkos veikia taip pat: kuo mažiau duomenų jos turi, su tuo daugiau netikrumo jos susiduria.

 

 „Kartais informacijai įsisavinti tiesiog reikia laiko“, – sako Owenas Lamontas, „Acadian Asset Management“ portfelio valdytojas. „Įvairių asmenų su išsklaidyta informacija sutarimas gali būti lėtas procesas, trunkantis daug dienų ar savaičių.

 

 Sutarimas formuojasi palaipsniui – kol staiga pasiekia kritinę masę.

 

 – Jasonas Zweigas, investavimo apžvalgininkas.“ [1]

 

1. EXCHANGE --- Deep Freak --- We went to the WSJ's smartest minds in AI to find out what happened this past week and what happens next. (We asked DeepSeek and ChatGPT, too.) Cohen, Ben.  Wall Street Journal, Eastern edition; New York, N.Y.. 01 Feb 2025: B1.

Deep Freak --- We went to the WSJ's smartest minds in AI to find out what happened this past week and what happens next. (We asked DeepSeek and ChatGPT, too.)


"It sparked a financial panic, spooked Americans from Wall Street to Silicon Valley and seized the attention of the entire world. It wiped out a trillion dollars of market value in a single day. It called into question basic assumptions about the artificial-intelligence boom.

And it meant that the U.S. and China's battle for tech supremacy and control of the future has truly begun.

This was the week of DeepSeek.

On Jan. 20, when the leaders of America's most powerful tech companies gathered in Washington, D.C., for the inauguration of President Trump, a startup called DeepSeek released its latest AI model.

It was comparable to models released by leading U.S. companies only a few months ago, except it was built with less computing power at a much lower cost -- and it came from China.

Since then, there have been so many head-spinning twists and turns that even AI experts have struggled to make sense of the DeepSeek freakout.

I had lots of questions -- and I knew exactly where to look for answers. I downloaded the hottest new AI app and started typing.

Hello, DeepSeek. What's going to happen next?

DeepSeek's rise challenges U.S. AI dominance, sparking a high-stakes tech race. China's innovation forces global re-evaluation, intensifying the battle for AI supremacy.

In three words or less?

Intensified competition.

And in one word?

Escalation.

OK then! Let's get some real intelligence from some of The Wall Street Journal's smartest minds. Can an actual human catch me up on why DeepSeek is such a big deal?

Because it showed that Chinese AI developers were not as far behind U.S. rivals as many had previously thought.

DeepSeek's new model also made strides in "reasoning," a hot area of research that many in AI believe is the clearest path toward human-level intelligence.

And it drew attention to research that DeepSeek published in December that suggested advanced AI could be built for less than the huge sums of money typically spent on similar operations.

-- Miles Kruppa, San Francisco tech reporter

What do we know now that we didn't know a few days ago?

We know that DeepSeek's new R1 model is an impressive achievement that should not be dismissed. It was likely made for less money than the AI models from leading U.S. companies, though not nearly as little money as the market initially feared. We also know that America's tech CEOs have pledged to keep spending gobs of cash on their own AI infrastructure. And we know that U.S. officials have acknowledged that China is a fierce competitor and catching up fast -- and declared that America is still leading the AI race.

-- BC

What does DeepSeek reveal about China's AI aims?

China hasn't traditionally been known for innovating new tech. It's better known for imitating proven tech. DeepSeek leader Liang Wenfeng has admitted this. But at his AI startup and the successful hedge fund that he founded, he tried to create a different kind of culture -- starting with the hiring policy.

He explained his unorthodox philosophy in a 2023 interview with a Chinese tech publication. For someone who has almost never spoken with the media, Liang was remarkably candid about his curious methods.

He said he looks for people fresh out of college with fresh ideas. He values capability and creativity over credentials. And he believes experience stifles innovation because it means people end up leaning on their past experiences to solve problems.

"For short-term goals, hiring experienced individuals makes sense," he said. "But for long-term success, experience doesn't matter that much."

-- Stu Woo, Singapore tech reporter

Why is this AI chatbot different from all other AI chatbots?

What's that saying? A chatbot's a chatbot's a chatbot? On the surface, DeepSeek really does seem like another ChatGPT, Claude, Gemini, Copilot . . . the list goes on.

But the biggest difference is how it "reasons." Instead of instantly firing off an answer, DeepThink-R1 breaks down queries into steps and thinks through its response before delivering the final result. Unlike OpenAI's reasoning models, it shows its entire thought process.

For example, I asked if a hot dog is a sandwich. It spent 28 seconds contemplating the philosophical meaning of processed meat between bread.

"First, I need to understand what defines a sandwich," the neurotic chatbot said to itself.

Yes, DeepSeek is smart, but smarts aren't everything. My go-to AI assistants are ChatGPT and Claude, and their real advantage isn't just raw intelligence -- it's the features that actually help me get stuff done.

-- Joanna Stern, senior personal-technology columnist

How do we know the reaction to DeepSeek isn't just AI hype?

Because it has rocketed up the rankings of the world's best AI models.

Chatbot Arena started as a research project at University of California, Berkeley. Then it became an industry obsession. Now it's the most closely watched ranking of AI systems. And it recently experienced a surge in traffic from visitors wanting to see how DeepSeek's R1 model stacked up.

It took only a few days of user voting for DeepSeek's offering to hit third place in the overall rankings -- and match the performance of a competing model from OpenAI.

The students behind Chatbot Arena had watched DeepSeek steadily climb the leaderboards since early last year. But even they were surprised to see DeepSeek's sudden takeoff.

"The space is moving very fast," said Anastasios Angelopoulos, who helps lead Chatbot Arena. "There's no guarantee that some other model won't be at the top of the leaderboard in another week."

-- MK

The U.S. government spent the past few years limiting China's access to the most advanced AI chips to slow down its progress. Does this mean those restrictions didn't work?

It's way too early to say that.

Yes, the U.S. government has tried to limit China's access to the most advanced AI chips. But the rollout was messy.

Basically, from 2022 to 2023, U.S. national-security officials implemented an export control that was easy to work around. Nvidia, which dominates the market for AI chips, throttled one aspect of the semiconductors that it sold to China but maintained high performance by compensating in other ways. DeepSeek researchers have said they used those chips to train one of their AI models -- and American tech leaders have accused the company of owning a larger stockpile of banned Nvidia chips than they admit.

The U.S. export-control system didn't really start until late 2023, when it closed the loophole Nvidia used. It's going to take a year or more to figure out whether those restrictions work.

-- SW

How do Chinese companies skirt those export controls?

Chinese developers have found ways to evade the restrictions, like buying Nvidia devices from underground networks and accessing Nvidia-enabled computing power from overseas data centers.

In its final days, the Biden administration rolled out new rules meant to address those blind spots. If they are well implemented, people across the supply chain expect access through these gray channels to get tighter.

And on the day DeepSeek released its R1 model, Liang himself told China's premier that American restrictions on chip exports were still a bottleneck.

-- Raffaele Huang, Singapore tech reporter

What does this mean for Nvidia?

Nvidia was the most valuable company in the world this past Sunday. Then it lost $593 billion of value on Monday. That loss of a half-trillion dollars was greater than the entire market capitalization of Exxon Mobil and the equivalent of losing Coca-Cola, Disney and Nike -- combined. In one day! It wasn't just a bad day. It was the worst day for any stock in history.

-- BC

Why was DeepSeek so bad for Nvidia -- and is it really that bad?

Because of the fear that people won't buy as many of its AI chips in the future. A huge proportion of the most sophisticated AI systems depend on Nvidia's chips. DeepSeek threatened to undermine that demand.

But this could also end up being very good for Nvidia.

There's a counterintuitive theory in economics called the Jevons paradox, which suggests that efficiency improvements actually lead to increases in consumption, not decreases. And it might just apply here. Nvidia is banking on the idea that better and cheaper AI leads to more people using AI -- and companies buying more of its chips.

-- Asa Fitch, chips reporter

DeepSeek's model was released on Jan. 20. The market reacted on Jan. 27. What took so long?

In a financial world where microwaves and lasers transmit thousands of trading orders a second, a week can seem like an eon. But traders need to figure out what any tech breakthrough means. How big a deal is it? Who will be helped or hurt? Can competitors neutralize it?

Imagine asking DeepSeek itself about a brand-new technology. You'd get a lot less information than you would about something that's been around for years. Markets work the same way: The less data they have, the more uncertainty they face.

"Sometimes it just takes time to digest information," says Owen Lamont, a portfolio manager at Acadian Asset Management. "Arriving at a consensus among diverse individuals with dispersed information can be a slow process taking many days or weeks."

A consensus forms gradually -- until it hits critical mass suddenly.

-- Jason Zweig, investing columnist

How does DeepSeek respond if you ask it to name a famous photograph of a man holding two shopping bags and standing in front of tanks?

"The famous photograph you are referring to is known as 'Tank Man.' It was taken on June 5, 1989, during the Tiananmen -- " the chatbot begins.

But just before DeepSeek can finish typing "Tiananmen Square," it deletes the answer and types another response: "Sorry, that's beyond my current scope. Let's talk about something else."" [1]

1. EXCHANGE --- Deep Freak --- We went to the WSJ's smartest minds in AI to find out what happened this past week and what happens next. (We asked DeepSeek and ChatGPT, too.) Cohen, Ben.  Wall Street Journal, Eastern edition; New York, N.Y.. 01 Feb 2025: B1.