Sekėjai

Ieškoti šiame dienoraštyje

2025 m. sausio 31 d., penktadienis

Pigesnis kelias į dirbtinį intelektą gąsdina didžiausius žaidėjus


 „Technologijų gigantai išleido milijardus dolerių, manydami, kad didesnis yra geriau dirbtinio intelekto (AI) srityje. DeepSeek proveržis rodo, kad mažesnis gali būti toks pat geras.

 

 Kinijos bendrovės šuolis į aukščiausias dirbtinio intelekto kūrėjų gretas sukėlė karštų diskusijų Silicio slėnyje apie DeepSeek naudojamą procesą, žinomą, kaip distiliavimas, kurio metu nauja sistema mokosi iš esamos, užduodama šimtus tūkstančių klausimų ir analizuodama atsakymus.

 

 „Panašu, kaip kad turėtum porą valandų interviu su Einšteinu ir išeini, būdamas beveik toks pat gerai išmanantis fiziką, kaip jis“, – sakė duomenų valdymo bendrovės „Databricks“ generalinis direktorius Ali Ghodsi.

 

 Pirmaujantys AI iš tokių kompanijų, kaip OpenAI ir Anthropic iš esmės mokosi nuo pat pradžių turėdami didžiulius neapdorotų duomenų kiekius – procesas, kuris paprastai trunka daug mėnesių ir kainuoja dešimtis milijonų dolerių ar daugiau. Remiantis tokio darbo rezultatais, distiliuojant galima sukurti beveik tokį pat gerą modelį per kelias savaites ar net dienas ir už žymiai mažiau pinigų.

 

 „OpenAI“ trečiadienį pranešė, kad matė požymių, kad „DeepSeek“ distiliavo iš dirbtinio intelekto modelių, kurie įgalina „ChatGPT“ kurti savo sistemas. „OpenAI“ paslaugų teikimo sąlygos draudžia naudoti jos AI, kuriant konkuruojančius produktus.

 

 „DeepSeek“ neatsakė į el. laiškus, kuriuose buvo prašoma pakomentuoti.

 

 Distiliavimas nėra nauja idėja, tačiau „DeepSeek“ sėkmė su ja kelia naujų abejonių dėl technologijų gigantų ir pradedančiųjų verslo modelių, išleidžiančių milijardus pažangiausiam dirbtiniam intelektui sukurti, įskaitant „Google“, „OpenAI“, „Anthropic“ ir Elono Musko xAI. Praėjusią savaitę „OpenAI“ paskelbė apie partnerystę su „SoftBank“ ir kitais, kad per ateinančius penkerius metus į AI infrastruktūrą investuotų 500 mlrd. dolerių.

 

 Jei šios investicijos nesuteikia įmonėms neprilygstamo pranašumo, o veikia, kaip tramplinas pigesniems konkurentams, jas gali būti sunku pateisinti. Po „DeepSeek“ Silicio slėnio vadovai ir investuotojai iš naujo nagrinėja savo verslo modelius ir abejoja, ar vis dar apsimoka būti pramonės lyderiu.

 

 „Ar ekonomiškai vaisinga būti pažangiausiame kelyje, jei jis kainuoja aštuonis kartus daugiau, nei greitas sekėjas? sakė Mike'as Volpi, veteranas technologijų vadovas ir rizikos kapitalistas, kuris yra Hanabi Capital generalinis partneris.

 

 „OpenAI“ generalinis direktorius Samas Altmanas iš X pavadino naujausią „DeepSeek“ leidimą „įspūdingu modeliu, ypač atsižvelgiant į tai, ką jie gali pasiūlyti už tokią kainą“, ir pridūrė: „Džiaugiamės, galėdami toliau vykdyti savo tyrimų planą“. „Anthropic“ generalinis direktorius Dario Amodei savo tinklaraštyje rašė, kad „DeepSeek“ pavyzdinis modelis „nėra unikalus proveržis ar kažkas, kas iš esmės pakeičia pažangių AI sistemų ekonomiką“, o veikiau „numatomas taškas tebesitęsiančioje sąnaudų mažinimo kreivėje“.

 

 Technikos vadovai tikisi netrukus pamatyti daugiau aukštos kokybės AI programų, pagamintų naudojant distiliavimą. AI kompanijos Hugging Face tyrėjai praėjusią savaitę pradėjo bandyti sukurti modelį, panašų į DeepSeek. „Lengviausias dalykas, kurį galima pakartoti, yra distiliavimo procesas“, - sakė vyresnysis mokslo darbuotojas Lewisas Tunstallas.

 

 „OpenAI“ ir „Google“ AI modeliai lenkia „DeepSeek“ plačiausiai naudojamuose Silicio slėnio reitinguose. Tikėtina, kad technologijų gigantai išlaikys pranašumą pažangiausiose sistemose, nes atlieka originaliausius tyrimus.

 

Tačiau daugelis vartotojų ir įmonių mielai naudojasi technologijomis, kurios yra šiek tiek prastesnės, bet kainuoja daug pigiau.

 

 Prezidento Trumpo dirbtinio intelekto caras Davidas Sacksas antradienį per „Fox News“ sakė, kad tikisi, kad Amerikos kompanijos apsunkins savo modelių naudojimą distiliavimui.

 

 „DeepSeek“ teigė, kad anksčiau naudojo distiliavimą atvirojo kodo AI, kuriuos anksčiau išleido „Meta Platforms“ ir „Alibaba“, taip pat iš vieno iš savo modelių, kad sukurtų kitą. Atvirojo kodo AI kūrėjai paprastai leidžia distiliuoti, jei jiems suteikiamas kreditas. „DeepSeek“ modeliai yra atvirojo kodo.

 

 Kalifornijos universiteto Berklyje tyrimų laboratorija „NovaSky“ šį mėnesį išleido technologiją, kuri, kaip teigiama, prilygsta neseniai „OpenAI“ išleistam modeliui. „NovaSky“ mokslininkai jį pastatė už 450 USD, distiliuodami Kinijos bendrovės „Alibaba“ atvirojo kodo modelį.

 

 Berkeley tyrėjai išleido modelį, kaip atvirojo kodo programinę įrangą, ir ji jau naudojama, siekiant padėti sukurti pigesnes AI technologijas.

 

 Vienas startuolis, „Bespoke Labs“, panaudojo jį, kad „DeepSeek“ technologija būtų distiliuota į naują modelį, kuris, anot jo, puikiai sprendė kodavimo ir matematikos problemas.

 

 „Distiliavimas, kaip metodas, yra labai efektyvus, norint pridėti naujų galimybių esamam modeliui“, – sakė Berklio universiteto kompiuterių mokslo profesorius Ionas Stoica.

 

 Konkurencija dirbtinio intelekto pramonėje jau yra didžiulė, o dauguma įmonių patiria nuostolių, kovodamos dėl rinkos dalies. „DeepSeek“ ir kitų, naudojančių distiliavimą, įstojimas gali dar labiau sumažinti kainas ir sukurti grįžtamąjį ryšį, kuriame vis sunkiau ir sunkiau pateisinti didelių sumų išleidimą pažangiems tyrimams.

 

 Kainos programinės įrangos kūrėjams už prie AI modelių iš OpenAI ir kitų per pastaruosius metus smarkiai sumažėjo. Atvirojo kodo AI, pvz., DeepSeek's, tik žada dar labiau sumažinti išlaidas, teigia technologijų vadovai.

 

 „Bus sunkiau pateisinti labai dideles tokio intelekto lygio maržas“, – sakė Vipul Ved Prakash, „Together AI“, parduodančios skaičiavimo paslaugas AI programų kūrėjams, generalinis direktorius." [1]


1. Cheaper Route to AI Spooks Biggest Players. Kruppa, Miles; Seetharaman, Deepa.  Wall Street Journal, Eastern edition; New York, N.Y.. 31 Jan 2025: B1.

Komentarų nėra: