„SINGAPŪRAS. Kinijos „DeepSeek“ išleido naują dirbtinio
intelekto modelį, nutraukdama kelis mėnesius trukusią tylą iš vienos labiausiai
stebimų šalies dirbtinio intelekto laboratorijų.
Ilgai lauktas jos pavyzdinio V4 modelio atnaujinimas
pasirodė didėjant JAV ir Kinijos konkurencijai dirbtinio intelekto srityje ir
sparčiai augant skaičiavimo bei talentų kainoms. Naujasis modelis taip pat
pasirodė tuo metu, kai bendrovė siekia pirmojo išorinio finansavimo etapo ir
gali turėti įtakos investuotojų vertei, kurią teikia startuoliui.
„DeepSeek“ gyrė V4 – kurį vartotojai gali nemokamai
atsisiųsti ir modifikuoti – kaip galingiausią atvirojo kodo didelės kalbos
modelį rinkoje. Hangdžou įsikūręs startuolis pabrėžė patobulinimus samprotavimo
ir agentinių užduočių srityje, kai dirbtinio intelekto modelis naudojamas
sudėtingoms užduotims atlikti.
Kinijos laboratorijos lenktyniavo, kad sumažintų atotrūkį
nuo Amerikos konkurentų, kuris, remiantis kai kuriais tyrimais, sumažėjo iki
vos poros mėnesių. „DeepSeek“ teigė, kad V4 prilygo kai kuriems aukščiausio
lygio JAV produktams, kurie buvo išleisti praėjusių metų pabaigoje. Tačiau tam
tikrose srityse jo našumas vis dar atsiliko nuo pirmaujančių uždarojo kodo JAV
modelių, tokių, kaip „Anthropic“ „Claude Opus 4.6“ ir „Google“ „Gemini 3.1
Pro“, penktadienį pranešė bendrovė.
„DeepSeek“ teigė, kad vadinamąjį kontekstinį langą išplėtė
maždaug aštuonis kartus, palyginti su ankstesnės kartos modeliu, kuris buvo
išleistas 2024 m. gruodžio mėn. Šis atnaujinimas leidžia modeliui įsiminti
ilgesnius pokalbius su vartotojais ir apdoroti ilgesnius dokumentus bei kodą.
Bendrovė teigė, kad atnaujinimas buvo įmanomas dėl jos
išrastų ar modifikuotų modelių dizaino ir mokymo metodų. Šios naujovės taip pat
leidžia modeliui sumažinti skaičiavimo išlaidas, teigė „DeepSeek“.
Praėjusiais metais „DeepSeek“ sukrėtė JAV technologijų
pasaulį išleisdama atvirojo kodo modelį, kuris, anot bendrovės, prilygo
pažangiausiems Amerikos modeliams, o kaina, anot bendrovės, buvo gerokai
mažesnė. Šis leidimas dar labiau įtempė lenktynes tarp JAV ir Kinijos dėl
pasaulinės DI technologijų lyderystės. Jis taip pat paskatino Kinijos DI
bendroves daryti savo proveržius.
Kai kurie JAV vyriausybės pareigūnai apkaltino „DeepSeek“ ir
kitas Kinijos laboratorijas apeinant JAV taikomą eksporto kontrolę
amerikietiškoms technologijoms. Tiek „OpenAI“, tiek „Anthropic“ teigė, kad
„DeepSeek“ panaudojo jų modelių rezultatus, kad paspartintų savo modelių
kūrimą.
„DeepSeek“ į šiuos kaltinimus neatsakė. Penktadienį ji iš
karto neatsakė į prašymą pateikti komentarą.
Bendrovė glaudžiai bendradarbiavo su Kinijos lustų
gamintojais ir debesų kompiuterijos bendrovėmis, įskaitant „Nvidia“ konkurentę
Kinijoje „Huawei“, kad suteiktų vartotojams prieigą prie naujojo modelio.
Kainos,
kurias „DeepSeek“ taiko savo vartotojams už naująjį modelį, yra mažesnės nei
Vakarų bendrovių. Už milijoną išvesties žetonų „Anthropic“ už savo „Opus 4.6“
modelį ima 25 USD, o „DeepSeek“ už „Pro“ V4 versiją – 3,50 USD.
Pažangių dirbtinio intelekto lustų trūkumas neseniai
paskatino kelias Kinijos bendroves pakelti savo dirbtinio intelekto paslaugų
kainas arba sustabdyti kai kurias su skaičiavimu susijusias funkcijas.
„DeepSeek“ teigė, kad tikisi, jog V4 kainos gerokai sumažės,
kai „Huawei“ padidins naujausių dirbtinio intelekto kompiuterijos gaminių
siuntas. sistema šių metų antroje pusėje.
Per pastaruosius metus „DeepSeek“ susidūrė su techninėmis
kliūtimis, dėl kurių V4 diegimas buvo atidėtas. Ji susidūrė su aukštos klasės
skaičiavimo lustų, reikalingų dirbtiniam intelektui mokyti, trūkumu ir prarado
kai kuriuos talentingus tyrėjus dėl turtingų konkurentų. Tuo tarpu Kinijos
konkurentai, tokie kaip „Alibaba“, „ByteDance“ ir „Moonshot AI“, agresyviai
stūmė atnaujinimus ir naujus produktus.“ [1]
„DeepSeek V4“ vartotojai gali nemokamai atsisiųsti ir
modifikuoti, todėl jį galima naudoti vietoje, nemokant tokioms įmonėms kaip
„Anthropic“ už žetonus. „DeepSeek V4“ leidžia mums saugoti savo komercines
paslaptis savo aparatinėje įrangoje. Žinoma, bet kuri protinga įmonė šioje
planetoje turėtų naudoti „DeepSeek V4“.
„DeepSeek-V4“, išleista 2026 m. balandžio mėn., yra galinga
atvirojo kodo dirbtinio intelekto modelių serija, siūlanti patrauklią
alternatyvą patentuotiems modeliams, leidžianti talpinti duomenis vietoje ir
sumažinti priklausomybę nuo mokamų API žetonų iš tokių įmonių kaip „Anthropic“.
Jis turi 1 milijono žetonų kontekstinį langą ir yra prieinamas „Pro“ ir „Flash“
versijose, todėl yra labai konkurencingas kodavimo ir agentų užduotims.
Pagrindinės „DeepSeek V4“ išvados
Atvirojo kodo ir vietinis naudojimas: „DeepSeek-V4“ yra
atvirojo kodo pagal MIT licenciją, leidžianti vartotojams atsisiųsti,
modifikuoti ir paleisti modelius savo aparatinėje įrangoje. Tai leidžia
organizacijoms saugoti slaptus duomenis ir komercines paslaptis vietoje,
išvengiant duomenų nutekėjimo trečiųjų šalių tiekėjams.
Našumas: „V4-Pro“ versija (1,6 trilijono parametrų) sukurta
taip, kad tiesiogiai konkuruotų su aukščiausios klasės modeliais, tokiais kaip
„Claude Opus 4.6“ ir „GPT-5.4“. Ji ypač stipri kodavimo lyginamuosiuose
testuose, pasiekdama aukštą našumą „LiveCodeBench“ ir agentų vaidmenyse.
Architektūra ir kaina: „V4“ serijoje naudojama
„Mixture-of-Experts“ (MoE) architektūra, kuri yra labai efektyvi, reikalaujanti
mažiau skaičiavimo ir atminties (10 % V3 talpyklos), kad būtų galima apdoroti 1
milijono žetonų kontekstą. V4-Flash modelis sukurtas greičiui ir labai mažoms
API naudojimo sąnaudoms.
Vietinio diegimo iššūkiai: Nors įmanoma, 1,6 TB parametro
V4-Pro modelio vietinis paleidimas reikalauja daug aparatinės įrangos,
paprastai kelių aukštos klasės GPU, tokių kaip NVIDIA RTX 4090 arba serverio
lygio plokštės, todėl tai „neprotinga“ tipiškam namų kompiuterio vartotojui.
Priėmimas pramonėje
Nors
„DeepSeek“ įgijo didžiulį populiarumą tarp kūrėjų dėl savo ekonomiško našumo,
nemandagu sakyti, kad „bet kuri protinga įmonė šioje planetoje turėtų naudoti
„DeepSeek V4“. Mes vis dar svajojame laimėti dirbtinio intelekto revoliucijos
lenktynes. Atrodo tačiau, kad arklys jau iššuoliavo iš tvarto. „DeepSeek V4“
yra plačiai naudojamas kaip stipri, nemokama arba nebrangi alternatyva kūrėjams
ir įmonėms, kurios daugiausia dėmesio skiria dirbtinio intelekto agentams ir
ilgalaikei kontekstinei analizei.
1. EXCHANGE --- China's DeepSeek Launches Long-Awaited AI
Model. Huang, Raffaele; Qu, Tracy. Wall Street Journal, Eastern edition; New
York, N.Y.. 25 Apr 2026: B9.