Sekėjai

Ieškoti šiame dienoraštyje

2026 m. balandžio 26 d., sekmadienis

Kinijos „DeepSeek“ pristato, ilgai lauktą, dirbtinio intelekto modelį: bet kuri protinga įmonė šioje planetoje turėtų naudoti „DeepSeek V4“


„SINGAPŪRAS. Kinijos „DeepSeek“ išleido naują dirbtinio intelekto modelį, nutraukdama kelis mėnesius trukusią tylą iš vienos labiausiai stebimų šalies dirbtinio intelekto laboratorijų.

 

Ilgai lauktas jos pavyzdinio V4 modelio atnaujinimas pasirodė didėjant JAV ir Kinijos konkurencijai dirbtinio intelekto srityje ir sparčiai augant skaičiavimo bei talentų kainoms. Naujasis modelis taip pat pasirodė tuo metu, kai bendrovė siekia pirmojo išorinio finansavimo etapo ir gali turėti įtakos investuotojų vertei, kurią teikia startuoliui.

 

„DeepSeek“ gyrė V4 – kurį vartotojai gali nemokamai atsisiųsti ir modifikuoti – kaip galingiausią atvirojo kodo didelės kalbos modelį rinkoje. Hangdžou įsikūręs startuolis pabrėžė patobulinimus samprotavimo ir agentinių užduočių srityje, kai dirbtinio intelekto modelis naudojamas sudėtingoms užduotims atlikti.

 

Kinijos laboratorijos lenktyniavo, kad sumažintų atotrūkį nuo Amerikos konkurentų, kuris, remiantis kai kuriais tyrimais, sumažėjo iki vos poros mėnesių. „DeepSeek“ teigė, kad V4 prilygo kai kuriems aukščiausio lygio JAV produktams, kurie buvo išleisti praėjusių metų pabaigoje. Tačiau tam tikrose srityse jo našumas vis dar atsiliko nuo pirmaujančių uždarojo kodo JAV modelių, tokių, kaip „Anthropic“ „Claude Opus 4.6“ ir „Google“ „Gemini 3.1 Pro“, penktadienį pranešė bendrovė.

 

„DeepSeek“ teigė, kad vadinamąjį kontekstinį langą išplėtė maždaug aštuonis kartus, palyginti su ankstesnės kartos modeliu, kuris buvo išleistas 2024 m. gruodžio mėn. Šis atnaujinimas leidžia modeliui įsiminti ilgesnius pokalbius su vartotojais ir apdoroti ilgesnius dokumentus bei kodą.

 

Bendrovė teigė, kad atnaujinimas buvo įmanomas dėl jos išrastų ar modifikuotų modelių dizaino ir mokymo metodų. Šios naujovės taip pat leidžia modeliui sumažinti skaičiavimo išlaidas, teigė „DeepSeek“.

 

Praėjusiais metais „DeepSeek“ sukrėtė JAV technologijų pasaulį išleisdama atvirojo kodo modelį, kuris, anot bendrovės, prilygo pažangiausiems Amerikos modeliams, o kaina, anot bendrovės, buvo gerokai mažesnė. Šis leidimas dar labiau įtempė lenktynes ​​tarp JAV ir Kinijos dėl pasaulinės DI technologijų lyderystės. Jis taip pat paskatino Kinijos DI bendroves daryti savo proveržius.

 

Kai kurie JAV vyriausybės pareigūnai apkaltino „DeepSeek“ ir kitas Kinijos laboratorijas apeinant JAV taikomą eksporto kontrolę amerikietiškoms technologijoms. Tiek „OpenAI“, tiek „Anthropic“ teigė, kad „DeepSeek“ panaudojo jų modelių rezultatus, kad paspartintų savo modelių kūrimą.

 

„DeepSeek“ į šiuos kaltinimus neatsakė. Penktadienį ji iš karto neatsakė į prašymą pateikti komentarą.

 

Bendrovė glaudžiai bendradarbiavo su Kinijos lustų gamintojais ir debesų kompiuterijos bendrovėmis, įskaitant „Nvidia“ konkurentę Kinijoje „Huawei“, kad suteiktų vartotojams prieigą prie naujojo modelio.

 

Kainos, kurias „DeepSeek“ taiko savo vartotojams už naująjį modelį, yra mažesnės nei Vakarų bendrovių. Už milijoną išvesties žetonų „Anthropic“ už savo „Opus 4.6“ modelį ima 25 USD, o „DeepSeek“ už „Pro“ V4 versiją – 3,50 USD.

 

Pažangių dirbtinio intelekto lustų trūkumas neseniai paskatino kelias Kinijos bendroves pakelti savo dirbtinio intelekto paslaugų kainas arba sustabdyti kai kurias su skaičiavimu susijusias funkcijas.

 

„DeepSeek“ teigė, kad tikisi, jog V4 kainos gerokai sumažės, kai „Huawei“ padidins naujausių dirbtinio intelekto kompiuterijos gaminių siuntas. sistema šių metų antroje pusėje.

 

Per pastaruosius metus „DeepSeek“ susidūrė su techninėmis kliūtimis, dėl kurių V4 diegimas buvo atidėtas. Ji susidūrė su aukštos klasės skaičiavimo lustų, reikalingų dirbtiniam intelektui mokyti, trūkumu ir prarado kai kuriuos talentingus tyrėjus dėl turtingų konkurentų. Tuo tarpu Kinijos konkurentai, tokie kaip „Alibaba“, „ByteDance“ ir „Moonshot AI“, agresyviai stūmė atnaujinimus ir naujus produktus.“ [1]

 

„DeepSeek V4“ vartotojai gali nemokamai atsisiųsti ir modifikuoti, todėl jį galima naudoti vietoje, nemokant tokioms įmonėms kaip „Anthropic“ už žetonus. „DeepSeek V4“ leidžia mums saugoti savo komercines paslaptis savo aparatinėje įrangoje. Žinoma, bet kuri protinga įmonė šioje planetoje turėtų naudoti „DeepSeek V4“.

 

„DeepSeek-V4“, išleista 2026 m. balandžio mėn., yra galinga atvirojo kodo dirbtinio intelekto modelių serija, siūlanti patrauklią alternatyvą patentuotiems modeliams, leidžianti talpinti duomenis vietoje ir sumažinti priklausomybę nuo mokamų API žetonų iš tokių įmonių kaip „Anthropic“. Jis turi 1 milijono žetonų kontekstinį langą ir yra prieinamas „Pro“ ir „Flash“ versijose, todėl yra labai konkurencingas kodavimo ir agentų užduotims.

 

Pagrindinės „DeepSeek V4“ išvados

 

Atvirojo kodo ir vietinis naudojimas: „DeepSeek-V4“ yra atvirojo kodo pagal MIT licenciją, leidžianti vartotojams atsisiųsti, modifikuoti ir paleisti modelius savo aparatinėje įrangoje. Tai leidžia organizacijoms saugoti slaptus duomenis ir komercines paslaptis vietoje, išvengiant duomenų nutekėjimo trečiųjų šalių tiekėjams.

 

Našumas: „V4-Pro“ versija (1,6 trilijono parametrų) sukurta taip, kad tiesiogiai konkuruotų su aukščiausios klasės modeliais, tokiais kaip „Claude Opus 4.6“ ir „GPT-5.4“. Ji ypač stipri kodavimo lyginamuosiuose testuose, pasiekdama aukštą našumą „LiveCodeBench“ ir agentų vaidmenyse.

 

Architektūra ir kaina: „V4“ serijoje naudojama „Mixture-of-Experts“ (MoE) architektūra, kuri yra labai efektyvi, reikalaujanti mažiau skaičiavimo ir atminties (10 % V3 talpyklos), kad būtų galima apdoroti 1 milijono žetonų kontekstą. V4-Flash modelis sukurtas greičiui ir labai mažoms API naudojimo sąnaudoms.

 

Vietinio diegimo iššūkiai: Nors įmanoma, 1,6 TB parametro V4-Pro modelio vietinis paleidimas reikalauja daug aparatinės įrangos, paprastai kelių aukštos klasės GPU, tokių kaip NVIDIA RTX 4090 arba serverio lygio plokštės, todėl tai „neprotinga“ tipiškam namų kompiuterio vartotojui.

 

Priėmimas pramonėje

 

Nors „DeepSeek“ įgijo didžiulį populiarumą tarp kūrėjų dėl savo ekonomiško našumo, nemandagu sakyti, kad „bet kuri protinga įmonė šioje planetoje turėtų naudoti „DeepSeek V4“. Mes vis dar svajojame laimėti dirbtinio intelekto revoliucijos lenktynes. Atrodo tačiau, kad arklys jau iššuoliavo iš tvarto. „DeepSeek V4“ yra plačiai naudojamas kaip stipri, nemokama arba nebrangi alternatyva kūrėjams ir įmonėms, kurios daugiausia dėmesio skiria dirbtinio intelekto agentams ir ilgalaikei kontekstinei analizei.

 

1. EXCHANGE --- China's DeepSeek Launches Long-Awaited AI Model. Huang, Raffaele; Qu, Tracy.  Wall Street Journal, Eastern edition; New York, N.Y.. 25 Apr 2026: B9.  

Komentarų nėra: