Koks artimiausias „Mirendil“ konkurentas Kinijoje?
„DeepSeek AI“ plačiai laikoma artimiausiu Kinijos atitikmeniu „Mirendil“.
Abi bendrovės yra žinomos dėl savo didelio dėmesio autonominėms dirbtinio intelekto tyrimų platformoms (DI, kurianti DI) ir pažangiausiems samprotavimo modeliams, apmokytiems esant dideliems skaičiavimo apribojimams.
• „Mirendil“ (JAV): San Franciske įsikūrusi „neolaboratorija“, įkurta buvusių „Anthropic“ ir xAI tyrėjų. Remiama „a16z“, ši bendrovė daugiausia dėmesio skiria savaime greitėjančiam dirbtinio intelekto tyrimams ir plėtrai bei autonominiam modeliavimui moksliniams ir medicininiams tyrimams.
• „DeepSeek“ (Kinija): Pekine įsikūrusi infrastruktūros ir pamatinių modelių laboratorija. Kaip ir „Mirendil“, ji yra dirbtinio intelekto samprotavimo pradininkė ir daugiausia dėmesio skiria modelių (pvz., „DeepSeek-V4/R1“) optimizavimui, siekiant našaus diegimo su mažiau išteklių.
Kaip atsirado „Mirendil“?
„DI, galintis sukurti išmanesnį DI: tai yra pagrindinis didelių dirbtinio intelekto laboratorijų tikslas – paspartinti savo pajėgumus. Tačiau šios laboratorijos riboja pašalinių asmenų galimybes naudoti jų įrankius tam pačiam tikslui pasiekti.
Dabar du šių didelių laboratorijų veteranai lažinasi, kad gali aplenkti savo buvusius darbdavius, kurdami ir platindami DI, kuris paspartintų DI tyrimus visiems.
Jų startuolis „Mirendil“ trečiadienį pranešė, kad pritraukė 200 mln. JAV dolerių pradinio finansavimo, kurio vertė siekia 1 mlrd. JAV dolerių, iš rizikos kapitalo įmonių „Andreessen Horowitz“, „Kleiner Perkins“ ir „Nvidia“ – tai vienas iš didesnių naujos DI bendrovės pradinio vertinimo atvejų pastaraisiais metais.
„Mirendil“ įkūrėjai Behnamas Neyshaburas ir Harshas Mehta teigia, kad jie tikisi, jog savarankiškai tobulėjančio DI kūrimas gali padėti atvirojo kodo DI kūrėjams neatsilikti nuo pažangių laboratorijų. Jie teigia, kad DI tyrimų spartinimas leis mokslininkams kurti savo specializuotus DI modelius tokiose srityse kaip medicina ar medžiagos.
„Tai, ką mes darome, yra DI, skirtas DI mokslui, o ne DI mokslas“, – sakė „Mirendil“ generalinis direktorius Neyshaburas. Kaip vieną iš būdų, kaip klientas galėtų panaudoti būsimus „Mirendil“ įrankius, jis paminėjo modelio, galinčio numatyti žmogaus Alzheimerio ligos išsivystymo riziką, kūrimą.
Abu įkūrėjai susipažino 2019 m., dirbdami „Google“. Mehta išsiuntė šaltą el. laišką Neyshaburui, kuris ką tik prisijungė prie įmonės ir buvo žinomas dėl savo darbo, siekiant suprasti, kodėl veikia DI modeliai. „Jis jau buvo tarsi maža įžymybė šioje srityje“, – sakė Mehta.
Jie jau seniai džiaugėsi būsimomis DI panaudojimo galimybėmis mokslo spartinimui, tačiau „tada modeliai buvo tikrai blogi“, – sakė Mehta.
Jie abu perėjo į „Anthropic“ 2024 m. pabaigoje ir išėjo 2025 m. gruodį, netrukus po to, kai buvo pristatytas „Claude Opus 4.5“ modelis, kuris smarkiai išplėtė vadinamųjų agentų galimybes atlikti sudėtingas užduotis.
„Mirendil“ lėšų rinkimas vyksta tuo metu, kai geriausios DI laboratorijos pačios vis dažniau naudoja DI, kad paspartintų DI tyrimus. Nuo gegužės mėnesio „Anthropic“ teigė Jos „Claude“ modelis parašė daugiau nei 80 % „Anthropic“ kodo.
Tačiau bendrovė neskatina kitų dirbtinio intelekto kūrėjų naudoti „Claude“, kad paspartintų savo pačių aukščiausios klasės dirbtinio intelekto kūrimą. „Anthropic“ paslaugų teikimo sąlygos draudžia naudoti jos įrankius kuriant „bet kokius produktus ar paslaugas, kurie konkuruoja su mūsų paslaugomis“.
Pranešime „Anthropic“ teigė, kad jos politika yra standartinė tarp pagrindinių modelių teikėjų ir padeda užkirsti kelią užsienio priešininkams mažinti JAV lyderystę pažangių dirbtinio intelekto srityje.
Kai „Anthropic“ neseniai išleido „Fable 5“ – saugumu apribotą galingo „Mythos“ modelio versiją, ji sumenkino atsakymus į kai kuriuos klausimus apie dirbtinio intelekto kūrimą nepranešdama vartotojams – praktika, kurią kai kurie kritikai pavadino antikonkurencinga. Bendrovė teigė, kad vėliau šias apsaugos priemones padarė matomas vartotojams. Netrukus po to bendrovė nusprendė neribotam laikui sustabdyti prieigą prie „Fable 5“ ir „Mythos 5“, kai Trumpo administracija įvedė eksporto kontrolę.
„Anthropic“ nurodė, kad dirbtinio intelekto naudojimas kuriant pažangesnį dirbtinį intelektą – kartais vadinamą rekursiniu savęs tobulinimu – yra potencialus pavojus. Kai kurie dirbtinio intelekto saugumo tyrėjai mano, kad modelių gebėjimas perrašyti jų pačių kodas be žmogaus priežiūros gali sukelti scenarijų, kuriame dirbtinio intelekto galimybės sparčiai išaugs ir nebegalės jų kontroliuoti. Tačiau Mehta ir Neyshabur rekursyvų savęs tobulinimą laiko „trumpiausiu keliu“ į mokslo spartinimą ir tiki, kad jį bus galima saugiai prižiūrėti. „Netikiu, kai žmonės tiesiog sako: „o, tai neįmanoma“, – sakė Neyshabur. „Tai tiesiog sudėtinga problema.“
„Andreessen Horowitz“ investuotojas Mattas Bornsteinas teigė, kad pirmaujančios laboratorijos tiesiog yra „racionalūs ekonominiai veikėjai“, neleisdamos klientams tobulinti savo modelių, taip sukurdamos poreikį tokiam startuoliui kaip „Mirendil“. „Struktūriškai turi būti nepriklausoma įmonė“, – sakė Bornsteinas.
Anksčiau „The Information“ pranešė apie kai kurias finansavimo detales.
Šiuo metu „Mirendil“ turi apie 20 techninių darbuotojų, dirbančių iš biuro San Francisko centre. Įkūrėjų komandą taip pat sudaro Shayan Salehian, vienas iš pirmųjų xAI narių, ir Tara Rezaei, MIT absolventė.
Ji prisijungia prie legiono startuolių su pavadinimo nuoroda į „Žiedų valdovo“ kūrinį (elfų kalba „Mirendil“ maždaug reiškia „brangių daiktų draugas“). Startuolis planuoja ateinančiais mėnesiais išleisti modelį ir produktą, kad gautų vartotojų atsiliepimų.” [1]
Kaip „Mirendil“ tikrina, ar naujos kartos dirbtinio intelekto modelis yra geresnis už ankstesnįjį?
„Mirendil“ tikrina, ar naujas dirbtinio intelekto modelis yra geresnis už savo pirmtaką, naudodama rekursinius savęs tobulinimo ciklus. Užuot remdamasi tik tradiciniais statiniais lyginamaisiais testais, įmonė matuoja, ar naujas modelis gali savarankiškai patobulinti mokslinių tyrimų ir plėtros procesą – generuoti, derinti ir vertinti savo neuroninių tinklų architektūras, kad greičiau tobulintų mašininį mokymąsi.
Startuolio vertinimo metodika orientuota į tai, kaip gerai dirbtinis intelektas atlieka visą šį tyrimų ciklą:
• Autonominis eksperimentavimas: tikrinama, ar naujas modelis gali savarankiškai kurti ir atlikti bandymus, įvertinti rezultatus ir iteruoti sudėtingas mokslines problemas.
• Modelio derinimas ir kodavimas: vertinamas modelio gebėjimas nustatyti ir ištaisyti klaidas savo programavimo ir duomenų rengimo etapuose.
• Architektūros iteracija: naudojamos sustiprinto mokymosi smėlio dėžės, kuriose neuroniniai tinklai sąveikauja, kad tobulintų savo įgūdžius ir architektūrą.
Daugiau informacijos apie tai, kaip šis buvęs „Anthropic“ startuolis artėja prie mokslinių tyrimų ir plėtros, galite rasti Andreesseno Horowitzo „Mirendil“ pranešime.
Ar norėtumėte sužinoti daugiau apie konkrečias mokslo sritis, į kurias jie orientuojasi, arba kaip DI veikia rekursinis savęs tobulinimas?
Paprastai naujos kartos DI modeliai yra testuojami pagal ankstesnes versijas, peržengiant statinius etalonus ir sutelkiant dėmesį į agentinių užduočių atlikimą (kaip gerai DI veikia autonomiškai) ir praktinį naudingumą (realaus pasaulio darbas), o ne vien remiantis suvestiniais balais.
Pirmaujantys DI kūrėjai naudoja keletą skirtingų testavimo metodikų, kad įrodytų, jog naujesnis modelis yra objektyviai geresnis:
• Užduotimis pagrįsti ir agentiniai etalonai: kūrėjai naudoja daugiapakopes sistemas, tokias kaip SWE-Bench arba GIAA2, kad pamatytų, ar naujas modelis gali sėkmingai išspręsti realaus pasaulio inžinerines ir tyrimų problemas be haliucinacijų.
• „LLM kaip teisėjo“ vertinimai: naujesnio modelio rezultatai dažnai vertinami pagal senesnio modelio rezultatus, naudojant trečiosios šalies specializuotą „vertintojo“ modelį (pvz., naudojant tokį modelį kaip „Prometheus“), kad būtų nustatyta kokybė, samprotavimai ir nurodymų laikymasis.
• Ilgalaikio konteksto streso testai: nauji modeliai yra testuojami pagal „kontekstą“ „pūvimas“, įterpiant konkrečius faktus įvairiuose gyliuose į didžiulius, daugiau nei milijono žetonų dokumentus, siekiant užtikrinti, kad modelis tiksliai atgautų duomenis neprarasdamas dėmesio.
• Realaus pasaulio „smėlio dėžės“ modeliavimas: pažangūs kūrėjai į virtualias imituojamas visuomenes įdeda autonominius modelius su realaus laiko naujienomis ir kintamaisiais, kad patikrintų samprotavimus, saugumą ir tikslų pasiekimą per ilgus seansus.
1. Anthropic Veterans Seek to Help AI Efforts of Scientists. Li, Tina. Wall Street Journal, Eastern edition; New York, N.Y.. 25 June 2026: B4.
Komentarų nėra:
Rašyti komentarą