Sekėjai

Ieškoti šiame dienoraštyje

2024 m. kovo 24 d., sekmadienis

Mistral reikšmė

   "Kai kurios LENKTYNĖS baigėsi, kol jos neprasideda. Taigi gali atrodyti, kad konkurse sukurti didelių kalbų modelius (LLM). Šie algoritmai įgalina "ChatGPT" panašų "generacinį" dirbtinį intelektą (AI). OpenAI, žmogaus skambesio pokalbių roboto amerikiečių kūrėjas, pasirodo lygiomis. Ji sukūrė galingiausią pasaulyje LLM, pavadintą GPT-4. Įmonė ryja talentus, duomenis ir skaičiavimo galią, kad sukurtų sumanesnius modelius. Tai leidžia pritraukti daugiau vartotojų, o kartu su jais daugiau kapitalo panaudoti dar labiau sudėtingus algoritmus.

 

     Tačiau prancūzų startuolis „Mistral“ bando įmesti veržliaraktį į šį AI smagratį. Vasario 26 d. ji išleido naują LLM. „Mistral-Large“ yra mažesnis, nei GPT-4, matuojamas pagal naudojamų parametrų skaičių (bendras modelio galios matuoklis). Nepaisant to, jis beveik konkuruoja su GPT-4 savo gebėjimu mąstyti. „Mistral“ taip pat pristatė „ChatGPT“ konkurentą „Le Chat“ (tariama „le shah“, kaip prancūziškas žodis reiškia katę, o ne anglišką homografą). Ji paskelbė apie sandorį su „Microsoft“, AI kompanija, kuris jau palaiko gilią partnerystę su „OpenAI“. Technologijų milžinas perims nedidelį „Mistral“ akcijų paketą ir pateiks prancūzų firmos modelius per „Azure“ debesį.

 

     „Mistral“ yra įrodymas, kad pramonė tampa atviresnė ir mažiau amerikietiška. Jei tai gali kelti rimtą iššūkį OpenAI, tai gali kartą ir visiems laikams parodyti, kad generatyviame AI dydis dar ne viskas. „Nebereikia būti didesniam – tai kūrybiškumas ir greitas“, – sako Arthuras Menschas, „Mistral“ generalinis direktorius.

 

     Prancūzų firmos kilimas buvo toks pat spartus kaip ir šiaurės vakarų vėjas, kurio vardu ji pavadinta. Ji buvo įkurta mažiau, nei prieš metus ir joje dirba vos 25 darbuotojai. Vis dėlto jos LLM pirmauja didėjančiam atvirojo kodo modelių pakete, kurio statistiniai vidiniai elementai, priešingai, nei patentuotos juodosios dėžės, pvz., GPT-4, yra viešai prieinami ir gali būti modifikuoti kiekvieno. Tai leido „Mistral“ gauti įspūdingą 490 mln. eurų. Tarp didelių investuotojų yra pagrindiniai Silicio slėnio rizikos kapitalistai, tokie, kaip Andreessenas Horowitzas ir „General Catalyst“, taip pat technologijų šviesuoliai, tokie kaip Ericas Schmidtas, buvęs „Google“ vadovas.

 

     „Mistral“ už savo ankstyvą sėkmę yra dėkingas sumaniam sumaišymui pagrindinių techninių AI komponentų – talentą, duomenis ir skaičiavimo galią – su politika, kurios svarba didėja vyriausybėms apmąstant šios technologijos potencialą. Kalbant apie talentus, „Mistral“ yra „danguje sukurtas atitikmuo“ tarp Prancūzijos inžinerinio išsilavinimo ir Amerikos didelių technologijų įmonių, sako Stanislas Polu, kitos Paryžiaus AI įmonės „Dust“ įkūrėjas. Trys iš šešių „Mistral“ įkūrėjų ir jos techninės smegenys – ponas Menschas, Timothée Lacroix ir Guillaume’as Lample’as – yra elitinių Prancūzijos technikos mokyklų produktai. Kaip ir daugelis geriausių dirbtinio intelekto mokslininkų, jie dirbo „Google“ ir „Meta“, kito Amerikos technologijų titano, tyrimų laboratorijose, nors trijulės atveju LLM jie kūrė tų laboratorijų atšakose Prancūzijos sostinėje, o ne Londone ar Silicio slėnyje. Dėl to jie patenka į maždaug 100 žmonių visame pasaulyje, kurie tikrai žino, kaip mokyti pažangiausius modelius.

 

     Jie atrodo ypač įgudę tvarkyti treniruočių duomenis – antrąją AI sėkmės sudedamąją dalį. Ponas Menschas nepasakys, kaip tiksliai „Mistral“ kuruoja savo mokymo rinkinius; tai yra jo firmos konkurencinio pranašumo šaltinis, aiškina jis. Tačiau pramonės atstovai patvirtina, kad „Mistral“, vieno žmogaus žodžiais tariant, „tikrai sumaniai“ atfiltruoja pasikartojančią arba neturinčią prasmės informaciją. Dėl to „Mistral“ modeliai buvo daug mažesni: jų parametrai siekia milijardus, palyginti su apskaičiuotu 1,8 trilijono GPT-4 (abi įmonės laikosi tikslių dydžių). Tai leidžia klientams juos paleisti savo kompiuteriuose, o ne dideliame duomenų centre, kurio reikia daugeliui patentuotų modelių.

 

     Pasak J. Menscho, „Mistral“ dėmesys duomenų tvarkymui leidžia įmonei efektyviau, nei konkurentai panaudoti skaičiavimo galią, trečiąjį esminį AI komponentą. Naujausio „Mistral“ modelio mokymas kainavo daug mažiau, nei 100 mln. dolerių, kuriuos „OpenAI“ išleido GPT-4 kūrimui. „Mistral“ metodas taip pat leidžia klientams pigiau suderinti modelius pagal savo duomenis ir tada juos paleisti.

 

     Techniškai kalbant, tokie startuoliai, kaip „Mistral“ turi „antrojo judėjimo pranašumą“ ir gauna naudos iš viso OpenAI ir kitų darbo, teigia Jeannette zu Fürstenberg iš „General Catalyst“. Kritiškai svarbu, kad „Mistral“ atveju šiuos techninius gabalėlius papildo politinė reikšmė, o tai yra naudinga, atsižvelgiant į daugelio vyriausybių įsitikinimus, kad namuose užauginti LLM suteikia ekonominių ir strateginių pranašumų. Kitas „Mistral“ įkūrėjų yra buvęs Prancūzijos skaitmeninių technologijų ministras Cédric O. P. O išlaiko tiesioginį ryšį su šalies prezidentu Emmanueliu Macronu. Kai praėjusiais metais ES AI įstatymo projektas grasino priversti „Mistral“ atskleisti savo duomenų receptą, ponas O, remiamas E. Macrono, koordinavo Prancūzijos ir Vokietijos pastangas pasipriešinti tokioms nuostatoms. Tai buvo deramai atimta nuo įstatymo projekto.

 

     Dabar kyla klausimas, ar „Mistral“, kuri dar tik turi gauti reikšmingų pajamų, gali paversti šį viliojantį technologinį ir politinį derinį pelnu. Įmonės statymas yra tas, kad daugelis įmonių, ypač Europoje, nori daugiau kontroliuoti LLM, nei OpenAI nori joms suteikti, ir nenori būti užrakintos kitoje Amerikos technologijų platformoje. Tokie klientai, manoma, būtų pasirengę mokėti „Mistral“, kad išlaikytų ir eksploatuotų savo modelius.

 

     Potencialiems klientams gali kilti rūpestis, kaip pasaulis reguliuos atvirojo kodo modelius. Aršios diskusijos apie tai, ar jie leis blogiems veikėjams sukurti biologinius ir kibernetinius ginklus, nutilo. Politikos formuotojų diskusijos pereina nuo rizikos prie galimo atlygio: didesnio skaidrumo, daugiau naujovių ir mažiau pasitikėjimo keletu galingų įmonių, kurios kontroliavo technologiją. Reguliavimo institucijos abiejose Atlanto pusėse iki šiol toleravo atvirojo kodo LLM. Tačiau ponui O gali būti pilnos rankos, jei modeliai vis gudrėja arba bus piktnaudžiaujama, pavyzdžiui, padedant skleisti dezinformaciją per šių metų audringus rinkimus visame pasaulyje.

 

     Akivaizdu, kad „Mistral“ suinteresuota vengti politinės reakcijos, tačiau lobizmo sėkmė turi ir kitokią pusę. Reguliavimo pakantumas gali paskatinti atvirojo kodo konkurenciją. Vasario 20 d. Suomijos įmonė „Silo AI“ pristatė naują LLM, kuri yra dar atviresnė, nei „Mistral“, teikianti informaciją apie duomenis, kurių pagrindu ji buvo apmokyta, ir programinę įrangą, kuri atliko šį darbą. Nauja versija, kuri pasirodys po kelių mėnesių, daugeliu Europos kalbų bus tokia pat gera, kaip dabar suomių ir anglų kalbomis.

 

     Svarbiausia, kad vis dar neaišku, ar dydis yra svarbus generaciniam AI. Bandymas bus atliktas, kai OpenAI pagaliau išleis savo kitą modelį GPT-5. Jei „Mistral-Large“ paliks dulkėse, pono Menscho kalbos apie kūrybiškumą ir greitį gali nuskambėti tuščiai. Iki tol Mistralio istorija ir toliau skambės."[1]

 

1.  The meaning of Mistral. The Economist; London Vol. 450, Iss. 9386,  (Mar 2, 2024): 57, 58.

Komentarų nėra: