Sekėjai

Ieškoti šiame dienoraštyje

2024 m. balandžio 23 d., antradienis

„Microsoft“ imasi naujų, pigesnių ir mažesnių, dirbtinio intelekto sistemų

  „Bendrovė, investavusi milijardus į generuojančio dirbtinio intelekto (AI) pionierius, tokius, kaip OpenAI, teigia, kad milžiniškos sistemos nebūtinai yra tai, ko reikia visiems.

 

     Svaiginančiose lenktynėse kuriant generatyvųjį A.I., technologijų pramonės mantra buvo: kuo didesnė, tuo geresnė, nesvarbu, kokia kaina.

 

     Dabar technologijų įmonės pradeda naudoti mažesnes A.I. technologijas, kurios nėra tokios galingos, bet kainuoja daug pigiau. Ir daugeliui klientų tai gali būti geras kompromisas.

 

     Antradienį „Microsoft“ pristatė tris mažesnius A.I. modelius, priklausančius technologijų šeimai, kurią bendrovė pavadino Phi-3. Bendrovė teigė, kad net mažiausias iš trijų veikė beveik taip pat, kaip GPT-3.5, daug didesnė sistema, kuria buvo grindžiamas OpenAI ChatGPT pokalbių robotas, kai jis pribloškė pasaulį po jo išleidimo 2022 m.

 

     Mažiausias Phi-3 modelis gali tilpti į išmanųjį telefoną, todėl jį galima naudoti, net neprisijungus prie interneto. Ir jis gali veikti, naudojant tokius lustus, kurie maitina įprastus kompiuterius, o ne brangesnius „Nvidia“ pagamintus procesorius.

 

     Kadangi mažesni modeliai reikalauja mažiau apdorojimo, dideli technologijų tiekėjai gali apmokestinti klientus mažiau už jų naudojimą. Jie tikisi, kad tai reiškia, kad daugiau klientų gali kreiptis į A.I. vietose, kur didesni, pažangesni modeliai buvo per brangūs naudoti. Nors „Microsoft“ teigė, kad naudoti naujus modelius būtų „daug pigiau“, nei naudojant didesnius modelius, tokius, kaip GPT-4, ji nepateikė specifikos.

 

     Mažesnės sistemos yra mažiau galingos, o tai reiškia, kad jos gali būti ne tokios tikslios arba skambėti nepatogiai. Tačiau „Microsoft“ ir kitos technologijų įmonės lažinasi, kad klientai bus pasirengę atsisakyti tam tikro našumo, jei tai reiškia, kad pagaliau galės sau leisti A.I.

 

     Klientai įsivaizduoja daug būdų, kaip naudoti AI, bet su didžiausiomis sistemomis „jie sako: „O, bet žinote, jos gali būti brangokos“, – sakė „Microsoft“ vadovas Ericas Boydas. Mažesni modeliai, beveik pagal apibrėžimą, yra pigesni, sakė jis.

 

     P. Boydas sakė, kad kai kurie klientai, pavyzdžiui, gydytojai ar mokesčių rengėjai, galėtų pateisinti didesnio, tikslesnio A.I. sistemas, nes jų laikas yra toks brangus. Tačiau daugeliui užduočių gali neprireikti tokio paties tikslumo. Pavyzdžiui, internetiniai reklamuotojai mano, kad jie gali geriau taikyti skelbimus, naudodami A.I., tačiau jiems reikia mažesnių išlaidų, kad galėtų reguliariai naudotis sistemomis.

 

     „Noriu, kad mano gydytojas viską ištaisytų“, – sakė ponas Boydas. „Kitos situacijos, kai apibendrinu internetinių vartotojų atsiliepimus, jei tai šiek tiek ne taip, tai dar ne pasaulio pabaiga."

 

     Pokalbių robotus valdo dideli kalbų modeliai arba L.L.M.s, matematinės sistemos, kurios savaites praleidžia, analizuodamos skaitmenines knygas, Vikipedijos straipsnius, naujienų straipsnius, pokalbių žurnalus ir kitą tekstą, surinktą iš viso interneto. Tiksliai nustatydami modelius visame tame tekste, jie išmoksta patys kurti tekstą.

 

     Tačiau L.L.M. saugo tiek daug informacijos, todėl norint gauti tai, ko reikia kiekvienam pokalbiui, reikia didelės skaičiavimo galios. O tai brangu.

 

     Nors technologijų gigantai ir startuoliai, tokie, kaip „OpenAI“ ir „Anthropic“, daugiausia dėmesio skyrė didžiausioms A.I. sistemoms, jie taip pat konkuruoja, kurdami mažesnius modelius, siūlančius mažesnes kainas. Pavyzdžiui, „Meta“ ir „Google“ per pastaruosius metus išleido mažesnius modelius.

 

     „Meta“ ir „Google“ taip pat turi „atvirojo kodo“ šiuos modelius, o tai reiškia, kad kiekvienas gali juos naudoti ir modifikuoti nemokamai. Tai yra įprastas būdas įmonėms gauti išorės pagalbos, tobulinant programinę įrangą, ir paskatinti didesnę pramonę naudoti jų technologijas. „Microsoft“ taip pat atvirai tiekia naujus „Phi-3“ modelius.

 

     („The New York Times“ gruodį padavė į teismą OpenAI ir „Microsoft“ dėl naujienų turinio, susijusio su AI sistemomis, autorių teisių pažeidimo.)

 

     Po to, kai „OpenAI“ išleido „ChatGPT“, bendrovės vadovas Samas Altmanas sakė, kad kiekvieno pokalbio kaina buvo „vieno skaitmens centai“ – didžiulės išlaidos, atsižvelgiant į tai, kokios populiarios žiniatinklio paslaugos, pvz., „Wikipedia“, siūlomos už mažas cento dalis.

 

     Dabar mokslininkai teigia, kad jų mažesni modeliai gali bent jau priartėti prie pirmaujančių pokalbių robotų, tokių, kaip „ChatGPT“ ir „Google Gemini“, našumo. Iš esmės sistemos vis tiek gali analizuoti didelius duomenų kiekius, tačiau identifikuotus šablonus saugoti mažesniame pakete, kurį galima aptarnauti, naudojant mažesnę apdorojimo galią.

 

     Šių modelių kūrimas yra galios ir dydžio kompromisas. Sébastienas Bubeckas, tyrėjas ir „Microsoft“ viceprezidentas, teigė, kad bendrovė sukūrė naujus mažesnius modelius, tobulindama į juos perkeltus duomenis, siekdama užtikrinti, kad modeliai išmoktų iš aukštesnės kokybės teksto.

 

     Dalį šio teksto sukūrė A.I. pats – tai vadinama „sintetiniais duomenimis“. Tada kuratoriai stengėsi atskirti ryškiausią tekstą nuo kitų.

 

     „Microsoft“ sukūrė tris skirtingus mažus modelius: „Phi-3-mini“, „Phi-3-small“ ir „Phi-3-medium“. „Phi-3-mini“, kuris pasirodys antradienį, yra mažiausias (ir pigiausias), bet mažiausiai galingas. Phi-3 Medium, kurio kol kas nėra, yra galingiausias, bet didžiausias ir brangiausias.

 

     Padarius sistemas pakankamai mažas, kad jas būtų galima naudoti, idiegiant tiesiai į telefoną ar asmeninį kompiuterį, jos taps daug greitesnės ir daugmaž pigesnės“, sakė investicinio banko D.A. analitikas Gilas Luria. Davidsonas.“ [1]

 

1.  Microsoft Makes a New Push Into Smaller A.I. Systems. Weise, Karen; Metz, Cade.  New York Times (Online)New York Times Company. Apr 23, 2024.

Komentarų nėra: