Sekėjai

Ieškoti šiame dienoraštyje

2025 m. spalio 6 d., pirmadienis

PAMIRŠKITE CHATGPT: KAIP PALEISTI DIRBTINĮ INTELEKTINĮ INTERNETU NEŠIOJAMAME KOMPIUTERYJE


„Tyrėjai paprastai naudoja dirbtinį intelektą internetu, tačiau daugybė atvirai prieinamų įrankių reiškia, kad jiems to nereikia.

 

Svetainė histo.fyi yra imuninės sistemos baltymų, vadinamų pagrindiniu histosuderinamumo komplekso (MHC) molekulėmis, struktūrų duomenų bazė. Joje yra vaizdų, duomenų lentelių ir aminorūgščių sekų, o ją tvarko bioinformatikas Chrisas Thorpe'as, kuris naudoja dirbtinio intelekto (DI) įrankius, vadinamus dideliais kalbos modeliais (LLM), kad konvertuotų šiuos išteklius į skaitomas santraukas. Tačiau jis nenaudoja „ChatGPT“ ar jokio kito žiniatinklio pagrindu veikiančio LLM. Vietoj to, Thorpe'as naudoja DI savo nešiojamajame kompiuteryje.

 

Per pastaruosius porą metų LLM pagrindu sukurti pokalbių robotai pelnė pagarbą už gebėjimą rašyti poeziją ar dalyvauti pokalbiuose. Kai kurie LLM turi šimtus milijardų parametrų – kuo daugiau parametrų, tuo didesnis sudėtingumas – ir prie jų galima prisijungti tik internetu. Tačiau suklestėjo dar dvi naujausios tendencijos.

 

Pirma, organizacijos kuria „atviro svorio“ versijas LLM (licencijuotos teisės studijos), kuriose modelio mokymui naudojami svoriai ir paklaidos yra viešai prieinami, kad vartotojai, turintys pakankamai skaičiavimo galios, galėtų juos atsisiųsti ir paleisti vietoje.

 

Antra, technologijų įmonės kuria sumažintas versijas, kurias galima paleisti vartotojų aparatinėje įrangoje ir kurios konkuruoja su senesnių, didesnių modelių našumu.

 

Tyrėjai gali naudoti tokias priemones, kad sutaupytų pinigų, apsaugotų pacientų ar korporacijų konfidencialumą arba užtikrintų atkuriamumą.

 

Thorpe'as, įsikūręs Oksforde, JK, ir dirbantis Europos molekulinės biologijos laboratorijos Europos bioinformatikos institute Hinkstone, JK, yra tik vienas iš daugelio tyrėjų, tyrinėjančių, ką gali šie įrankiai. Thorpe'o teigimu, ši tendencija greičiausiai augs. Kompiuteriams tampant greitesniems ir modeliams efektyvesniems, žmonės vis dažniau turės dirbtinio intelekto (DI) programas savo nešiojamuosiuose kompiuteriuose ar mobiliuosiuose įrenginiuose, kad patenkintų visus poreikius, išskyrus pačius intensyviausius.

 

Mokslininkai pagaliau turės dirbtinio intelekto asistentus po ranka – bet pačius algoritmus, o ne tik nuotolinę prieigą prie jų.

 

Dideli dalykai mažuose paketuose

 

Kelios didelės technologijų įmonės ir tyrimų institutai išleido mažus ir atvirojo svorio modelius per pastaruosius kelerius metus, įskaitant „Google DeepMind“ Londone; „Meta“ Menlo Parke, Kalifornijoje; ir Alleno dirbtinio intelekto institutą Sietle, Vašingtone.

 

(„Mažas“ yra reliatyvus – šie modeliai gali turėti apie 30 milijardų parametrų, o tai yra daug, palyginti su ankstesniais modeliais.)

 

Nors Kalifornijos technologijų įmonė „OpenAI“ neatliko atvirojo svorio savo dabartiniams GPT modeliams, jos partnerė „Microsoft“ Redmonde, Vašingtone, aktyviai ėmėsi šio tikslo, 2023 m. išleisdama mažuosius kalbos modelius „Phi-1“, „Phi-1.5“ ir „Phi-2“, o šiais metais – keturias „Phi-3“ versijas ir tris „Phi-3.5“ versijas.

 

„Phi-3“ ir „Phi-3.5“ modeliai turi nuo 3,8 iki 14 milijardų aktyvių parametrų, o du modeliai („Phi-3-vision“ ir „Phi-3.5-vision“) tvarko vaizdus1.

 

Pagal kai kuriuos kriterijus net mažiausias „Phi“ modelis lenkia „OpenAI“ GPT-3.5 Turbo nuo 2023 m., kuris, kaip gandai teigia, turi 20 milijardų parametrų.

 

Sébastien Bubeck, „Microsoft“ generatyvinio dirbtinio intelekto viceprezidentas, „Phi-3“ našumą priskiria jo mokymo duomenų rinkiniui. Iš pradžių LLM mokosi numatydami kitą „žetoną“ (teksto dalį) ilgose teksto eilutėse. Pavyzdžiui, norėdama nuspėti žudiko vardą detektyvo pabaigoje, DI turi „suprasti“ viską, kas buvo prieš tai, tačiau tokios reikšmingos prognozės daugumoje tekstų yra retos. Kad išspręstų šią problemą, „Microsoft“ naudojo LLM, kad parašytų milijonus apsakymų ir vadovėlių, kuriuose vienas dalykas remiasi kitu. Bubeck teigimu, mokymo su šiuo tekstu rezultatas yra modelis, kuris telpa mobiliajame telefone, tačiau turi pradinės 2022 m. „ChatGPT“ versijos galią. „Jei pavyks sukurti duomenų rinkinį, kuriame gausu šių samprotavimo žetonų, signalas bus daug turtingesnis“, – sako jis.

 

„Phi-3“ taip pat gali padėti nukreipti – nuspręsti, ar užklausa turėtų būti nukreipta į didesnį modelį. „Tai yra vieta, kurioje „Phi-3“ sužibės“, – sako Bubeckas.

 

Maži modeliai taip pat gali padėti mokslininkams atokiuose regionuose, kuriuose yra mažai debesijos ryšio. „Čia, Ramiojo vandenyno šiaurės vakaruose, turime nuostabių vietų žygiams, o kartais tiesiog neturiu tinklo“, – sako jis. „O galbūt noriu nufotografuoti kokią nors gėlę ir paklausti savo dirbtinio intelekto apie ją informacijos.“

 

Tyrėjai gali remtis šiais įrankiais kurdami individualias programas. Pavyzdžiui, Kinijos elektroninės prekybos svetainė „Alibaba“ sukūrė modelius, vadinamus „Qwen“, su 500–72 milijardais parametrų. Biomedicinos mokslininkas iš Naujojo Hampšyro, naudodamas mokslinius duomenis, tiksliai suderino didžiausią „Qwen“ modelį, kad sukurtų „Turbcat-72b“, kurį galima rasti modelių bendrinimo svetainėje „Hugging Face“. (Tyrėja „Discord“ pranešimų platformoje prisistato tik Kal'tsit vardu, nes dirbtinio intelekto pagalba atliekamas darbas moksle vis dar kelia prieštaringų vertinimų.) Kal'tsit teigia, kad sukūrė modelį, kuris padėtų tyrėjams generuoti idėjas, taisyti rankraščius, kurti kodo prototipus ir apibendrinti paskelbtus straipsnius; modelis buvo atsisiųstas tūkstančius kartų.

 

Išsaugojimas privatumas

 

Papildomai prie galimybės tiksliai suderinti atvirus modelius tikslinėms programoms, pasak Kal'tsit, dar vienas vietinių modelių privalumas yra privatumas. Asmeniškai identifikuojamų duomenų siuntimas komercinei paslaugai gali pažeisti duomenų apsaugos reglamentus. „Jei įvyktų auditas ir parodytumėte jiems, kad naudojate „ChatGPT“, situacija galėtų tapti gana nemaloni“, – sako ji.

 

Cyril Zakka, gydytojas, vadovaujantis „Hugging Face“ sveikatos priežiūros komandai, naudoja vietinius modelius, kad generuotų mokymo duomenis kitiems modeliams (kurie kartais taip pat yra vietiniai). Viename projekte jis juos naudoja diagnozėms iš medicininių ataskaitų išgauti, kad kitas modelis galėtų išmokti numatyti šias diagnozes remdamasis echokardiogramomis, kurios naudojamos širdies ligoms stebėti. Kitame projekte jis naudoja modelius klausimams ir atsakymams iš medicinos vadovėlių generuoti, kad išbandytų kitus modelius. „Mes tiesiame kelią visiškai autonominei chirurgijai“, – aiškina jis. Robotas, apmokytas atsakyti į klausimus, galėtų geriau bendrauti su gydytojais.

 

Zakka naudoja vietinius modelius – jis renkasi „Mistral 7B“, kurį išleido technologijų įmonė „Mistral Al“ Paryžiuje, arba „Meta“ „Llama-3 70B“, nes jie pigesni nei prenumeratos paslaugos, tokios kaip „ChatGPT Plus“, ir nes jis gali juos tiksliai suderinti.

 

Tačiau privatumas taip pat svarbus, nes jam neleidžiama siųsti pacientų medicininių įrašų komercinėms dirbtinio intelekto paslaugoms.

 

Johnsonas Thomasas, endokrinologas iš sveikatos priežiūros sistemos „Mercy“ Springfilde, Misūrio valstijoje, taip pat motyvuojamas pacientų privatumo. Gydytojai retai turi laiko transkribuoti ir apibendrinti pacientų pokalbius, tačiau dauguma komercinių paslaugų, kurios tam naudoja dirbtinį intelektą, yra arba per brangios, arba neturi leidimo tvarkyti privačius medicininius duomenis. Todėl Thomasas kuria alternatyvą. Remiantis „Whisper“ – atvirojo svorio kalbos atpažinimo modeliu iš „OpenAI“ – ir „Gemma 2“ iš „Google DeepMind“, sistema leis gydytojams transkribuoti pokalbius ir konvertuoti juos į medicinines pastabas, taip pat apibendrinti medicininių tyrimų dalyvių duomenis.

 

Privatumas taip pat yra svarbus pramonės šakoje. „CELLama“, sukurta Pietų Korėjos farmacijos kompanijoje „Portrai“ Seule, naudoja vietines LLM, tokias kaip „Llama 3.1“, kad sumažintų informaciją apie ląstelės genų raišką ir kitas charakteristikas iki santraukos sakinio2. Tada ji sukuria skaitmeninį šio sakinio vaizdą, kurį galima naudoti ląstelėms suskirstyti į tipus. Kūrėjai savo „GitHub“ puslapyje pabrėžia privatumą kaip vieną iš privalumų, pažymėdami, kad „CELLama“ „veikia lokaliai, užtikrindama, kad nebūtų duomenų nutekėjimo“.

 

Modelių panaudojimas

 

Tobulėjant LLM aplinkai, mokslininkai susiduria su sparčiai besikeičiančiu pasirinkimų meniu. „Aš vis dar esu bandymų, bandymų naudoti LLM lokaliai etape“, – sako Thorpe'as. Jis bandė „ChatGPT“, bet manė, kad tai brangu, o jos išvesties tonas nebuvo tinkamas. Dabar jis naudoja „Llama“ lokaliai, su 8 milijardais arba 70 milijardų parametrų, kurie abu gali veikti jo „Mac“ nešiojamajame kompiuteryje.

 

Kitas privalumas, pasak Thorpe'o, yra tai, kad vietiniai modeliai nesikeičia. Tuo tarpu komerciniai kūrėjai gali bet kada atnaujinti savo modelius, todėl gaunami skirtingi rezultatai ir Thorpe'as yra priverstas keisti savo užduotis ar šablonus. „Daugumoje mokslo sričių norite, kad dalykai būtų atkartojami“, – aiškina jis. „Ir visada neramu, jei nekontroliuojate generuojamo rezultato atkuriamumo.“

 

Kitam projektui Thorpe'as rašo kodą, kuris sulygiuoja MHC molekules pagal jų 3D struktūrą. Norėdamas sukurti ir išbandyti savo algoritmus, jam reikia daug įvairių baltymų – daugiau nei egzistuoja natūraliai. Norėdamas sukurti tikėtinus naujus baltymus, jis naudoja „ProtGPT2“ – atvirojo svorio modelį su 738 milijonais parametrų, kuris buvo apmokytas maždaug 50 milijonų sekų3.

 

Tačiau kartais vietinė programa netinka. Kodavimui Thorpe'as kaip partnerį naudoja debesijos pagrindu veikiančią „GitHub Copilot“. „Jaučiuosi taip, lyg man būtų nukirsta ranka, kai dėl kažkokių priežasčių negaliu naudoti „Copilot“, – sako jis. Yra vietinių LLM pagrindu sukurtų kodavimo įrankių (pvz., „Google DeepMind“ sukurta „CodeGemma“ ir Kalifornijoje įsikūrusių kūrėjų „Continue“), tačiau, jo patirtimi, jie negali konkuruoti su „Copilot“.

 

Prieigos taškai

 

Taigi, kaip paleisti vietinę LLM? Programinė įranga, vadinama „Ollama“ (galima naudoti „Mac“, „Windows“ ir „Linux“ operacinėse sistemose) leidžia vartotojams atsisiųsti atvirus modelius, įskaitant „Llama 3.1“, „Phi-3“, „Mistral“ ir „Gemma 2“, ir pasiekti juos per komandinę eilutę [A].

 

Kitos parinktys apima kelių platformų programą GPT4A11 ir „Llamafile“, kuri gali transformuoti LLM į vieną failą, veikiantį bet kurioje iš šešių operacinių sistemų, su grafikos procesoriumi arba be jo.

 

Sharon Machiis, buvusi svetainės „InfoWorld“ redaktorė, gyvenanti Framinghame, Masačusetse, parašė vadovą, kaip naudoti LLM vietiniu būdu, kuriame aptarta keliolika variantų. „Pirmiausia siūlyčiau, – sako ji, – pasirinkti programinę įrangą, atitinkančią jūsų lygį ir tai, kiek norite žaisti.“ Vieni žmonės renkasi programų paprastumą, o kiti – komandinės eilutės lankstumą.

 

Nepriklausomai nuo pasirinkto metodo, vietinės LLM netrukus turėtų būti pakankamai geros daugumai programų, sako Stephenas Hoodas, vadovaujantis atvirojo kodo skyriui  DI technologijų įmonėje „Mozilla“ San Franciske. „Per pastaruosius metus pasiekta stulbinanti pažanga“, – sako jis.

 

Kalbant apie tai, kokios galėtų būti tos programos, tai spręsti vartotojams. „Nebijokite išsipurvinti rankų“, – sako Zakka. „Rezultatai gali jus maloniai nustebinti.“

 

Matthew Hutson yra mokslo rašytojas, gyvenantis Niujorke.

Literatūra

 

1. Abdin, M. ir kt. Išankstinis spausdinimas svetainėje „arXiv“ https://doi.org/10.48550/ arXiv.2404.14219 (2024).

 

2. Choi, H. etai. Išankstinis spausdinimas svetainėje „bioRxiv“ https://doi.Org/l0.ll0l/2024.05.08.593094 (2024).

 

3. Ferruz, N. ir kt. „Nature Commun.“ 13, 4348 (2022). [B]

 

A. Komandinė eilutė, dar vadinama komandinės eilutės sąsaja (CLI), terminalu, konsole arba apvalkalu, yra tekstinė sąsaja, naudojama sąveikai su kompiuterio operacine sistema. Užuot naudoję pelę ir grafinius elementus (kaip grafinėje sąsajoje), vartotojai įveda komandas, kad atliktų įvairias užduotis.

 

Pagrindiniai komandinės eilutės aspektai:

 

Tekstinė sąveika:

Vartotojai įveda komandas kaip teksto eilutes, kurias vėliau interpretuoja ir vykdo sistema.

Sistemos sąveika:

Ji leidžia tiesiogiai manipuliuoti failų sistema, vykdyti programas ir konfigūruoti sistemos nustatymus.

Efektyvumas atliekant konkrečias užduotis:

Nors grafinės sąsajos daugeliui vartotojų yra intuityvios, komandinė eilutė gali būti žymiai greitesnė ir efektyvesnė atliekant tokias užduotis kaip paketinis apdorojimas, automatizavimas ir nuotolinis administravimas.

Prieinamumas įvairiose operacinėse sistemose:

Visos pagrindinės operacinės sistemos, įskaitant „Windows“ (komandų eilutė arba „PowerShell“), „macOS“ (terminalas) ir „Linux“ (įvairūs apvalkalai, pvz., „Bash“, „Zsh“), teikia komandinės eilutės sąsają.

Pagrindinis įrankis kūrėjams ir administratoriams:

Tai pagrindinis įrankis programuotojams, sistemos administratoriams ir visiems, kuriems reikia tiksliai valdyti savo kompiuterį. operacijos.

 

Dažniausios užduotys, atliekamos naudojant komandinę eilutę:

 

Katalogų (aplankų) naršymas

Failų ir katalogų kūrimas, naikinimas ir pervadinimas

Programų ir scenarijų vykdymas

Sistemos procesų valdymas

Tinklo nustatymų konfigūravimas

Pasikartojančių užduočių automatizavimas, naudojant scenarijus

 

B. FORGET CHATGPT: HOW TO RUN AI LOCALLY ON A LAPTOP. Anonymous.  Nature; London Vol. 633, Iss. 8030,  (Sep 19, 2024): 728-729.

Komentarų nėra: