Sekėjai

Ieškoti šiame dienoraštyje

2024 m. rugpjūčio 31 d., šeštadienis

Dirbtinio intelekto aptarimas --- Naujosios technologijos turi savo kalbą: nuo neuroninių tinklų iki natūralios kalbos apdorojimo – vadovas, kaip suprasti pagrindines sąvokas

 

 

"Algoritmas

 

 Šiandieniniai algoritmai paprastai yra instrukcijų rinkinys, kurio kompiuteris turi laikytis. 

 

Tie, kurie skirti duomenims ieškoti ir rūšiuoti, yra kompiuterinių algoritmų, kurie padeda gauti informaciją ir sudėti ją tam tikra tvarka, pavyzdžiai. Jie gali būti sudaryti iš žodžių, skaičių arba kodo ir simbolių, jei juose nurodomi baigtiniai užduoties atlikimo žingsniai. Tačiau algoritmų šaknys slypi senovėje ir siekia bent jau Babilono laikų molio lenteles. Euklido dalijimo algoritmas vis dar naudojamas ir šiandien, o dantų valymas netgi gali būti distiliuotas į algoritmą, nors ir nepaprastai sudėtingą, atsižvelgiant į smulkių judesių, reikalingų, atliekant tą kasdienį ritualą, orkestravimą.

 

 Generatyvus dirbtinis intelektas (AI)

 

 Dirbtinio intelekto tipas, galintis sukurti įvairaus tipo turinį, įskaitant tekstą, vaizdus, ​​vaizdo įrašus ir garsą. Generatyvusis dirbtinis intelektas yra rezultatas, kai asmuo pateikia informaciją ar instrukcijas, vadinamas raginimais, į vadinamąjį pagrindinį modelį, kuris sukuria išvestį pagal raginimus. Pagrindiniai modeliai, pvz., didelių kalbų modeliai, yra apmokyti naudojant didžiulius, įvairius duomenų kiekius, kurie gali būti naudojami, kuriant labiau specializuotas programas, tokias, kaip pokalbių robotai, kodo rašymo asistentai ir projektavimo įrankiai. 

 

Tokie modeliai mokomi internete, taip pat labiau pritaikytuose duomenų rinkiniuose, kad būtų galima rasti ilgalaikius duomenų sekos modelius, leidžiančius dirbtinio intelekto programinei įrangai rašant ar kuriant išreikšti tinkamą kitą žodį ar pastraipą. Tokie modeliai ir jų programos apima teksto generatorius, tokius, kaip OpenAI ChatGPT ir Google Gemini, ir vaizdo generatorius, tokius, kaip OpenAI Dall-E ir Stability AI Stable Diffusion. („News Corp.“, „The Wall Street Journal“ savininkas, sudarė turinio licencijavimo sutartį su „OpenAI“.) Susidomėjimas generatyviu dirbtiniu intelektu nepaprastai išaugo 2022 m., kai buvo išleista „ChatGPT“, kuri palengvino sąveiką su pagrindine OpenAI technologija, įvedant klausimus ar raginimus kasdienine kalba.

 

 Mašininis mokymasis (ML)

 

 AI šaka, kuri remiasi technikomis, leidžiančiomis kompiuteriams mokytis iš apdorojamų duomenų. Mokslininkai anksčiau bandė sukurti dirbtinį intelektą, programuodami žinias tiesiai į kompiuterį.

 

 Galite pateikti ML sistemai milijonus gyvūnų nuotraukų iš žiniatinklio, kiekviena pažymėta, kaip katė arba šuo. Šis informacijos tiekimo procesas žinomas, kaip „mokymas“. Nežinodama nieko daugiau apie gyvūnus, sistema gali nustatyti statistinius paveikslėlių modelius ir naudoti tuos modelius, kad atpažintų ir klasifikuotų naujus kačių ir šunų pavyzdžius.

 

 Nors ML sistemos labai gerai atpažįsta duomenų modelius, jos yra mažiau veiksmingos, kai užduočiai atlikti reikia ilgų samprotavimų grandinių arba sudėtingo planavimo.

 

 Natūralios kalbos apdorojimas (NLP)

 

 Mašininio mokymosi forma, galinti interpretuoti ir reaguoti į žmonių kalbą. Jis maitina Apple Siri ir Amazon.com Alexa. Daugelis šiuolaikinių NLP metodų parenka žodžių seką pagal jų tikimybę pasiekti tikslą, pvz., apibendrinimą, klausimą ir atsakymą arba vertimą, sakė Danielis Mankowitzas, „Google“ antrinės įmonės, atliekančios dirbtinio intelekto tyrimus, „DeepMind“ personalo mokslininkas.

 

 Iš aplinkinio teksto konteksto galima spręsti, ar žodis „klubas“ reiškia sumuštinį, golfo žaidimo klubą ar naktinį gyvenimą. Šios srities šaknys siekia šeštąjį ir septintąjį dešimtmetį, kai, padedant kompiuteriams analizuoti ir suprasti kalbą reikėjo, kad mokslininkai patys koduotų taisykles. Šiandien kompiuteriai yra išmokyti patys kurti šias kalbų asociacijas.

 

 Pokalbių robotas

 

 Kompiuterinė programa, galinti užmegzti pokalbius su žmonėmis žmonių kalba. Šiuolaikiniai pokalbių robotai remiasi generatyviuoju AI, kur žmonės gali užduoti klausimus arba duoti nurodymus pagrindiniams modeliams žmonių kalbomis. ChatGPT yra pokalbių roboto, naudojančio didelį kalbos modelį, šiuo atveju OpenAI GPT, pavyzdys. Žmonės gali kalbėtis su ChatGPT temomis nuo istorijos iki filosofijos ir paprašyti sugeneruoti dainų tekstus Taylor Swift ar Billy Joel stiliumi arba pasiūlyti kompiuterio programavimo kodo pakeitimus. „ChatGPT“ gali apibendrinti didžiulį teksto kiekį ir paversti jį žmonių kalba išreikštais išvestiniais bet kokiomis temomis.

 

 Neuroniniai tinklai

 

 Mašininio mokymosi technika, kuri imituoja neuronų veikimą žmogaus smegenyse. Smegenyse neuronai gali siųsti ir priimti signalus, kurie skatina mintis ir emocijas. Dirbtiniame intelekte dirbtinių neuronų arba mazgų grupės panašiai siunčia ir gauna informaciją viena kitai. 

 

Dirbtiniai neuronai iš esmės yra kodo eilutės, kurios veikia, kaip jungties taškai su kitais dirbtiniais neuronais ir sudaro neuroninius tinklus.

 

 Skirtingai nuo senesnių mašininio mokymosi formų, jie nuolat mokosi iš naujų duomenų ir mokosi iš savo klaidų. Pavyzdžiui, Pinterest naudoja neuroninius tinklus vaizdams rasti, kurie  patrauks vartotojo akį, susmulkindamos kalnus duomenų apie vartotojus, pvz., paieškas, jų sekamas lentas ir kokius smeigtukus jie spustelėja ir išsaugo. Tuo pačiu metu tinklai žiūri į skelbimų duomenis apie naudotojus, pvz., koks turinys priverčia juos spustelėti skelbimus, kad sužinoti jų pomėgius ir pateikti aktualesnį turinį.

 

 Haliucinacijos

 

 Kai pamatinis modelis sukuria atsakymus, kurie nėra pagrįsti faktais ar tikrove, bet pateikiami, kaip tokie. Haliucinacijos skiriasi nuo šališkumo, atskiros problemos, atsirandančios, kai mokymo duomenys turi paklaidų, turinčių įtakos LLM rezultatams. Haliucinacijos yra vienas iš pagrindinių generatyvaus dirbtinio intelekto trūkumų, todėl daugelis ekspertų skatina turėti žmonių, kad galėtų prižiūrėti LLM ir jų rezultatus.

 

 Šis terminas sulaukė pripažinimo po 2015 m. tinklaraščio įrašo, kurį paskelbė OpenAI įkūrėjas Andrejus Karpathy, kuris rašė apie tai, kaip modeliai gali „haliucinuoti“ tekstinius atsakymus, pavyzdžiui, sudaryti tariamai patikimus matematinius įrodymus.

 

 Gilus mokymasis

 

 AI forma, kuri naudoja neuroninius tinklus ir nuolat mokosi. „Gilusis mokymasis“ reiškia kelis dirbtinių neuronų sluoksnius tinkle. Palyginti su neuroniniais tinklais, kurie geriau sprendžia mažesnes problemas, gilaus mokymosi algoritmai gali būti apdoroti sudėtingesnes dėl, tarpusavyje susijusių, mazgų sluoksnių. 

 

Nors juos įkvėpė žmogaus smegenų anatomija, rašė Oksfordo universiteto doktorantas Davidas Watsonas 2019 m. straipsnyje, neuroniniai tinklai yra trapūs, neefektyvūs ir trumparegiški, palyginti su tikrojo žmogaus smegenų veikla. Šis metodas labai išpopuliarėjo nuo to laiko, kai 2012 m. Toronto universiteto mokslininkų trijulė paskelbė reikšmingą darbą apie gilų mokymąsi.

 

 Dideli kalbų modeliai

 

 Gilaus mokymosi algoritmai, galintys apibendrinti, kurti, numatyti, išversti ir sintezuoti tekstą ir kitą turinį, nes jie mokomi, naudojant milžiniškus duomenų kiekius. Dažnas programuotojų ir duomenų mokslininkų išeities taškas yra mokyti šiuos modelius, naudojant atvirojo kodo, viešai prieinamus duomenų rinkinius iš interneto.

 

 Dideli kalbos modeliai (LLM) kyla iš „transformatoriaus“ modelio, kurį „Google“ sukūrė 2017 m., todėl tapo pigiau ir efektyviau mokyti modelius su didžiuliu duomenų kiekiu. Pirmasis OpenAI GPT modelis, išleistas 2018 m., buvo sukurtas naudojant „Google“ transformatorių. (GPT reiškia generatyvius iš anksto apmokytus transformatorius.) LLM, žinomi, kaip multimodaliniai kalbų modeliai, gali veikti įvairiais būdais, pavyzdžiui, kalba, vaizdais ir garsu.

 

 Bendrasis dirbtinis intelektas (AGI)

 

 Hipotetinė dirbtinio intelekto forma, kurioje mašina gali mokytis ir mąstyti, kaip žmogus. Nors dirbtinio intelekto bendruomenė nepasiekė bendro sutarimo dėl AGI, tyrimų įmonės IDC technologijų analitikė Ritu Jyoti teigė, kad norint išspręsti problemas, prisitaikyti prie aplinkos ir atlikti platesnius veiksmus, jam reikės savimonės ir sąmonės, kad susidoroti su plačiu užduočių spektru.

 

 Įmonės, įskaitant „OpenAI“ ir „Google DeepMind“, stengiasi kurti tam tikrą AGI formą. „DeepMind“ teigė, kad „AlphaGo“ programai buvo parodyta daugybė mėgėjų žaidimų, kurie padėjo suprasti protingą žmogaus žaidimą. Tada ji tūkstančius kartų žaidė prieš skirtingas jos pačios versijas, kiekvieną kartą mokydamasi iš jos klaidų.

 

 Laikui bėgant, AlphaGo tobulėjo ir tapo geresnė mokymosi ir sprendimų priėmimo procese – procesas, žinomas, kaip sustiprinimo mokymasis. „DeepMind“ teigė, kad jos programa „MuZero“ vėliau įvaldė „Go“, šachmatus, „shogi“ ir „Atari“, nereikalaujant taisyklių, o tai parodo jos gebėjimą planuoti laimėjimo strategijas nežinomoje aplinkoje. Kai kurie šią pažangą gali vertinti, kaip laipsnišką žingsnį AGI link.“ [1]

 

1. The Future of Everything: The Artificial Intelligence Issue --- New Tech Has a Language All Its Own: From neural networks to natural language processing, a guide to understanding key concepts. Rosenbush, Steven; Bousquette, Isabelle; Lin, Belle.  Wall Street Journal, Eastern edition; New York, N.Y.. 29 Aug 2024: R.4.

Komentarų nėra: