„Ankstų rugpjūčio rytą „Google“ dirbtinio intelekto projektų vadovė įkėlė naujausią savo „DeepMind“ laboratorijos kūrinį į platformą, kuri reitinguoja dirbtinio intelekto modelius.
„Google“ atsiliko dirbtinio intelekto lenktynėse, o jos konkurentas „OpenAI“ pritraukė šimtus milijonų vartotojų į savo „ChatGPT“ pokalbių robotą. „Google“ tyrėjai tikėjosi, kad nauja funkcija – žaibiškai greitas vaizdų generatorius – suteiks paieškos titanui pranašumą silpnoje „ChatGPT“ vietoje.
Naina Raisinghani, žinoma „Google“ viduje dėl darbo iki vėlumos, turėjo sugalvoti pavadinimą naujam įrankiui, kad būtų galima užbaigti įkėlimą. Tačiau buvo 2:30 val. nakties, o aplinkui nieko nebuvo. Taigi, ji tiesiog sugalvojo pavadinimą – dviejų pravardžių, kurias jai davė draugai, mišinį: „Nano Banana“.
Per kelias dienas „Nano Banana“ užėmė pirmąją vietą našumo reitinguose platformoje „LM Arena“, buvo populiari X platformoje ir gerokai viršijo „Google“ naudojimo lūkesčius. Iki rugsėjo „Google“ dirbtinio intelekto programėlė „Gemini“ tapo, dažniausiai atsisiunčiama, programėle „Apple“ programėlių parduotuvėje.
Po dviejų mėnesių „Google“ pristatė galingiausią iki šiol „Gemini“ modelį, kuris aplenkė konkurentus ir tapo pajėgiausiu dirbtinio intelekto pokalbių robotu. Tuo, „Alphabet“ priklausanti, bendrovė aplenkė „OpenAI“ ir iškilo į dirbtinio intelekto lyderių sąrašą.
Tvirtos „Google“ šaknys moksle ir tyrimuose, noras investuoti milijardus dolerių į individualios įrangos kūrimą ir pastaraisiais metais įvykę vadovybės pokyčiai, atvėrę kelią greitesniems eksperimentams, dabar atsiperka. Bendrovė taip pat sugebėjo apsaugoti savo svarbų paieškos verslą – bent jau kol kas – nuo augančio pokalbių robotų populiarumo, robotų, kurie keičia vartotojų naudojimosi internetu būdą.
„Google“ dirbtinio intelekto darbas pradėjo generuoti dideles pajamas per paieškos skelbimus, mokamas „Gemini“ versijas vartotojams ir verslui bei naujų, įmonės viduje sukurtų kompiuterių lustų pardavimus. Lapkričio mėnesį išleistas naujausias „Google“ „Gemini“ modelis įvairiais rodikliais pranoko „ChatGPT“, todėl „Alphabet“ akcijų kaina šoktelėjo aukštyn, o „OpenAI“ viduje įvyko raudonasis kodas. Nuo to laiko ši bendrovė sumažino konkurenciją, pristatydama galingesnę „ChatGPT“ versiją, kuri vis dar turi daug daugiau vartotojų, nei „Google“ „Gemini“.
„Google“ generalinis direktorius Sundaras Pichai tą dieną, kai buvo pristatytas naujasis „Gemini“ modelis, išaukštino bendrovės DI pastangų mastą. „Malonu matyti, kad pradedame tokiu mastu, kaip „Google“, – vidiniame pranešime darbuotojams sakė jis.
Kai 2015 m. Pichai pakilo į aukščiausią „Google“ postą, DI technologija domino tik kompiuterių mokslo tyrėjus ir beveik nieką kitą. Kitais metais jis pareiškė, kad bendrovė, vartotojams žinoma dėl savo paieškos sistemos, žemėlapių ir produktyvumo įrankių, visiškai atsiduoda DI.
Bendrovės tinklaraštyje paskelbtame pranešime Pichai rašė, kad praėjusį dešimtmetį pasaulis buvo orientuotas į išmaniuosius telefonus. „Tačiau per ateinančius 10 metų, – prognozavo jis, – pereisime prie pasaulio, kuriame pirmiausia bus naudojamas DI, pasaulio, kuriame kompiuterija taps visuotinai prieinama.“
„Google“ jau buvo padėjusi pamatus su DI tyrimų padaliniu „Google Brain“, kurį 2011 m. įkūrė Jeffas Deanas, kompiuterių mokslininkas, padėjęs sukurti neuroninių tinklų technologiją, kuria grindžiami šiandieniniai dideli kalbų modeliai. Po kelerių metų „Google“ įsigijo „DeepMind“ – Londone įsikūrusią dirbtinio intelekto tyrimų laboratoriją, kurią įkūrė Demis Hassabis, šachmatų vunderkindas, vėliau gavęs Nobelio premiją už darbą su dirbtinio intelekto sistema, padedančia biomolekuliniams tyrimams.
Šis žingsnis tuo metu nesulaukė daug dėmesio – „Google“ taip pat pradėjo kurti savo dirbtinio intelekto lustus, manydama, kad jai reikės daug daugiau skaičiavimo galios, kad būtų galima palaikyti tokias programas, kaip balso atpažinimas. Šie lustai, vadinami tenzorių apdorojimo įrenginiais arba TPU, buvo sukurti taip, kad sunaudotų mažiau energijos, nei centriniai kompiuterių procesoriai arba vaizdo žaidimų kortelių grafikos apdorojimo įrenginiai. Jie pakeitė žaidimo taisykles „Google“ ir pramonei.
Tačiau pradžioje bendrovė atsargiai kūrė savo pokalbių robotus. Kai kurie jos vadovai ir tyrėjai nerimavo dėl tokių technologijų saugumo, nes jos gali pateikti netikslią, šališką ar kitaip problemišką informaciją.
Buvusi „Google Brain“ darbuotoja Julia Winn teigė, kad pokalbių robotai iš pradžių nebuvo laikomi pagrindine bendrovės platesnių dirbtinio intelekto ambicijų dalimi ir kad ankstyvųjų modelių bandymuose pasirodė, jog lengva išprovokuoti rasistinius ar seksistinius atsakymus.
„Į tokią riziką „Google“ žiūrėjo daug rimčiau, nei bet kuri kita vieta, kurioje dirbau, ir dėl suprantamų priežasčių“, – sakė ji. Toks atsargumas nuvylė daugelį įmonės tyrėjų, iš kurių kai kurie pasitraukė.
2022 m. rugpjūtį „Google“ pristatė pokalbių roboto modelį su įvairiomis pokalbių galimybėmis, kurį ribotas skaičius žmonių galėjo naudotis programėle, vadinama „AI Test Kitchen“ – savotišku bandymų poligonu. „Google“ jį pavadino LaMDA ir leido vartotojams išbandyti tris funkcijas: „Įsivaizduok“, „Išvardink“ ir „Pakalbėk apie tai (šunų leidimas)“, kurios leido vartotojams surengti pokalbį tik apie šunis.
Po trijų mėnesių „OpenAI“ po savo paties ilgamečių pastangų sukurti pokalbių robotą, kuris galėtų ne tik bendrauti, bet ir kurti istorijas, anekdotus, kompiuterinį kodą ir dar daugiau, padarė prieinamą visuomenei.
Per penkias dienas milijonas žmonių užsiregistravo jį išbandyti. Skirtingai nuo „Google“ „LaMDA“, vartotojams nebuvo taikomi dideli apribojimai, kaip jį naudoti.
Kai kurie „Google“ darbuotojai, kurie daugelį metų dirbo su šia technologija, nerimavo, kad bus apgauti. Kiti buvo priblokšti, kaip greitai visuomenė įsitraukė į „ChatGPT“.
Analitikai ir investuotojai svarstė, ar „Google“ nepraleidžia kitos didelės technologijų bangos. Jie klausė, kaip greitai bendrovė galėtų pristatyti savo dirbtinio intelekto produktus ir ar pokalbių robotų atsiradimas nesugriaus „Google“ paieškos ir reklamos verslo, kuris 2022 m. uždirbo 254 mlrd. USD pajamų.
Deanas ir Hassabis, du patyrę „Google“ dirbtinio intelekto mokslininkai, ir Jamesas Manyika, robotikos specialistas, prisijungęs 2022 m., dirbo, siekdami suvienyti „DeepMind“ ir „Brain“ padalinius dirbtinio intelekto mokymo srityje. 2023 m. sausį jie pristatė „Alphabet“ direktorių valdybai savo planą, kaip sukurti iki šiol išmaniausią bendrovės modelį.
Tuo tarpu „Google“ reikėjo pokalbių roboto, kuris galėtų pasiūlyti vartotojams – ir greitai. Kitą mėnesį ji pristatė „Bard“, sukurtą, remiantis savo „LaMDA“ modeliu. Pristatymas buvo nesėkmingas.
Vaizdo įraše, reklamuojančiame „Bard“, „Google“ parodė, kaip jis atsako į klausimą apie Jameso Webbo kosminį teleskopą. Pokalbių robotas netiksliai atsakė, kad teleskopas padarė planetos už Saulės sistemos ribų „pačius pirmuosius vaizdus“. Dėl šios nesėkmės „Alphabet“ akcijos nukrito 8 %.
Maždaug tuo metu „Google“ įkūrėjas Sergey Brin, kuris neseniai išėjo į pensiją, vakarėlyje kalbėjosi su „OpenAI“ tyrėju Danieliu Selsamu, teigia, su pokalbiu susipažinę, asmenys. Selsamas jo paklausė, kodėl jis nedirba visą darbo dieną su dirbtiniu intelektu. Ar „ChatGPT“ paleidimas neužvaldė jo, kaip kompiuterių mokslininko, vaizduotės?
„ChatGPT“ jau buvo pakeliui į tapimą žinomu vardu dirbtinio intelekto pokalbių robotų srityje, o „Google“ vis dar sunkiai bandė paleisti savo produktą. Brinas nusprendė, kad Selsamas teisus, ir grįžo į darbą.
Didžiąją 2023 m. dalį „Google“ vadovai stengėsi koordinuoti ir derinti dirbtinio intelekto kūrimo pastangas. Pasak buvusių darbuotojų, „Brain“ ir „DeepMind“ padalinių kultūros skyrėsi: pirmasis labiau orientuotas į tyrimus, o antrasis – į produktų kūrimą, todėl po jų sujungimo kilo įtampa.
Vis dėlto „Google“ turėjo vieną didžiulį pranašumą prieš savo didžiausią konkurentą. „OpenAI“ turėjo pritraukti lėšų iš investuotojų; „Google“ galėjo finansuoti tyrimus ir plėtrą iš savo kelių milijardų dolerių pelno. Tačiau „Google“ taip pat turėjo rasti būdą, kaip neleisti generatyviniam dirbtiniam intelektui pražudyti jos auksinės žąsies – 90 % interneto paieškos rinkos dalies, kuri yra jos reklamos verslo pagrindas.
Norėdama išsiaiškinti, kaip turėtų atrodyti dirbtinio intelekto valdoma paieška, bendrovė pradėjo daugiakomandinį projektą pavadinimu „Project Magi“, kuriam vadovavo Liz Reid, 2024 m. tapusi „Google“ paieškos viceprezidente. Grupės iššūkis, kaip ji paaiškino interviu, buvo išsiaiškinti, kaip atnaujinti paieškos sistemą, kad ji greitai pateiktų aiškų atsakymą į klausimą, kai atsakymo nebuvo viename tinklalapyje.
„Žmonės ne tik naudoja paiešką, jie ja pasikliauja“, – sakė ji. „Jei suklysite, išgirsite savo mamą, išgirsite savo draugą, išgirsite savo vaiką.“
„Google“ išleido savo pirmąjį „Gemini“ modelį dar 2023 m. pabaigoje. Nors „OpenAI“ iš pradžių „ChatGPT“ daugiausia treniravo su tekstu, „Google“ treniravo „Gemini“ su tekstu, kodu, garsu, vaizdais ir vaizdo įrašais, tai yra viena iš priežasčių, kodėl jo kūrimas užtruko ilgiau, teigė buvę darbuotojai.
Pirmoji „Gemini“ versija daugeliu atžvilgių vis dar atsiliko nuo „ChatGPT“, tačiau techniškai ambicingesnis „Google“ požiūris, laikui bėgant, atsipirko, kaip ir ankstyvieji jos tyrimai neuroninių tinklų srityje.
„Manau, kad mes vis dar gavome naudos iš šios ilgos istorijos“, – gruodį Stanfordo universiteto renginyje pastebėjo Brinas.
2024 m. gegužę „Google“ pristatė dirbtinio intelekto apžvalgas – trumpas, dirbtinio intelekto generuojamas santraukas, kurios dažnai rodomos paieškos rezultatų viršuje. Vėliau sekė didžiausias „Google“ paieškos sistemos pertvarkymas per daugelį metų: buvo sukurtas dirbtinio intelekto režimas – paieškos parinktis, kuri atsako į užklausas pokalbių roboto stiliaus pokalbyje. Viduje demonstracinės versijos po demonstracinės parodė, kas įmanoma, bet ir kaip sunku perprogramuoti paiešką, kad ji taptų panaši į pokalbių robotą, išlaikant greitį ir kokybę, sakė Reidas.
Galiausiai, po daugelio iteracijų, pasak Reid, ji ir kiti komandos nariai pradėjo matyti pakankamai vertės, kad galėtų ją viešai pristatyti. „Pradėjome matyti, kad patys jos ieškome ne tik testavimui, bet ir galvodami: „O, noriu tai naudoti“, – prisiminė Reid.
„Google“ praėjusį gegužę pristatė dirbtinio intelekto režimą. Ji taip pat pristatė „Gemini 2.5“ – galingesnę dirbtinio intelekto modelio versiją, tačiau ji nesukėlė tiek daug ažiotažo, kiek tikėjosi daugelis darbuotojų. „Alphabet“ akcijų kaina, kuri krito nuo metų pradžios, vasarą toliau krito.
Rugpjūčio mėnesį pristatytas „Nano Banana“ padidino „Google“ akcijų vertę. Josh Woodward, kuris prižiūri „Gemini“ programėlę ir „Google Labs“ – savotišką naujų dirbtinio intelekto programų bandymų poligoną – pavadino paleidimą „sėkmės katastrofa“. Kai žmonės visame pasaulyje pradėjo generuoti milijonus, o vėliau milijardus vaizdų, „Google“ sunkiai sekėsi rasti pakankamai skaičiavimo galios, kad patenkintų paklausą. Pasak jo, bendrovė naudojosi skubiomis serverio laiko paskolomis, kad padidintų skaičiavimo pajėgumus.
Iki spalio mėnesio „Gemini“ turėjo daugiau nei 650 milijonų vartotojų per mėnesį, palyginti su 450 milijonų liepą.
Lapkričio mėnesį paleista „Gemini 3“ sukėlė dar vieną skaičiavimo pajėgumų kliūtį. Tai problema, kurią „Google“ numatė jau daugiau, nei dešimtmetį, o jos sprendimas – sukurti dirbtinio intelekto kompiuterių lustai – atrodo, kaip konkurencinis pranašumas. Naujausias lustas, vadinamas „Ironwood“, padėjo gerokai sumažinti dirbtinio intelekto modelių eksploatavimo išlaidas.
Šį gruodį darbuotojams išsiųstame vidiniame pranešime Pichai pergalingai tarė: „2025 metus baigiame puikioje pozicijoje“, – rašė jis. „Žinant, kokia buvo mūsų, kaip įmonės, padėtis vos prieš metus, neįtikėtina matyti pažangą.“” [1]
1. How Google Got Its AI Groove Back --- Powerful new Gemini model allowed it to catch up to OpenAI's ChatGPT. Blunt, Katherine. Wall Street Journal, Eastern edition; New York, N.Y.. 08 Jan 2026: A1.
Komentarų nėra:
Rašyti komentarą