„Ankstų rugpjūčio rytą „Google“ dirbtinio intelekto projektų
vadovė įkėlė naujausią savo „DeepMind“ laboratorijos kūrinį į platformą, kuri
reitinguoja dirbtinio intelekto modelius.
„Google“ atsiliko dirbtinio intelekto lenktynėse, o jos
konkurentas „OpenAI“ pritraukė šimtus milijonų vartotojų į savo „ChatGPT“
pokalbių robotą. „Google“ tyrėjai tikėjosi, kad nauja funkcija – žaibiškai
greitas vaizdų generatorius – suteiks paieškos titanui pranašumą silpnoje
„ChatGPT“ vietoje.
Naina Raisinghani, žinoma „Google“ viduje dėl darbo iki
vėlumos, turėjo sugalvoti pavadinimą naujam įrankiui, kad būtų galima užbaigti
įkėlimą. Tačiau buvo 2:30 val. nakties, o aplinkui nieko nebuvo. Taigi, ji
tiesiog sugalvojo pavadinimą – dviejų pravardžių, kurias jai davė draugai,
mišinį: „Nano Banana“.
Per kelias dienas „Nano Banana“ užėmė pirmąją vietą našumo
reitinguose platformoje „LM Arena“, buvo populiari X platformoje ir gerokai
viršijo „Google“ naudojimo lūkesčius. Iki rugsėjo „Google“ dirbtinio intelekto
programėlė „Gemini“ tapo, dažniausiai atsisiunčiama, programėle „Apple“
programėlių parduotuvėje.
Po dviejų mėnesių „Google“ pristatė galingiausią iki šiol
„Gemini“ modelį, kuris aplenkė konkurentus ir tapo pajėgiausiu dirbtinio
intelekto pokalbių robotu. Tuo, „Alphabet“ priklausanti, bendrovė aplenkė
„OpenAI“ ir iškilo į dirbtinio intelekto lyderių sąrašą.
Tvirtos „Google“ šaknys moksle ir tyrimuose, noras
investuoti milijardus dolerių į individualios įrangos kūrimą ir pastaraisiais
metais įvykę vadovybės pokyčiai, atvėrę kelią greitesniems eksperimentams,
dabar atsiperka. Bendrovė taip pat sugebėjo apsaugoti savo svarbų paieškos
verslą – bent jau kol kas – nuo augančio pokalbių robotų populiarumo, robotų,
kurie keičia vartotojų naudojimosi internetu būdą.
„Google“ dirbtinio intelekto darbas pradėjo generuoti
dideles pajamas per paieškos skelbimus, mokamas „Gemini“ versijas vartotojams
ir verslui bei naujų, įmonės viduje sukurtų kompiuterių lustų pardavimus.
Lapkričio mėnesį išleistas naujausias „Google“ „Gemini“ modelis įvairiais
rodikliais pranoko „ChatGPT“, todėl „Alphabet“ akcijų kaina šoktelėjo aukštyn,
o „OpenAI“ viduje įvyko raudonasis kodas. Nuo to laiko ši bendrovė sumažino
konkurenciją, pristatydama galingesnę „ChatGPT“ versiją, kuri vis dar turi daug
daugiau vartotojų, nei „Google“ „Gemini“.
„Google“ generalinis direktorius Sundaras Pichai tą dieną,
kai buvo pristatytas naujasis „Gemini“ modelis, išaukštino bendrovės DI
pastangų mastą. „Malonu matyti, kad pradedame tokiu mastu, kaip „Google“, –
vidiniame pranešime darbuotojams sakė jis.
Kai 2015 m. Pichai pakilo į aukščiausią „Google“ postą, DI
technologija domino tik kompiuterių mokslo tyrėjus ir beveik nieką kitą. Kitais
metais jis pareiškė, kad bendrovė, vartotojams žinoma dėl savo paieškos
sistemos, žemėlapių ir produktyvumo įrankių, visiškai atsiduoda DI.
Bendrovės tinklaraštyje paskelbtame pranešime Pichai rašė,
kad praėjusį dešimtmetį pasaulis buvo orientuotas į išmaniuosius telefonus.
„Tačiau per ateinančius 10 metų, – prognozavo jis, – pereisime prie pasaulio,
kuriame pirmiausia bus naudojamas DI, pasaulio, kuriame kompiuterija taps
visuotinai prieinama.“
„Google“ jau buvo padėjusi pamatus su DI tyrimų padaliniu
„Google Brain“, kurį 2011 m. įkūrė Jeffas Deanas, kompiuterių mokslininkas,
padėjęs sukurti neuroninių tinklų technologiją, kuria grindžiami šiandieniniai
dideli kalbų modeliai. Po kelerių metų „Google“ įsigijo „DeepMind“ – Londone
įsikūrusią dirbtinio intelekto tyrimų laboratoriją, kurią įkūrė Demis Hassabis,
šachmatų vunderkindas, vėliau gavęs Nobelio premiją už darbą su dirbtinio
intelekto sistema, padedančia biomolekuliniams tyrimams.
Šis žingsnis
tuo metu nesulaukė daug dėmesio – „Google“ taip pat pradėjo kurti savo
dirbtinio intelekto lustus, manydama, kad jai reikės daug daugiau skaičiavimo
galios, kad būtų galima palaikyti tokias programas, kaip balso atpažinimas. Šie
lustai, vadinami tenzorių apdorojimo įrenginiais arba TPU, buvo sukurti taip,
kad sunaudotų mažiau energijos, nei centriniai kompiuterių procesoriai arba
vaizdo žaidimų kortelių grafikos apdorojimo įrenginiai. Jie pakeitė žaidimo
taisykles „Google“ ir pramonei.
Tačiau pradžioje bendrovė atsargiai kūrė savo pokalbių
robotus. Kai kurie jos vadovai ir tyrėjai nerimavo dėl tokių technologijų
saugumo, nes jos gali pateikti netikslią, šališką ar kitaip problemišką
informaciją.
Buvusi „Google Brain“ darbuotoja Julia Winn teigė, kad
pokalbių robotai iš pradžių nebuvo laikomi pagrindine bendrovės platesnių
dirbtinio intelekto ambicijų dalimi ir kad ankstyvųjų modelių bandymuose
pasirodė, jog lengva išprovokuoti rasistinius ar seksistinius atsakymus.
„Į tokią riziką „Google“ žiūrėjo daug rimčiau, nei bet kuri kita vieta, kurioje dirbau, ir dėl
suprantamų priežasčių“, – sakė ji. Toks atsargumas nuvylė daugelį įmonės
tyrėjų, iš kurių kai kurie pasitraukė.
2022 m. rugpjūtį „Google“ pristatė pokalbių roboto modelį su
įvairiomis pokalbių galimybėmis, kurį ribotas skaičius žmonių galėjo naudotis
programėle, vadinama „AI Test Kitchen“ – savotišku bandymų poligonu. „Google“
jį pavadino LaMDA ir leido vartotojams išbandyti tris funkcijas: „Įsivaizduok“,
„Išvardink“ ir „Pakalbėk apie tai (šunų leidimas)“, kurios leido vartotojams
surengti pokalbį tik apie šunis.
Po trijų mėnesių „OpenAI“ po savo paties ilgamečių pastangų
sukurti pokalbių robotą, kuris galėtų ne tik bendrauti, bet ir kurti istorijas,
anekdotus, kompiuterinį kodą ir dar daugiau, padarė prieinamą visuomenei.
Per penkias dienas milijonas žmonių užsiregistravo jį
išbandyti. Skirtingai nuo „Google“ „LaMDA“, vartotojams nebuvo taikomi dideli
apribojimai, kaip jį naudoti.
Kai kurie „Google“ darbuotojai, kurie daugelį metų dirbo su
šia technologija, nerimavo, kad bus apgauti. Kiti buvo priblokšti, kaip greitai
visuomenė įsitraukė į „ChatGPT“.
Analitikai ir investuotojai svarstė, ar „Google“
nepraleidžia kitos didelės technologijų bangos. Jie klausė, kaip greitai
bendrovė galėtų pristatyti savo dirbtinio intelekto produktus ir ar pokalbių
robotų atsiradimas nesugriaus „Google“ paieškos ir reklamos verslo, kuris 2022
m. uždirbo 254 mlrd. USD pajamų.
Deanas ir Hassabis, du patyrę „Google“ dirbtinio intelekto
mokslininkai, ir Jamesas Manyika, robotikos specialistas, prisijungęs 2022 m.,
dirbo, siekdami suvienyti „DeepMind“ ir „Brain“ padalinius dirbtinio intelekto
mokymo srityje. 2023 m. sausį jie pristatė „Alphabet“ direktorių valdybai savo
planą, kaip sukurti iki šiol išmaniausią bendrovės modelį.
Tuo tarpu „Google“ reikėjo pokalbių roboto, kuris galėtų
pasiūlyti vartotojams – ir greitai. Kitą mėnesį ji pristatė „Bard“, sukurtą,
remiantis savo „LaMDA“ modeliu. Pristatymas buvo nesėkmingas.
Vaizdo įraše, reklamuojančiame „Bard“, „Google“ parodė, kaip
jis atsako į klausimą apie Jameso Webbo kosminį teleskopą. Pokalbių robotas
netiksliai atsakė, kad teleskopas padarė planetos už Saulės sistemos ribų „pačius
pirmuosius vaizdus“. Dėl šios nesėkmės „Alphabet“ akcijos nukrito 8 %.
Maždaug tuo metu „Google“ įkūrėjas Sergey Brin, kuris
neseniai išėjo į pensiją, vakarėlyje kalbėjosi su „OpenAI“ tyrėju Danieliu
Selsamu, teigia, su pokalbiu susipažinę, asmenys. Selsamas jo paklausė, kodėl
jis nedirba visą darbo dieną su dirbtiniu intelektu. Ar „ChatGPT“ paleidimas
neužvaldė jo, kaip kompiuterių mokslininko, vaizduotės?
„ChatGPT“ jau buvo pakeliui į tapimą žinomu vardu dirbtinio
intelekto pokalbių robotų srityje, o „Google“ vis dar sunkiai bandė paleisti
savo produktą. Brinas nusprendė, kad Selsamas teisus, ir grįžo į darbą.
Didžiąją 2023 m. dalį „Google“ vadovai stengėsi koordinuoti
ir derinti dirbtinio intelekto kūrimo pastangas. Pasak buvusių darbuotojų,
„Brain“ ir „DeepMind“ padalinių kultūros skyrėsi: pirmasis labiau orientuotas į
tyrimus, o antrasis – į produktų kūrimą, todėl po jų sujungimo kilo įtampa.
Vis dėlto „Google“ turėjo vieną didžiulį pranašumą prieš
savo didžiausią konkurentą. „OpenAI“ turėjo pritraukti lėšų iš investuotojų;
„Google“ galėjo finansuoti tyrimus ir plėtrą iš savo kelių milijardų dolerių
pelno. Tačiau „Google“ taip pat turėjo rasti būdą, kaip neleisti generatyviniam
dirbtiniam intelektui pražudyti jos auksinės žąsies – 90 % interneto paieškos
rinkos dalies, kuri yra jos reklamos verslo pagrindas.
Norėdama išsiaiškinti, kaip turėtų atrodyti dirbtinio
intelekto valdoma paieška, bendrovė pradėjo daugiakomandinį projektą pavadinimu
„Project Magi“, kuriam vadovavo Liz Reid, 2024 m. tapusi „Google“ paieškos
viceprezidente. Grupės iššūkis, kaip ji paaiškino interviu, buvo išsiaiškinti,
kaip atnaujinti paieškos sistemą, kad ji greitai pateiktų aiškų atsakymą į
klausimą, kai atsakymo nebuvo viename tinklalapyje.
„Žmonės ne tik naudoja paiešką, jie ja pasikliauja“, – sakė
ji. „Jei suklysite, išgirsite savo mamą, išgirsite savo draugą, išgirsite savo
vaiką.“
„Google“
išleido savo pirmąjį „Gemini“ modelį dar 2023 m. pabaigoje. Nors „OpenAI“ iš pradžių
„ChatGPT“ daugiausia treniravo su tekstu, „Google“ treniravo „Gemini“ su
tekstu, kodu, garsu, vaizdais ir vaizdo įrašais, tai yra viena iš priežasčių,
kodėl jo kūrimas užtruko ilgiau, teigė buvę darbuotojai.
Pirmoji
„Gemini“ versija daugeliu atžvilgių vis dar atsiliko nuo „ChatGPT“, tačiau
techniškai ambicingesnis „Google“ požiūris, laikui bėgant, atsipirko, kaip ir
ankstyvieji jos tyrimai neuroninių tinklų srityje.
„Manau, kad mes vis dar gavome naudos iš šios ilgos
istorijos“, – gruodį Stanfordo universiteto renginyje pastebėjo Brinas.
2024 m. gegužę „Google“ pristatė dirbtinio intelekto
apžvalgas – trumpas, dirbtinio intelekto generuojamas santraukas, kurios dažnai
rodomos paieškos rezultatų viršuje. Vėliau sekė didžiausias „Google“ paieškos
sistemos pertvarkymas per daugelį metų: buvo sukurtas dirbtinio intelekto
režimas – paieškos parinktis, kuri atsako į užklausas pokalbių roboto stiliaus
pokalbyje. Viduje demonstracinės versijos po demonstracinės parodė, kas
įmanoma, bet ir kaip sunku perprogramuoti paiešką, kad ji taptų panaši į
pokalbių robotą, išlaikant greitį ir kokybę, sakė Reidas.
Galiausiai, po daugelio iteracijų, pasak Reid, ji ir kiti
komandos nariai pradėjo matyti pakankamai vertės, kad galėtų ją viešai
pristatyti. „Pradėjome matyti, kad patys jos ieškome ne tik testavimui, bet ir
galvodami: „O, noriu tai naudoti“, – prisiminė Reid.
„Google“ praėjusį gegužę pristatė dirbtinio intelekto
režimą. Ji taip pat pristatė „Gemini 2.5“ – galingesnę dirbtinio intelekto
modelio versiją, tačiau ji nesukėlė tiek daug ažiotažo, kiek tikėjosi daugelis
darbuotojų. „Alphabet“ akcijų kaina, kuri krito nuo metų pradžios, vasarą
toliau krito.
Rugpjūčio mėnesį pristatytas „Nano Banana“ padidino „Google“
akcijų vertę. Josh Woodward, kuris prižiūri „Gemini“ programėlę ir „Google
Labs“ – savotišką naujų dirbtinio intelekto programų bandymų poligoną – pavadino
paleidimą „sėkmės katastrofa“. Kai žmonės visame pasaulyje pradėjo generuoti
milijonus, o vėliau milijardus vaizdų, „Google“ sunkiai sekėsi rasti pakankamai
skaičiavimo galios, kad patenkintų paklausą. Pasak jo, bendrovė naudojosi
skubiomis serverio laiko paskolomis, kad padidintų skaičiavimo pajėgumus.
Iki spalio mėnesio „Gemini“ turėjo daugiau nei 650 milijonų
vartotojų per mėnesį, palyginti su 450 milijonų liepą.
Lapkričio
mėnesį paleista „Gemini 3“ sukėlė dar vieną skaičiavimo pajėgumų kliūtį. Tai problema,
kurią „Google“ numatė jau daugiau, nei dešimtmetį, o jos sprendimas – sukurti
dirbtinio intelekto kompiuterių lustai – atrodo, kaip konkurencinis pranašumas.
Naujausias lustas, vadinamas „Ironwood“, padėjo gerokai sumažinti dirbtinio
intelekto modelių eksploatavimo išlaidas.
Šį gruodį darbuotojams išsiųstame vidiniame pranešime Pichai
pergalingai tarė: „2025 metus baigiame puikioje pozicijoje“, – rašė jis.
„Žinant, kokia buvo mūsų, kaip įmonės, padėtis vos prieš metus, neįtikėtina
matyti pažangą.“” [1]
1. How Google Got Its AI Groove Back --- Powerful new Gemini
model allowed it to catch up to OpenAI's ChatGPT. Blunt, Katherine. Wall
Street Journal, Eastern edition; New York, N.Y.. 08 Jan 2026: A1.