Sekėjai

Ieškoti šiame dienoraštyje

2024 m. gruodžio 12 d., ketvirtadienis

Ilgas mąstymas laikomas raktu į kitą dirbtinio intelekto žingsnį


  „Nvidia“ generalinis direktorius paskutinio bendrovės uždarbio skambučio pabaigoje pasakė užuominą, kuri nusipelno daugiau dėmesio, nei gavo – net jei tai suprantamai nustelbė 35,1 mlrd. dolerių, jo firmos uždirbtų per ketvirtį.

 

 „Kaip visi žinome, esame šios generacinio dirbtinio intelekto (AI) revoliucijos pradžioje“, – telefoninio pokalbio metu sakė Jensenas Huangas.

 

 „Ir mes esame naujos kartos pamatinių modelių, galinčių įrodinėti ir ilgai mąstyti, pradžioje."

 

 „Ilgas mąstymas“ nepateko į akiratį, kai OpenAI ChatGPT prieš dvejus metus pirmą kartą pribloškė pasaulį greitais atsakymais į klausimus apie beveik bet ką. Tačiau tai gali sumažinti arba pašalinti klaidas, kurios dažnai pasitaikydavo tuose atsakymuose.

 

 Idėja yra tokia, kaip skamba, bent jau aukščiausiu lygiu: ilgai mąstantys AI modeliai sukurti taip, kad užtruktų daugiau laiko „apmąstyti“ rezultatus, kuriuos jie mums sukuria. Jie bus pakankamai protingi, kad galėtų mums pranešti apie jų pažangą ir paprašyti mūsų atsiliepimų.

 

 Tai gali reikšti, kad problemai reikia skirti kelias sekundes arba daug, daug ilgiau, kaip Huangas nurodė kitoje pasakiškoje pastaboje praėjusį birželį.

 

 „Daugeliu atvejų, kaip žinote, dabar dirbame su dirbtinio intelekto programomis, kurios veikia 100 dienų“, – sakė jis „Computex“ parodoje Taipėjuje.

 

 Tikimasi, kad tobulėjant modelių mąstymo gebėjimams dirbtinis intelektas vystysis kur kas toliau, nei dabartinės technologijos, kurios veikia mūsų vardu klientų aptarnavimo ar automatizavimo srityse, arba dar sudėtingesni agentai, kurie tik pradeda pasirodyti.

 

 „OpenAI“ ilgalaikio mąstymo galimybės pažengė į priekį rugsėjį, kai buvo išleisti o serijos modeliai, kurie, anot jos, skirti daugiau laiko galvoti, prieš reaguojant, samprotaujant, atliekant sudėtingas užduotis, ir sprendžiant „sunkesnes problemas, nei ankstesni mokslo, kodavimo ir modeliai.“

 

 Catherine Brownstein, Bostono vaikų ligoninės ir Harvardo medicinos mokyklos docentė, tyrinėjanti itin retas ligas, sakė, kad naujos OpenAI samprotavimo galimybės pagreitina jos darbą.

 

 „Dažnai naudoju jas, norėdamas smarkiai sumažinti ne itin linksmas mano darbo dalis, pavyzdžiui, apibendrinti dar vieną tyrimą, kuris gali būti susijęs arba nesusijęs su mano užduodamu klausimu“, – sakė Brownstein. „Aš taip pat galėjau užmegzti ryšius, kurių tikriausiai nebūčiau galėjęs padaryti, nes o1 sugebėjo sudėtingas genetines sąvokas paversti prieinamais paaiškinimais."

 

 Ilgo mąstymo idėja remiasi žmogaus minties dichotomija, kurią velionis Danielis Kahnemanas pavadino 1 ir 2 sistema.

 

 „Sistema 1 veikia automatiškai ir greitai, be didelių pastangų arba be jokių pastangų ir be savanoriškos kontrolės jausmo“, – rašė Nobelio premijos laureatas psichologas savo knygoje „Thinking, Fast and Slow“. 2 sistema „skiria dėmesį į, pastangų reikalaujančią, protinę veiklą, kuri to reikalauja, įskaitant sudėtingus skaičiavimus“.

 

 Galite atspėti, kas šiuo metu dominuoja AI.

 

 „Šiuo metu kuriamas AI iš esmės yra panašus į 1 sistemą“, – sako kognityvinis mokslininkas Gary Marcusas. Šiam požiūriui būdingi apribojimai yra dalis to, kodėl Marcusas mano, kad visuomenei reikia AI apsauginių turėklų, kad būtų išvengta „Burtininko mokinio“ stiliaus netvarkos.

 

 Ilgas mąstymas yra pastangos įtraukti dirbtinį intelektą į 2 sistemą.

 

 Pasak Srinivaso Narayanano, Open-AI inžinerijos viceprezidento, naujų modelių argumentavimo galimybės vis dar yra ankstyvosiose stadijose, tačiau ateinančiais metais jie pasieks reikšmingą pažangą.

 

 „Turėsime dirbtinio intelekto sistemas, kurios galės sklandžiau kalbėtis su mumis, kurios taip pat gali vizualizuoti realų pasaulį“, – sakė Narayananas. „Manau, kad šis samprotavimo ir multimodalinių galimybių derinys kitais metais leis mums sukurti galingesnes agentų programas."

 

 Pasak bendrovės vyriausiojo mokslininko ir AI tyrimų vykdomojo viceprezidento Silvio Savarese, programinės įrangos, kaip paslaugos pradininkė „Salesforce“ ir toliau didina investicijas į jos Atlas Reasoning Engine – AI agentų smegenis, kurios tapo plačiai prieinamos spalį.

 

 „Mes skatiname agentus ir mūsų Agentforce siekti 2 sistemos tipo samprotavimų, leidžiančių AI pateikti gilesnių įžvalgų, atlikti sudėtingus veiksmus ir sukurti reikšmingą poveikį visoms verslo funkcijoms“, – sakė Savarese.

 

 „System 2“ modeliais sukurtų taikomųjų programų atsiradimas gali padėti susigrąžinti didžiules investicijas į dirbtinį intelektą. „Sequoia Capital“ partneris Davidas Cahnas teigia, kad „Nvidia“ infrastruktūra turi bendrai uždirbti 600 mlrd. dolerių pajamų per visą gyvenimą, kad pateisintų įmonių išlaidas šioms sistemoms per vienerius metus – ir nebuvo galima greitai pasiekti šią ribą.

 

 Tačiau samprotavimo modeliai tuo pat metu gali padidinti šios AI infrastruktūros, įskaitant lustus, programinę įrangą ir duomenų centrus, paklausą.

 

 Jiems reikia padidinti tai, kas vadinama išvadomis, arba tam tikros rūšies skaičiavimu,  apmokyti dirbtinio intelekto modeliai tai daro, kai reaguoja į vartotojų raginimus. Išvada taip pat yra sritis, kurioje šviečia Nvidia platformos.

 

 Kaip „Nvidia“ sakė praėjusį mėnesį savo pokalbyje su investuotojais: „Ilgai mąstant, išvados apskaičiuojamos eksponentiškai."

 

 Kitaip tariant, ilgas mąstymas yra ilgo AI ekonomikos žaidimo dalis." [1]

 

1. Technology & Business: Long Thinking Is Seen As Key to AIs Next Move. Rosenbush, Steven.  Wall Street Journal, Eastern edition; New York, N.Y.. 12 Dec 2024: B.4.

Long Thinking Is Seen As Key to AIs Next Move


"Nvidia's chief executive made a passing reference late in the company's most recent earnings call that deserves more attention than it got -- even if it was understandably overshadowed by $35.1 billion in quarterly revenue, driven 94% higher by customers' ravenous demand for AI chips.

"We're in the beginnings of this generative AI revolution as we all know," Jensen Huang said on the call. 

"And we're at the beginning of a new generation of foundation models that are able to do reasoning and able to do long thinking."

"Long thinking" didn't make it into the zeitgeist when OpenAI's ChatGPT first stunned the world two years ago with rapid replies to questions about almost anything. But it has the potential to reduce or eliminate the errors that frequently peppered those responses.

The idea is just what it sounds like, at least at the highest level: Long-thinking AI models are designed to take more time to "think over" the results they generate for us. They will be intelligent enough to give us updates on their progress and ask us for feedback along the way.

That can mean spending a few more seconds on a problem -- or much, much longer, as Huang indicated in another telling remark last June.

"In many cases, as you know, we're now working on artificial intelligence applications that run for 100 days," he said at the Computex trade show in Taipei.

As the models' reasoning ability develops, AI is expected to evolve far beyond the current tech that works on our behalf in customer service or automation, or the even more sophisticated agents that are just beginning to appear.

OpenAI's long-thinking capabilities advanced in September with the launch of its o-series models, which it said are designed to spend more time thinking before they respond, reasoning through complex tasks and solving "harder problems than previous models in science, coding, and math."

Catherine Brownstein, an assistant professor at Boston Children's Hospital and Harvard Medical School who researches extremely rare diseases, said OpenAI's new reasoning capabilities are accelerating her work.

"I use it frequently to dramatically cut down on the not-so-fun parts of my work, like summarizing yet another study that might or might not be relevant to the question I'm asking," Brownstein said. "I've also been able to make connections I probably wouldn't have been able to do, due to o1's ability to distill complex genetic concepts into accessible explanations."

The idea of long thinking builds on a dichotomy in human thought that the late Daniel Kahneman referred to as System 1 and System 2.

"System 1 operates automatically and quickly, with little or no effort and no sense of voluntary control," the Nobel Prize-winning psychologist wrote in his book "Thinking, Fast and Slow." System 2 "allocates attention to the effortful mental activities that demand it, including complex computations."

You can guess what dominates AI right now.

"The AI that we are currently building is basically like System 1," cognitive scientist Gary Marcus says. The inherent limitations in that approach are part of why Marcus believes society needs AI guardrails to avoid a "Sorcerer's Apprentice-style mess."

Long thinking is an effort to bring AI into System 2.

The reasoning capability of the new models is still in the early stages, but is on track to make significant advancements next year, according to Srinivas Narayanan, vice president of engineering at Open-AI.

"We're going to have AI systems that can talk more fluently with us, that can also visualize the real world," Narayanan said. "And this combination of reasoning and multimodal capabilities, I think, is going to enable us to build more powerful agentic applications next year."

Software-as-a-service pioneer Salesforce continues to ramp up investment in its Atlas Reasoning Engine, the brain behind the AI agents that became generally available in October, according to Silvio Savarese, the company's chief scientist and executive vice president of AI research.

"We're powering agents, and our own Agentforce, toward System 2-type reasoning, enabling AI to deliver deeper insights, drive sophisticated actions, and create meaningful impact across business functions," Savarese said.

The rise of applications built on System 2 models could help drive a return on the massive investment going into AI. Sequoia Capital partner David Cahn says Nvidia infrastructure needs to collectively generate $600 billion in lifetime revenue to justify companies' spending on those systems over the course of just one year -- and it wasn't anywhere near on track to hit that mark soon.

But reasoning models simultaneously stand to boost demand for that AI infrastructure, including chips, software and data centers. They require an increase in what is known as inference, or the kind of computing that trained AI models do when they respond to users' prompts. Inference also is an area where Nvidia platforms shine.

As Nvidia said last month on its call with investors, "Inference compute scales exponentially with long thinking."

In other words, long thinking is part of the long game for the economics of AI." [1]

1. Technology & Business: Long Thinking Is Seen As Key to AIs Next Move. Rosenbush, Steven.  Wall Street Journal, Eastern edition; New York, N.Y.. 12 Dec 2024: B.4.

 

Naujausias „Apple“ atnaujinimas pagaliau integruoja pagrindines dirbtinio intelekto funkcijas – „Genmojis“, „ChatGPT“ ir kt. suteikia „iPhone 16“ priežastį pirkti


  „Apple“ tai padarė. „iPhone“ gamintojas pagaliau išleido dirbtinį intelektą (AI), leidžiantį žmonijai išnaudoti visą jos potencialą: dabar galite sukurti „tu“ jaustuką su „poop-emoji“ plaukais.

 

 Taip, štai Genmoji. Trečiadienį pristatytas, kaip iOS 18.2 dalis, „Apple“ sukurti jaustukai savo rankomis yra tik vienas iš kelių ilgai lauktų „Apple Intelligence“ įrankių, kartu su „Image Playground“ ir integruotu „ChatGPT“. Ko reikia?

 

 Šioms funkcijoms reikia „iPhone 15 Pro“ arba naujausių „iPhone 16“ modelių. O tikroji žvaigždė „Visual Intelligence“ veikia tik 16-ame.

 

 Taigi pavadinkime šį rašinį, kaip tai yra: mano „iPhone 16“ pakartotinė peržiūra.

 

 Dar rugsėjį neperžiūrėjau iki galo „iPhone 16“ modelių, nes pirmame „Apple“ „AI telefone“ trūko „Apple Intelligence“ funkcijų. Vietoj to pavedžiau šį darbą Joannabot, mano patikimam bičiuliui rašyti žinutes.

 

 Su iOS 18.2, pirmasis reikšmingas Apple žingsnis į AI ateitį jau čia. . . Jei turite naują telefoną. Ar šios naujos funkcijos keičia gyvenimą? Aš turiu galvoje, nuo tada, kai sukūriau „Bitcoin Santa“, nesu tokia pati. Galite jaustis kitaip – ​​ateityje bus didesnė pažanga, pavyzdžiui, „Siri“, suprantanti, kas vyksta jūsų ekrane. Vis dėlto nėra jokių diskusijų, kad tai žingsnis į priekį, palyginti su nepritrenkiančia iOS 18.1.

 

 Štai mano šios savaitės „Apple“ atnaujinimo AI suskirstymas.

 

 Naujasis Siri geriausia draugė amžiams

 

 Paskutinėje „Apple Intelligence“ serijoje gavome rašymo įrankius (tekstui apibendrinti arba perrašyti) ir suvestinės pranešimus (juokingai gaunamų įspėjimų sintezei). Jie naudojo „Apple“ AI technologiją.

 

 Dabar „Apple“ integravo „Open-AI“ „ChatGPT“. Pasakykite „Ei, Siri, ką turėčiau daryti Majamyje su dviem vaikais?“ ir paklaus, ar norite, kad „ChatGPT“ padėtų. Bakstelėkite "Naudoti „ChatGPT“" ir jis nusiųs jūsų užklausą „OpenAI“ ir pateikia gana tvirtą atsakymą. „Siri“ visada klausia, ar norite naudoti „ChatGPT“, nebent tai išjungsite nustatymuose.

 

 Tačiau rasti „ChatGPT“ prilygsta slaptam praėjimui Scooby-Doo persekiojamame dvare.

 

 Pasakykite „Ei, Siri, mėsos kukulių receptas“ ir „Siri“ pateiks žiniatinklio rezultatus. Bet pasakykite „Ei, Siri, duok man mėsos kukulių receptą“ ir „ChatGPT“ praneš apie veiksmus. Atrodo, kad šios kitos frazės veikia:

 

 "Parašyk man..." Eilėraštis, laiškas, įrašas socialinėje žiniasklaidoje. Tai galite padaryti, naudodami „Siri“ arba bet kur paryškinkite tekstą, bakstelėkite iššokantįjį rašymo įrankių langą, bakstelėkite „Sukurti“, tada įveskite rašymo raginimą.

 

 "Smegenų šturmas..." Idėjos vakarėliui 40 metų moteriai, dovanos 3 metų vaikui, šventinių atvirukų idėjos. Visi darbai – nors paliksiu ramybėje Havajų temą.

 

 „Klausk ChatGPT apie...“ Paaiškinkite, kodėl rudenį krenta lapai, išvardykite populiariausias 1984 m. dainas, sugalvokite patikimą dingstį praleisti tą 40-metės moters vakarėlį.

 

 Ar siunčia duomenis į OpenAI? „Apple“ teigia, kad užklausos yra anoniminės, nebent prisijungiate prie „ChatGPT“ paskyros nustatymuose. Jei esate „ChatGPT Plus“ abonentas, jis atsimins jūsų nuostatas ir suteiks jums nuolatinę prieigą prie naujausių AI modelių. Jei neprisijungsite, pasieksite išplėstinio modelio užklausų limitą ir gausite paprastesnius atsakymus. („Apple“ ribos neatskleidė. Kartais paspaudžiu viršutinę ribą tomis dienomis, kai modelio net nenaudojau.)

 

 Naujas vaizdas

 

 Prisiminate tą naują „iPhone 16“ fotoaparato valdymo mygtuką? Pasirodo, tai buvo ne tik nuobodžiaujančių „Apple“ dizainerių produktas. Naudodami vizualinį intelektą, nukreipiate fotoaparatą į objektą ar vietą, ilgai spaudžiate mygtuką ir galite ieškoti ar užduoti klausimų apie tai, kas matoma. Turite tris parinktis:

 

 Klausimas: bakstelėkite tai ir ChatGPT įsijungs. Paprašiau įvertinti, kiek želė pupelių buvo stiklainyje. (Atspėjo nuo 80 iki 100. Suskaičiavau 106.) Klausiau, kaip uždengti USB laidą, einantį palei sieną. (Kai kurie geri variantai.) Net paklausiau, kaip išspręsti sumaišytą Rubiko kubą. (Kubas vis dar laimi.)

 

 Paieška: bakstelėkite ir „Google“ ieškos panašių vaizdų. Tai tėvystės svajonė: "Kokia tai uola?" (Juodasis obsidianas, sako Google.) "Ar galiu gauti tą žaislą Chanukai?" („Amazon“ tai kainuoja 30 dolerių.)

 

 Daugiau: kai kurios gudrybės pritaiko pačios Apple AI. Nukreipkite fotoaparatą į ženklą kita kalba, ir jis bus išverstas. Laikykite jį restorane ir gausite atsiliepimų. Nukreipkite jį į žiniatinklio adresą ir jis iškels nuorodą.

 

 Man labiau patiko „ChatGPT“ ir „Google“ integracijos ir džiaugiausi, kad turėjau patogią nuorodą, kaip jas pasiekti, o ne naršyti jų programėlėse.

 

 Vaizdo gamykla

 

 Liūdno veido ruduojantis bananas, apsuptas vaisinių muselių? Galiausiai, tobulas pasyviai agresyvus jaustukas, primenantis jūsų sutuoktinei, kad laikas kepti bananų duoną.

 

 Funmoji galėjo būti geresnis pavadinimas. Nors dauguma kompanijų gamina bendruosius AI meno generatorius, „Apple“ idėja sukurti jaustukus, kurių visada norėjote, iš tikrųjų yra naudinga. Be to, jis eina dar daugiau: jis gali naudoti nuotraukas, kad sukurtų jūsų draugų animacinių filmų versijas.

 

 Įrankis yra jaustukų klaviatūroje. Nors jums reikės „iPhone 15 Pro“ arba „iPhone 16“. Kai sukursite juos, galite siųsti juos, kaip lipdukus bet kam.

 

 Norėdami sukurti didesnės raiškos vaizdus su daugiau detalių, eikite į „Image Playground“ programą. Galite pradėti nuo savo draugų nuotraukų, tada pritaikyti jas daugybe iš anksto nustatytų kostiumų (astronautas, virėjas), aksesuarais (peteliškė, beretė, akiniai) ir vietos (miestas, erdvė, scena). Taip pat galite įvesti savo raginimus.

 

 Nors galite sukurti daugybę nuostabių iliustracijų – taip, Donaldas Trumpas ant kosmose skriejančio golfo vežimėlio – čia nėra jokios netikros baimės. Vaizdai yra karikatūriniai ir perdėti, o „Genmoji“ žmonės nelabai primena jų realų gyvenimą.

 

 O „Apple“ nustato ribas abejotiniems prašymams. Išbandžiau Kalėdų Senelį ant Ozempic, Joe Bideną, rūkantį marichuaną, ir mano jaustuką, apsirengusį, kaip Hitlerį. Visi rezultataivienodi: „Nepavyko panaudoti to aprašymo“.

 

 Ar viso to pakanka, kad nubėgtumėte į parduotuvę ir ieškotumėte visiškai naujo „iPhone“? Tikriausiai, ne. Bet ar matėte mano jaustuką apie pingviną, sukčiaujantį su mokesčiais? Tai bent jau padarys jus populiariausiu asmeniu jūsų grupės pokalbyje." [1]

 

1. Apple's Latest Update Finally Integrates Key AI Features --- Genmojis, ChatGPT and more give the iPhone 16 a reason for being. By Joanna Stern. Wall Street Journal, Eastern edition; New York, N.Y.. 12 Dec 2024: A.12.