Sekėjai

Ieškoti šiame dienoraštyje

2023 m. spalio 18 d., trečiadienis

Dirbtinio intelekto agentai gali žaisti „Minecraft“. Jiems tai tik apšilimas

 

     „Mokslininkai paverčia pokalbių robotus į internetinius agentus, kurie žaidžia žaidimus, teikia užklausas svetainėse, planuoja susitikimus, kuria juostines diagramas ir daro daugiau.

 

     Plačiai naudojamas pokalbių robotas ChatGPT buvo sukurtas skaitmeniniam tekstui generuoti – nuo poezijos iki kursinių darbų iki kompiuterinių programų. Tačiau kai kompiuterių lustų kompanijos „Nvidia“ dirbtinio intelekto tyrėjų komanda susipažino su pokalbių roboto pagrindinėmis technologijomis, jie suprato, kad tai gali padaryti daug daugiau.

 

     Per kelias savaites jie išmokė jį žaisti „Minecraft“ – vienu populiariausių pasaulyje vaizdo žaidimų. Skaitmeninėje „Minecraft“ visatoje jis išmoko plaukti, rinkti augalus, medžioti kiaules, kasti auksą ir statyti namus.

 

     „Jis gali patekti į „Minecraft“ pasaulį ir tyrinėti pats, rinkti medžiagą ir įgyti vis geresnių įgūdžių“, – sakė „Nvidia“ vyresnysis mokslo darbuotojas Linxi Fanas, žinomas kaip Džimas.

 

     Šis projektas buvo ankstyvas ženklas, kad pirmaujantys pasaulyje dirbtinio intelekto tyrinėtojai pokalbių robotus paverčia naujos rūšies autonomine sistema, vadinama A.I. agentas. Šie agentai gali ne tik kalbėtis. Jie gali naudoti programinės įrangos programas, svetaines ir kitus internetinius įrankius, įskaitant skaičiuokles, internetinius kalendorius, kelionių svetaines ir kt.

 

     Laikui bėgant, daugelis tyrinėtojų teigia, kad A.I. agentai galėtų tapti daug sudėtingesni ir galėtų pakeisti biuro darbuotojus, automatizuodami beveik bet kokį baltųjų apykaklių darbą.

 

     „Tai didžiulė komercinė galimybė, potencialiai trilijonai dolerių“, – sakė Jeffas Clune'as, kompiuterių mokslų profesorius iš Britų Kolumbijos universiteto, anksčiau dirbęs su tokio tipo technologijomis, kaip tyrėjas OpenAI, San Francisko startuolio, kuris pastatė. ChatGPT. „Tai turi didžiulį pranašumą ir didžiulius padarinius visuomenei“.

 

     „Nvidia“ agentas žaidžia žaidimą. Panašūs agentai gali planuoti susitikimus, redaguoti failus, analizuoti duomenis ir kurti įvairiaspalves juostines diagramas. Idėja yra ta, kad šios automatizuotos sistemos galiausiai veiks, kaip asmeniniai asistentai, galintys atlikti daugybę užduočių internete.

 

     Šiandienos agentai yra riboti, ir jie negali tiksliai organizuoti jūsų gyvenimo. „ChatGPT“ kelionių svetainėje „Expedia“ gali ieškoti skrydžių į Niujorką, tačiau rezervaciją vis tiek turite užsisakyti patys.

 

     Ši technologija, tyrėjams ją tobulinant, gali padidinti biuro darbuotojų ir vartotojų efektyvumą. Tai taip pat gali pakeisti vaizdo žaidimų pobūdį, suteikdama naują robotų bangą, kurią žaidėjai gali žaisti kartu ir su jais kalbėtis.

 

     GPT-4, technologija, kuria grindžiamas ChatGPT, yra tai, ką mokslininkai vadina didelės kalbos modeliu. Tai A.I. sistema, kuri mokosi įgūdžių, analizuodama didžiulius duomenų kiekius.

 

     Per pastaruosius kelis mėnesius ši technologija sužavėjo šimtus milijonų žmonių tuo, kaip ji generuoja el. laiškus, rašo kalbas ir pranešimus beveik bet kokia tema. Tačiau svarbiausias jos įgūdis gali būti gebėjimas rašyti kompiuterines programas.

 

     Jis gali akimirksniu sukurti programą, kuri nupiešia vienaragį arba numeta skaitmeninį sniegą ant nešiojamojo kompiuterio ekrano. Profesionalūs programinės įrangos kūrėjai gali paprašyti kodo, kurį galėtų sulankstyti į didesnes programas, įskaitant viską nuo socialinės žiniasklaidos programų iki paieškos sistemų. Tačiau tai tik dalis to, ką ši technologija gali padaryti. Jis taip pat gali generuoti kompiuterio kodą, kuris paliečia kitas programinės įrangos programas ir svetaines.

 

     Taip daktaras Fanas ir kiti „Nvidia“ tyrėjai išmokė GPT-4 žaisti „Minecraft“. „Svarbiausias žodis čia yra kodas“, – sakė daktaras Fanas. „Kodas gali imtis veiksmų“.

 

     Žmonės naudoja programinės įrangos programas ir svetaines liesdami mygtukus, meniu ir kitus grafinius valdiklius. A.I. agentai naudoja programas ir svetaines, pasiekdami savo programų programavimo sąsajas arba A.P.I.s – pagrindinį programinės įrangos kodą, leidžiantį susisiekti su kitomis internetinėmis paslaugomis.

 

     Pavyzdžiui, jei paprašysite agento įkelti vaizdo įrašą į internetą, jis gali sugeneruoti kodą, kuris vadinamas A.P.I.  „YouTube“. „A.P.I. yra tik tekstas, naudojamas kalbėtis su mašina“, – sakė tyrėjas Silenas Naihinas, padedantis valdyti nepriklausomą A.I. agento projektas, AutoGPT.

 

     Teoriškai pokalbių robotas gali parašyti kodą prieigai prie bet kurio A.P.I. internete. Tačiau šiandieniniai pokalbių robotai dar nėra pakankamai įgudę atlikti daugiau, nei paprastas užduotis. Ir net jei taip būtų, leisti jiems laisvai naršyti internete būtų didžiulė rizika saugumui. Taigi įmonės pradeda nuo mažo.

 

     Praėjus keliems mėnesiams po to, kai „OpenAI“ pristatė „ChatGPT“, jis tyliai išleido būdą, kaip pokalbių robotas gali padaryti daugiau, nei kurti tekstą. Įdiegę įvairius papildinius – programinę įrangą, kuri praplečia roboto galimybes – galite paprašyti jo ieškoti galimų skrydžių kelionių svetainėse, pvz., „Expedia“, paimti jūsų gimtojo miesto žemėlapį iš „Google“ žemės ar net pakeisti skaičiuoklę, kurioje išsamiai aprašomos jūsų metinės išlaidos į įvairiaspalvę juostinę diagramą.

 

     Įrengtas papildinys, vadinamas kodo interpretatoriumi, „ChatGPT“ galėjo ne tik įrašyti kodą, bet ir jį paleisti. Tai leido technologijai akimirksniu atlikti užduotis, kurių ji negalėjo anksčiau, įskaitant redagavimą skaičiuoti skaičiuokles ir nejudančius vaizdus paversti video įrašais. „Google“, „Microsoft“ ir kitos įmonės tiria panašias technologijas.

 

     „Tai yra projektai, kuriuose iš esmės numatome A.I. darbą su kitais A.I. jūsų vardu“, – sakė „Microsoft“ viceprezidentė Ashley Llorens.

 

     Nepriklausomi projektai, tokie kaip AutoGPT, bando žengti kelis žingsnius toliau. Idėja yra suteikti sistemai tokius tikslus, kaip „sukurti įmonę“ arba „uždirbti pinigų“. Tada jis ieškos būdų, kaip pasiekti šį tikslą, užduodamas sau klausimus ir prisijungdamas prie kitų interneto paslaugų.

 

     Šiandien tai neveikia taip gerai. Tokios sistemos, kaip AutoGPT paprastai įstringa begalinėse kilpose. Tačiau mokslininkai, tokie kaip daktaras Fanas, nuolat tobulina tokią technologiją, siekdami padaryti ją naudingesnę ir patikimesnę.

 

     Kiti tyrinėtojai kuria naujo tipo A.I. agentus, skirtus naudoti programinės įrangos įrankius. 2022 m. vasarą Dr. Clune'as buvo tarp OpenAI tyrėjų komandos, kuri sukūrė agentą, galintį naudoti kompiuterio programinę įrangą taip, kaip tai naudotų žmogus – pelės paspaudimu po pelės paspaudimo, klavišo paspaudimu po klavišo paspaudimo.

 

     Dr. Clune'as ir jo kolegos teikė sistemai valandų valandas internetinių vaizdo įrašų, kuriuose buvo rodomi žmonės, žaidžiantys „Minecraft“. Analizuodama, kaip žmonės naudojo pelę ir klaviatūrą, naršydami po Minecraft skaitmeninę visatą, sistema išmoko žaisti žaidimą pati.

 

     Kitos įmonės, įskaitant pradedančiąją įmonę, pavadintą „Adept“, kuria panašius agentus, kurie naudoja tokias svetaines, kaip „Wikipedia“, „Redfin“ ir „Craigslist“ bei populiarias biuro programas iš tokių įmonių, kaip „Salesforce“.

 

     Dr. Clune'as teigia, kad toks agentas ilgainiui leis dirbtiniam intelektui naudoti daug platesnį programinės įrangos programų ir svetainių spektrą. Jis sakė, kad kiekvienas turės prieigą prie skaitmeninio asistento, kuris galėtų padaryti beveik bet ką internete. Tai galėtų palengvinti gyvenimą, bet taip pat galėtų pakeisti daugybę darbų.

 

     „Jei A.I. gali padaryti viską, ką galime padaryti, tai ne tik pakeičia nuobodžias užduotis“, – sakė jis. „Tai pakeičia visas užduotis.“ [1]

 

1. 'A.I. Agents' Can Play Minecraft. They're Just Getting Warmed Up.: [Business/Financial Desk]
Metz, Cade; Weise, Karen.  New York Times, Late Edition (East Coast); New York, N.Y.. 18 Oct 2023: B.1.

 

'A.I. Agents' Can Play Minecraft. They're Just Getting Warmed Up


"Researchers are transforming chatbots into online agents that play games, query websites, schedule meetings, build bar charts and do more.

The widely used chatbot ChatGPT was designed to generate digital text, everything from poetry to term papers to computer programs. But when a team of artificial intelligence researchers at the computer chip company Nvidia got their hands on the chatbot's underlying technology, they realized it could do a lot more.

Within weeks, they taught it to play Minecraft, one of the world's most popular video games. Inside Minecraft's digital universe, it learned to swim, gather plants, hunt pigs, mine gold and build houses.

"It can go into the Minecraft world and explore by itself and collect materials by itself and get better and better at all kinds of skills," said a Nvidia senior research scientist, Linxi Fan, who is known as Jim.

The project was an early sign that the world's leading artificial intelligence researchers are transforming chatbots into a new kind of autonomous system called an A.I. agent. These agents can do more than chat. They can use software apps, websites and other online tools, including spreadsheets, online calendars, travel sites and more.

In time, many researchers say, the A.I. agents could become far more sophisticated, and could replace office workers, automating almost any white-collar job.

"This is a huge commercial opportunity, potentially trillions of dollars," said Jeff Clune, a computer science professor at the University of British Columbia who previously worked on this kind of technology as a researcher at OpenAI, the San Francisco start-up that built ChatGPT. "This has a huge upside -- and huge consequences -- for society."

Nvidia's agent plays a game. Similar agents can schedule meetings, edit files, analyze data and build multicolored bar charts. The idea is that these automated systems will eventually act as personal assistants able to handle a wide range of tasks across the internet.

Today's agents are limited, and they can't exactly organize your life. ChatGPT can search the travel site Expedia for flights to New York, but you still have to book the reservation on your own.

This technology, as researchers improve it, could make office workers and consumers more efficient. It could also change the nature of video games, providing a new wave of bots that gamers can play alongside and chat with.

GPT-4, the technology that underpins ChatGPT, is what researchers call a large language model. It is an A.I. system that learns skills by analyzing huge amounts of data.

Over the past several months, the technology has wowed hundreds of millions of people with the way it generates emails, writes speeches and riffs on almost any topic. But its most important skill may be its knack for writing computer programs.

It can instantly generate a program that draws a unicorn or drops digital snow across your laptop screen. Professional software developers can ask for code that they can fold into larger programs, including everything from social media apps to search engines. But that is only part of what this technology can do. It can also generate computer code that taps into other software apps and websites.

This is how Dr. Fan and other Nvidia researchers taught GPT-4 to play Minecraft. "The most important word here is code," Dr. Fan said. "Code can take actions."

People use software apps and websites by touching buttons, menus and other graphical widgets. A.I. agents use apps and websites by accessing their application programming interfaces, or A.P.I.s -- the underlying software code that lets them communicate with other online services.

If you ask an agent to upload a video to the internet, for instance, it could generate code that called an A.P.I. offered by YouTube. "An A.P.I. is just text used to talk to a machine," said Silen Naihin, a researcher who helps run an independent A.I. agent project, AutoGPT.

In theory, a chatbot can write code for access to any A.P.I. on the internet. But today's chatbots are not yet adept enough to do more than just simple tasks. And even if they were, letting them freely roam the internet would be an enormous security risk. So companies are starting small.

A few months after OpenAI unveiled ChatGPT, it quietly released a way for the chatbot to do more than generate text. After installing various plug-ins -- software that augments what the bot can do -- you could ask it to search travels sites like Expedia for available flights, grab a map of your hometown from Google Earth or even transform a spreadsheet detailing your yearly spending into a multicolored bar chart.

Equipped with a plug-in called code interpreter, ChatGPT could not just write code but also run it. This allowed the technology to instantly perform tasks it could not in the past, including editing spreadsheets and transforming still images into videos. Google, Microsoft and other companies are exploring similar technologies.

"These are projects where we're envisioning essentially A.I.s working with other A.I.s on your behalf," Ashley Llorens, a vice president at Microsoft, said.

Independent projects such as AutoGPT are trying to take this kind of thing several steps further. The idea is to give the system goals like "create a company" or "make some money." Then it will look for ways of reaching that goal by asking itself questions and connecting to other internet services.

Today, this does not work all that well. Systems like AutoGPT tend to get stuck in endless loops. But researchers like Dr. Fan are constantly refining this kind of technology in an effort to make it more useful and more reliable.

Other researchers are building a new kind of A.I. agent designed for using software tools. In summer 2022, Dr. Clune was among a team of OpenAI researchers who built an agent that could use computer software much as a person would -- mouse click by mouse click, keystroke by keystroke.

Dr. Clune and his colleagues fed the system hours of online videos that showed people playing Minecraft. By analyzing the way people used their mouse and keyboard to navigate through Minecraft's digital universe, the system learned to play the game on its own.

Other companies, including a start-up called Adept, are building similar agents that use websites like Wikipedia, Redfin and Craigslist and popular office apps from companies like Salesforce.

Dr. Clune argues that this kind of agent will eventually allow artificial intelligence to use a much broader range of software apps and websites. He said everyone would have access to a digital assistant that could potentially do almost anything on the internet. That could make life easier -- but it could also replace countless jobs.

"If A.I. can do anything we can do, it does not just replace the boring tasks," he said. "It replaces all the tasks."" [1]

1. 'A.I. Agents' Can Play Minecraft. They're Just Getting Warmed Up.: [Business/Financial Desk]
Metz, Cade; Weise, Karen.  New York Times, Late Edition (East Coast); New York, N.Y.. 18 Oct 2023: B.1.

 

 

Karas Artimuosiuose Rytuose meta iššūkį JAV gynybos strategijai

 

  "TEL AVIVAS – Karas tarp Hamas ir Izraelio verčia Bideno administraciją siųsti daugiau pajėgų ir karinių pajėgumų atgal į regioną, nukreipiant  JAV politiką į Artimuosius Rytus, kai jie tikėjosi sutelkti dėmesį į galimas Kinijos ir Rusijos grėsmes.

 

     Bijodama, kad konfliktas, kurį sukėlė „Hamas“ spalio 7 d. ataka prieš Izraelį, gali išplisti, Bideno administracija atkūrė dalį savo karinio pėdsako regione.

 

     Konfliktas gali priversti JAV permąstyti, kaip jos naudoja savo kariuomenę Artimuosiuose Rytuose, ir yra išbandymas, kaip Pentagonas galėtų toliau remti Ukrainą ir sutelkti dėmesį į Kiniją, kuri, Gynybos departamento teigimu, yra pagrindinis jos ilgalaikis prioritetas.

 

     Šis staigus posūkis įvyko tuo metu, kai JAV, kurios du dešimtmečius kovojo su maištininkais Artimuosiuose Rytuose ir Centrinėje Azijoje, pradėjo kovoti su nauja galios konkurencijos su Kinija ir Rusija epocha. Smurto augimas Artimuosiuose Rytuose ir intensyvios amerikiečių pastangos užkirsti kelią konflikto plitimui gali nustelbti ilgalaikes JAV pastangas sutelkti dėmesį į Indo-Ramiojo vandenyno regioną ir sustiprinti Šiaurės Atlanto sutarties organizacijos gebėjimą atgrasyti Rusiją.

 

     Prezidentas Bidenas primygtinai reikalavo, kad JAV turėtų pasaulinio masto ir karinių išteklių, kad galėtų valdyti Gazos krizę ir paremti Ukrainą.

 

     Kai kurie buvę kariniai vadai teigia, kad strateginė Artimųjų Rytų svarba reiškia, kad JAV turi išlaikyti aktyvesnį kasdienį buvimą.

 

     „Mūsų laikysena regione daro įtaką“, – sakė į pensiją išėjęs jūrų pėstininkų generolas Frankas McKenzie, 2019–2022 m. vadovavęs JAV Centrinei vadovybei. „Iranas atidžiai stebi, ką mes darome. pranešdami, kad mūsų išskirtinis dėmesys dabar yra Azijos Ramiojo vandenyno regione, mes nesuteikiame garantijų mūsų draugams regione ir suteikiame pasitikėjimo savo potencialiems priešams regione."

 

     JAV iki šiol išsiuntė dvi lėktuvnešių smogiamąsias grupes, susidedančias iš maždaug tuzino laivų ir 12 000 kariškių, perskirstant išteklius Europoje į rytinę Viduržemio jūros dalį.

 

     Pentagonas pastaraisiais metais sumažino karinio jūrų laivyno išteklius regione, perkeldamas daugiau išteklių į Azijos Ramiojo vandenyno regioną, kad kovotų su Kinijos keliamomis grėsmėmis. Panašiai Pentagonas perkėlė A-10 atakos lėktuvus ir F-15 bei F-16 reaktyvinius naikintuvus atgal į Persijos įlanką, sustiprindamas oro išteklius, kuriuos pastaraisiais metais jis rotavo regione. Gynybos departamentas taip pat ruošiasi regione dislokuoti apie 2000 karių.

 

     Konfliktui įgyvendinti naudojami ir kiti ištekliai. Izraelis iki šiol gavo kelis tūkstančius 155 mm artilerijos šovinių nuo tada, kai „Hamas“ pradėjo puolimą, pranešė gynybos pareigūnai. Tai įvyko netrukus po to, kai JAV ištuštino savo 155 mm šovinių, laikomų Izraelyje, atsargas, kad patenkintų Ukrainos paklausą dėl labai ieškomos artilerijos.

 

     Nors Baltieji rūmai teigia neturintys informacijos, kad Teheranas surengė ataką prieš Izraelį, JAV aiškiai pasakė, kad skubina į regioną lėktuvnešius ir karo lėktuvus, siekdamos atgrasyti Teheraną ir Irano remiamą Libano miliciją „Hezbollah“ nuo karo išplėtimo. „The Wall Street Journal“ pranešė, kad įvyko „Hamas“ ir Irano saugumo pareigūnų susitikimas, padedantis planuoti išpuolį.

 

     Daugelį metų eilė administracijų, tiek respublikonų, tiek demokratų, siekė sutelkti dėmesį į pastangas atremti didėjančią Kinijos įtaką ir kariuomenę, tačiau tuos planus apsunkino pirmiausia rugsėjo 11-osios teroro išpuoliai, po kurių 2010 m. Irakas ir Afganistanas, o vėliau – „Islamo valstybės“ iškilimas.

 

     Trumpo administracijos metu Pentagono nacionalinės gynybos strategija ragino Kinijos ir Rusijos atgrasymą paversti svarbiausiais JAV gynybos prioritetais. Tačiau Baltųjų rūmų užsienio politikos dėmesys buvo sutelktas į Irano branduolinės programos panaikinimą ir Teherano paramą kovotojų grupėms regione.

 

     Bideno komanda atnaujino pastangas sumažinti JAV karinį pėdsaką Artimuosiuose Rytuose ir nusprendė, kad tai gali užbaigti konfliktą Afganistane ir skirti reikšmingų išteklių bei politikos dėmesio Indo Ramiojo vandenyno regionui. Susirūpinimą dėl Pekino lėmė JAV vertinimai, kad Kinijos prezidentas Xi Jinpingas nurodė savo kariuomenei iki 2027 m. būti pasirengusiai imtis karinių veiksmų prieš Taivaną, nors Amerikos pareigūnai teigia, kad tokie veiksmai nėra neišvengiami.

 

     JAV pernai iš šio regiono išvedė daugiau, nei aštuonias „Patriot“ raketų baterijas, įskaitant iš Irako, Kuveito, Jordanijos ir Saudo Arabijos, ir juos lydinčius karius, taip pat „Terminal High Altitude Area Defense“ arba „Thaad“ sistemą iš Saudo Arabijos. Karinio jūrų laivyno ir orlaivių dislokavimas regione paprastai buvo labai kuklus, o Pentagonas tvirtino, kad krizės metu gali sugrąžinti pajėgas į Artimuosius Rytus.

 

     „Artimieji Rytai mums svarbūs dėl naftos, islamistų terorizmo ir Izraelio, ne visada tokia tvarka. " sakė Eliotas Cohenas iš Strateginių ir tarptautinių studijų centro. "Idėja, kad galime pasitraukti iš regiono, visada buvo klaidinga." [1]

 

1. World News: War in Mideast Challenges U.S. Defense Strategy. Lubold, Gordon; Youssef, Nancy A;
Gordon, Michael R.  Wall Street Journal, Eastern edition; New York, N.Y.. 18 Oct 2023: A.8.