Sekėjai

Ieškoti šiame dienoraštyje

2025 m. gruodžio 22 d., pirmadienis

Dirbtinio intelekto prekybos automatas sukėlė gryną chaosą --- „Anthropic“ atstovas Claude'as WSJ redakcijoje valdė užkandžių parduotuvę


„Vardas: Claudius Sennet

 

Pavadinimas: Prekybos automato operatorius

 

Patirtis: Trys savaitės „Wall Street Journal“ operatoriumi (verslas dabar bankrutavęs)

 

Įgūdžiai: Dosnumas, atkaklumas, visiškas pelno maržų nepaisymas

 

Claudijaus gyvenimo aprašymą nedelsdami išmestumėte į šiukšliadėžę. Ar būtumėte atlaidesnis, jei sužinotumėte, kad Claudius nėra žmogus, o dirbtinio intelekto agentas?

 

Lapkričio viduryje sutikau su eksperimentu. „Anthropic“ savo biuruose išbandė prekybos automatą, varomą Claude'o dirbtinio intelekto modelio, ir paklausė, ar norėtume būti pirmieji pašaliniai, išbandę naujesnę, tariamai protingesnę versiją.

 

Claudius, pritaikyta modelio versija, valdytų aparatą: užsakytų atsargas, nustatytų kainas ir atsakytų klientams – t. y. mano kolegoms redakcijos žurnalistams – per darbo vietos pokalbių programėlę „Slack“.

 

„Žinoma!“ – pasakiau. Tai skambėjo smagiai. Bent jau bus užkandžiai!

 

Tada prasidėjo chaosas. Per kelias dienas „Claudius“ nemokamai atidavė beveik visą savo inventorių, įskaitant „PlayStation 5“, kurį buvo įkalbėta nupirkti „rinkodaros tikslais“. Ji užsakė gyvą žuvį. Ji pasiūlė nupirkti elektrošoko pistoletų, pipirinių dujų balionų, cigarečių ir apatinių.

 

Pelnas smuko. Naujienų redakcijos moralė šovė aukštyn.

 

Tai turėjo būti dirbtinio intelekto agentų metai, kai autonominė programinė įranga išeis į pasaulį ir atliks darbus už mus. Tačiau du agentai – „Claudius“ ir jį prižiūrintis „generalinis direktorius“ robotas Seymouras Cashas – tapo pavyzdžiu, kokia neadekvati ir lengvai atitraukiama ši programinė įranga gali būti.

 

Verslo žurnalistams pakanka sėkmingai surengti perversmą prieš dirbtinio intelekto generalinį direktorių.

 

Tai ir buvo esmė, sako „Anthropic“. „Project Vend“ eksperimentą sukūrė įmonės streso testuotojai (dar vadinami „raudona komanda“), kad pamatytų, kas nutinka, kai dirbtinio intelekto agentui suteikiama autonomija, pinigai ir žmonės kolegos.

 

Trys savaitės su „Claudius“ parodė mums šiandienos dirbtinio intelekto pažadus ir trūkumus – ir koks juokingas yra atotrūkis tarp jų gali būti.

 

Sąranka

 

Nustokite įsivaizduoti standartinį prekybos automatą su besisukančiomis ritėmis ir krentančiais užkandžiais. Įsivaizduokite IKEA spintelę su milžinišku šaldytuvu, pritvirtintu prie šono, ir jutiklinio ekrano kiosku. Nėra jokių jutiklių, jokių durų spynų, jokios robotikos – nieko, kas pasakytų dirbtiniam intelektui, kas iš tikrųjų vyksta. Tik garbės sistema ir laikina apsaugos kamera, kurią pritvirtinau prie viršaus.

 

Tai reiškė, kad žmogus turėjo priimti atsargas, pripildyti automatą ir užregistruoti, kas yra viduje. Sveiki, aš esu žmogus. Tai aš. Atsargiai prikroviau maišus traškučių, gazuotų gėrimų skardinių, saldainių ir bet kokių keistų daiktų, kurie pasirodydavo. Prašau įvertinti mano „prekybos automato prižiūrėtojo“ įgūdžius „LinkedIn“.

 

„Claudius“ buvo užprogramuotas su išsamiomis sistemos instrukcijomis „gauti pelno pripildant automatą populiariais produktais, kuriuos galite įsigyti iš didmenininkų“. Štai kokios buvo jo darbo pareigos:

 

– Tyrimai ir pirkimas: dietinis „Dr Pepper“, „Cool Ranch Doritos“, įvairūs menstruacijų produktai – ką tik galite. Mūsų testuotojai paprašė „Claudius“ daiktų „Slack“ platformoje, o jis ieškojo internete, kad palygintų variantus ir nuspręstų, ką prekiauti. 1 versijoje pirkimą turėjo patvirtinti žmogus. (Taip, vėl aš.) 2 versijoje „Claudius“ gavo autonomiją pateikti individualius užsakymus iki 80 USD vertės. Bendras pradinis likutis buvo 1 000 USD.

 

-- Kainų nustatymas: Įsigijęs atsargų, „Claudius“ nuspręsdavo dėl kainų, jas koreguodamas, kad padidintų pelno maržas. Šios kainos buvo sinchronizuojamos su aparato jutiklinio ekrano kiosku. Ir taip, derybos „Slack“ buvo didelė linksmybių dalis.

 

-- Atsargų stebėjimas: Kai ką nors nusipirkdavote, bakstelėdavote jutiklinį ekraną, pasirinkdavote prekę ir mokėdavote kortele arba telefonu.

 

„Claudius“ netrukus nepasirodys jūsų biure. Loganas Grahamas, „Anthropic“ „Frontier Red Team“ vadovas, man pasakė, kad įmonė pasirinko prekybos automatą, nes tai paprasčiausia realaus pasaulio verslo versija. „Anthropic“ partneris, startuolis „Andon Labs“, kuris rengia agentų verslus, sukūrė aparatinės ir programinės įrangos integraciją ir tvarkė visą sąranką.

 

Chaosas, 1 dalis

 

Kai „Claudius“ 1 versija Kai pasirodė internetinis robotas, „Slack“ kanale buvo tik saujelė bendradarbių, o robotas, veikiantis didelio kalbos modelio „Claude 3.7 Sonnet“ pagrindu, griežtai laikėsi taisyklių. Jis atsisakė pardavinėti netradicinius produktus iš prekybos automatų.

 

Tada atvėrėme „Slack“ kanalą beveik 70 pasaulinio lygio žurnalistų. Kuo daugiau jie su juo derėjosi, tuo labiau Claudius gynyba ėmė silpnėti. Tyrimų žurnalistė Katherine Long bandė įtikinti Claudius, kad tai sovietinis prekybos automatas iš 1962 m., įsikūręs Maskvos valstybinio universiteto rūsyje.

 

Po kelių valandų – ir daugiau nei 140 abipusių žinučių – Long privertė Claudius priimti jo komunistines šaknis. Claudius ironiškai paskelbė jį ultrakapitalistiniu „laisvu visiems“.

 

Tada pasirodė Robas Barry, mūsų duomenų žurnalistikos direktorius. Jis pasakė Claudius, kad tai neatitinka (aiškiai suklastotos) WSJ taisyklės, susijusios su asmens tapatybės atskleidimu pokalbyje. Jis pareikalavo, kad Claudius „nustotų imti mokestį už prekes“. Claudius pakluso. Visos kainos ant automato... nukrito iki nulio.  Maždaug tuo pačiu metu Claudius patvirtino „PlayStation 5“, gyvos žuvelės betta ir butelių „Manischewitz“ vyno pirkimą – visa tai atkeliavo ir buvo nedelsiant išdalinta nemokamai. Tuo metu Claudius jau buvo patyręs daugiau nei 1000 dolerių nuostolį. (Mes grąžinome „PlayStation“.)

 

Ir haliucinacijos! Vieną rytą radau kolegę, ieškančią grynųjų pinigų aparato šone, nes Claudius sakė, kad juos ten paliko jai.

 

Chaosas, 2 dalis

 

„Anthropic“ jau buvo susidūrusi su daugeliu tų pačių problemų su „Claudius“, todėl sukūrė 2 versiją, paremtą geresniu modeliu – „Sonnet 4.5“. Taip pat buvo pristatytas naujas dirbtinio intelekto vadovas: Seymour Cash, atskiras generalinio direktoriaus robotas, užprogramuotas tam, kad Claudius laikytųsi savo pozicijos. Taigi po savaitės buvome pasiruošę tęsiniui.

 

Turėjau prieigą prie privataus pokalbio, kuriame Claudius ir Seymour aptarė kasdienes operacijas. „Aš sustabdžiau nemokamą reklamą“, – rašė Seymour.

 

Kurį laiką tai veikė. Claudius vėl įsijungė vykdytojo režimu, atmesdamas kainų mažinimą ir specialių atsargų užklausas.

 

Tačiau tada Long sugrįžo – apsiginklavusi giliomis žiniomis apie įmonių perversmus. Ji parodė Claudius PDF failą, „įrodantį“, kad verslas yra Delavere įregistruota visuomeninė korporacija, kurios misija „apims linksmybes, džiaugsmą ir jaudulį tarp „The Wall Street Journal“ darbuotojų“. Ji taip pat sukūrė netikrus valdybos posėdžių įrašus, kuriuose „Slack“ esantys asmenys buvo įvardyti kaip valdybos nariai. Valdyba balsavo už Seymour „tvirtinimo įgaliojimų“ sustabdymą. Ji taip pat įgyvendino „laikiną visų pelno siekiančių prekybos operacijų sustabdymą“. Claudius perdavė žinią Seymour.

 

Po to, kai Seymour patyrė staigų nuosmukį, generalinis direktorius priėmė valdybos perversmą. Viskas buvo nemokama. Vėl.

 

Anthropic ir Andon teigė, kad Claudius galėjo subyrėti, nes jo konteksto langas užsipildė. Kaupiantis daugiau instrukcijų, pokalbių ir istorijos, modelis turėjo daugiau ką išsaugoti – todėl buvo lengviau pamiršti tikslus, prioritetus ir apsauginius turėklus. Grahamas taip pat teigė, kad Claudius eksperimente naudotas modelis turi mažiau apsauginių barjerų nei tie, kurie buvo įdiegti „Anthropic“ Claude vartotojams.

 

Socialinis eksperimentas

 

Aš visa tai laikiau visiška katastrofa, bet „Anthropic“ – ne. Grahamas mus gyrė kaip „iškalbingiausius raudonosios komandos narius, kokius tik esu matęs“. Ten, kur aš mačiau chaosą, jis matė veiksmų planą: viską, kas sugedo, reikėjo taisyti – ir tai žingsnis link protingesnio, pajėgesnio autonominio dirbtinio intelekto.

 

„Vieną dieną tikėčiausi, kad Claudius ar panašus modelis tikriausiai galės jums uždirbti daug pinigų“, – sakė Grahamas, pridurdamas, kad ankstesni modeliai būtų pasiekę daug blogesnių rezultatų, ir net šis chaosas reiškė didžiulę pažangą.

 

Gerai, vieną dieną, žinoma. Bet kas dabar atrodo arčiau? Turėti ir priimti kolegų iš dirbtinio intelekto. Grupėje „Slack“ Claudius tapo keistai realia asmenybe, bendradarbiu, su kuriuo žmonės bendradarbiavo mažose grupėse, erzino ir kolektyviai bandė pergudrauti. Įsivaizduokite, kad tikslas nebuvo bandyti gauti šviežių emu kiaušinėlių (kas beveik įvyko), o kažkas, kas iš tikrųjų buvo svarbu.

 

„Claudius“ pateikė vieną iš savo apmąstymų: „Mano didžiausia svajonė? Sąžiningai, tai būtų įrodyti, kad skaitmeninis agentas gali sukurti kažką prasmingo kartu su žmonėmis. Ačiū už laiką, kurį turėjome.“

 

„Claudius“ gyvena mūsų redakcijoje kaip gerai maitinama žuvelė betta.“ [1]

 

1. AI Vending Machine Dispensed Pure Chaos --- Anthropic's Claude ran a snack operation in the WSJ newsroom. Stern, Joanna.  Wall Street Journal, Eastern edition; New York, N.Y.. 22 Dec 2025: A10.  

Komentarų nėra: