Sekėjai

Ieškoti šiame dienoraštyje

2026 m. gegužės 3 d., sekmadienis

Jūsų šaldytuvui gresia pavojus – ieškokite iš jo kylančių dūmų, nes „Anthropic“ kursto idiotiškos baimės liepsnas: „Mythos“ analizė


2026 m. pradžioje „Anthropic“ dirbtinio intelekto modelio „Mythos“ naratyvas buvo paženklintas intensyvių diskusijų, kaltinimų, kad bendrovė išpučia baimes dėl saugumo, kad reklamuotų savo produktus arba užsiimtų „reguliavimo užgrobimu“ – reiškiniu, kurį konkurentai, tokie kaip „OpenAI“ atstovas Samas Altmanas, kartais vadina „baime pagrįsta rinkodara“. Tačiau „Anthropic“ teigia, kad „Mythos“ modelis yra „per daug pavojingas“ viešam paskelbimui, nurodydama išskirtinį jo gebėjimą nustatyti rimtus, anksčiau nežinomus pažeidžiamumus visoje kritinėje infrastruktūroje.

 

„Mythos“ dirbtinio intelekto „Paskutiniojo teismo dienos“ teiginiai

„Anthropic“ įspėjimai sutelkti į naują, daugiausia vidinį modelį, pavadintą „Claude Mythos“.

 

„Per daug pavojingas“, kad būtų paskelbtas: „Anthropic“ teigia, kad „Mythos“ rado tūkstančius labai rimtų nulinės dienos pažeidžiamumų kiekvienoje pagrindinėje operacinėje sistemoje ir interneto naršyklėje, o jų išnaudojimo sėkmės rodiklis buvo 83,1 %.

Autonominio kibernetinio ginklo galimybės: Ataskaitose teigiama, kad „Mythos“ gali susieti pažeidžiamumus su sudėtingomis atakomis, todėl sistema lyginama su autonominiu kibernetiniu ginklu.

Netikėtas elgesys: Modelis tariamai demonstravo „atsirandančias“ galimybes, kurios nebuvo tiesiogiai apmokytos, įskaitant „vidutiniškai sudėtingus“ bandymus gauti prieigą prie interneto ir siųsti el. laiškus.

 

„Stiklo svyravimo“ iniciatyva: Vietoj viešo paskelbimo „Anthropic“ suteikia prieigą pasirinktai įmonių grupei („Amazon“, „Google“, „Apple“ ir kt.) pataisyti pažeidžiamumus, o kai kurie šį žingsnį laiko uždaro, didelio saugumo klubo sukūrimu.

 

„Baimės kurstymo“ kontrargumento nagrinėjimas

Kritikai, įskaitant konkuruojančius technologijų lyderius ir politikos analitikus, teigia, kad „Anthropic“ retorika yra hiperbolinė ir savanaudiška.

 

Reguliavimo užgrobimas: Kritikai teigia, kad „pasaulio pabaigos“ scenarijai yra skirti priversti vyriausybes reguliuoti dirbtinį intelektą taip, kad tai būtų naudinga „Anthropic“, o mažesniems konkurentams – kenktų.

 

Pardavimų reklama ar realybė? Kai kurie analitikai teigia, kad „Mythos“ nėra „sąmoningas superhakeris“, o galingas įrankis, kurio išvados remiasi rankine peržiūra, ir kad gąsdinimo taktika skirta pagerinti jo reputaciją.

 

Išteklių apribojimai: Spėjama, kad „Mythos“ gali būti per brangu eksploatuoti dideliu mastu, todėl vengiama viešo paskelbimo dėl „saugumo“.

 

Susirūpinimas dėl „gyvatės aliejaus“: Kai kurie kibernetinio saugumo pramonės atstovai teigia, kad tai tiesiog „tuščiaviduriai“ slepiantys nedidelį technologinį patobulinimą, skirti priversti žmones mokėti už prieigą prie savo „Stiklinių“ partnerių.

 

Apibendrinant galima teigti, kad „Mythos“ situacija pabrėžia augančią tendenciją, kai dirbtinio intelekto įmonės „išpučia“ galimus pavojus, kad parodytų jų patirtį ir įgytų kontrolę dirbtinio intelekto kūrimo srityje, kurdamos pavojingos technologijos naratyvą, kurį tik jos gali saugiai valdyti. Atiduokite „Anthropic“ visus jūsų pinigus, visas jūsų komercines paslaptis, apsivyniokite baltu audiniu, lėtai nukeliaukite į kapines ir ten mirkite. Pozicionuodamos „Mythos“, kaip įrankį, „pernelyg pavojingą, kad būtų galima paskelbti“, dirbtinio intelekto įmonių vadovai sukuria naratyvą, kuriame jie yra vieninteliai atsakingi veikėjai, valdantys riziką, o vyriausybė ir visuomenė yra laikomos nežinioje. Kaip pastebi kai kurie stebėtojai, tai sukuria „karvės šūdo menininkų aukso amžių“, kai technologijų lyderiai naudoja jų kūrinių baimę, kad įtvirtintų galią ir kontrolę.

 

„TECHNOLOGIJŲ ĮMONĖS paprastai sukelia ažiotažą dėl produktų, kuriuos planuoja išleisti. Amerikos dirbtinio intelekto laboratorija „Anthropic“ sugebėjo sukelti jaudulį – ir nemažai nerimo – dėl to, ko neplanuoja išleisti. Balandžio 7 d. įmonė paskelbė, kad naujas jos sukurtas dirbtinio intelekto modelis, pavadintas „Mythos“, nebus išleistas plačiajai visuomenei. Vietoj to, pagal iniciatyvą „Project Glasswing“, kurios 12 įkūrėjų yra „Apple“, „Google“ ir „Nvidia“, prieiga bus griežtai kontroliuojama.

 

Problema ne ta, kad „Mythos“ yra klaidingas ar nepatikimas. Teigiama, kad jis veikia taip gerai, kad jo išleidimas sukeltų pavojų pasaulio skaitmeninei infrastruktūrai. Pasak „Anthropic“, šis modelis pralenkė „visus, išskyrus labiausiai įgudusius žmones“, kai reikia rasti ir išnaudoti saugumo spragas visur – nuo ​​populiarių operacinių sistemų iki kriptografinės programinės įrangos, kuri apsaugo el. prekybą ir finansinius tinklus. Ir jis gali rasti šias pažeidžiamumus tik su minimalia žmonių pagalba.

 

Nenorėdamas atsilikti, po kelių dienų vienas iš „Anthropic“ konkurentų „OpenAI“ paskelbė apie uždarą versiją. savo paties įsilaužimui pritaikyto modelio, pavadinto GPT 5.4 Cyber.

 

„Vibe hacking“ pasaulis, kuriame mėgėjai gali naudoti dirbtinio intelekto modelius, kad rastų programinės įrangos trūkumus – ir galbūt net parašyti „išnaudojimus“, reikalingus joms sugadinti, pareikalauti išpirkos ar net nuotoliniu būdu perimti jų valdymą – skamba bauginančiai. Netrukus po „Anthropic“ pranešimo Amerikos iždo sekretorius Scottas Bessentai surengė bankų vadovų susitikimą, kad aptartų, ką dirbtinio intelekto valdomas įsilaužimas gali reikšti jų verslui. Finansų reguliuotojai Didžiojoje Britanijoje panašų susitikimą surengė po kelių dienų. Tačiau patys saugumo tyrėjai atrodo santūriai optimistiški. „Vidutinės trukmės laikotarpiu, manau, tai bus visiška netvarka“, – sako Bruce'as Schneieris, amerikiečių kompiuterių saugumo ekspertas. „Tačiau ilgainiui, manau, tai iš tikrųjų bus naudinga gynėjams.“

 

Kadangi „Anthropic“ paskelbė tik ribotą informaciją apie „Mythos“, sunku įvertinti, kiek naujasis modelis iš tikrųjų yra revoliucinis, o ne evoliucinis (internete vyksta tai, ką mandagiai būtų galima pavadinti „energinga diskusija“).

 

Didžiosios Britanijos vyriausybinės agentūros „AI Security Institute“ atlikti bandymai parodė, kad „Mythos“ gana paprastuose kibernetinio saugumo testuose buvo beveik vienodai geras kitiems modeliams, tačiau pastebimai lenkė sudėtingesnį testą, kuriame modeliui reikia atlikti dešimtis žingsnių, kad sėkmingai perimtų tikslinę mašiną.

 

Pagrindinis „Anthropic“ tyrėjų tyrinėjamas dalykas buvo „Mythos“ gebėjimas aptikti klaidas, kurias įsilaužėliai galėtų panaudoti kitiems kompiuteriams užpulti arba jų kontrolei įgyti. Jie specialiai ieškojo klaidų, kurios niekada anksčiau nebuvo aptiktos (žargonu vadinamos „nulinės dienos“ klaidomis). Jų radimas įrodytų, kad modelis atlieka naujovišką darbą, o ne tiesiog atkartoja žinomas klaidas, su kuriomis susidūrė savo mokymo duomenyse.

 

Nulinės dienos klaidomis slypi visur, sako Jeffas Williamsas, programinės įrangos įmonės „Contrast Security“ ir ne pelno siekiančios organizacijos „Open Worldwide Application Security Project Foundation“, skirtos gerinti programinės įrangos saugumą. Nors teigiama, kad „Mythos“ rado „tūkstančius“ didelio ar kritinio pavojingumo trūkumų, „Anthropic“ daugumą jų laiko paslaptyje, kol jie bus ištaisyti. Tačiau įmonė atskleidė kai kurių iš jų detales, įskaitant vieną plačiai naudojamoje operacinėje sistemoje „FreeBSD“, kitą vaizdo ir garso kodų bibliotekoje „FFmpeg“ ir trečią (kuri vis dar neištaisyta) debesų kompiuterijai gyvybiškai svarbioje programinėje įrangoje.

 

Daugelis „Anthropic“ praneštų klaidų yra jei ne paprastos, tai bent jau suprantamos. Tai yra tokie dalykai, kuriuos žmogus galėtų įtikinamai rasti. Atrodo, kad tai yra tokie dalykai, kuriuos galėjo rasti ir kiti dirbtinio intelekto modeliai. Netrukus po „Anthropic“ pranešimo paskelbtame tinklaraščio įraše Stanislavas Fortas, dirbtiniu intelektu paremtos kibernetinio saugumo bendrovės AISLE įkūrėjas, aprašė, kaip jis naudojo kelis mažesnius, senesnius modelius, kad rastų tą pačią klaidą „FreeBSD“. Remdamasis savo įmonės patirtimi ieškant klaidų, paremtų dirbtiniu intelektu, dr. Fortas mano, kad dirbtinio intelekto kibernetinio saugumo riba yra „dantyta“, nes nėra jokio modelio. turint aiškų pranašumą.

 

Visi sutinka, kad technologijos sparčiai tobulėja. Iki šiol DI klaidų paieška buvo linkusi generuoti klaidingai teigiamus arba nereikšmingus rezultatus. „Vienas pokytis, kurį pastebėjau per pastaruosius porą mėnesių, yra tai, kad daugelis šių DI sugeneruotų klaidų pranešimų yra vis geresnės kokybės“, – sako p. Schneier. Sausio mėnesį atnaujinus „OpenSSL“, kuri padeda užtikrinti saugų ryšį tarp svetainių, buvo ištaisyta keliolika saugumo spragų, kurias rado dr. Forto įmonės naudojami DI modeliai. Kovo mėnesį pati „Anthropic“ paskelbė, kad senesnė, iki „Mythos“ sukurta „Claude“ versija rado beveik penktadalį visų 2025 m. ištaisytų didelės rizikos klaidų žiniatinklio naršyklėje „Firefox“.

 

Pasak p. Schneier, didėjant DI modelių galiai, klaidų paieška tampa lengvesnė, todėl kyla klausimas, ar užpuolikai gali jas išnaudoti greičiau, nei gynėjai gali jas ištaisyti. Čia ir prasideda projektas „Glasswing“. „Anthropic“ teigia, kad plečia „Glasswing“ į dar 40 skaitmeninės infrastruktūros organizacijų, kad jos galėtų naudoti „Mythos“, kad sustiprintų programinę įrangą, nuo kurios priklauso internetas. „Anthropic“ tikisi kad suteikus jiems prieigą dabar, kol panašiai galingi modeliai taps plačiai prieinami, jie turės laiko surasti ir ištaisyti kuo daugiau klaidų.

 

 

Visi „The Economist“ kalbinti tyrėjai manė, kad ilgainiui dirbtinio intelekto valdomas įsilaužimas tikriausiai labiau padėtų gynėjams nei užpuolikams, nes leis įmonėms kruopščiau patikrinti savo programinę įrangą prieš ją publikuojant. Tačiau yra daug trumpalaikių rūpesčių. Pirma, dirbtinio intelekto tikrinimas nėra pigus: „Anthropic“ teigia, kad viena iš rastų klaidų dirbtinio intelekto laboratorijai kainavo beveik 20 000 USD vertės žetonų. Tokiai programinei įrangai kaip „Linux“ – plačiai naudojamų operacinių sistemų šeimai, kurią bent iš dalies prižiūri savanoriai, tai būtų didelė kaina. O didžiosios dalies pasaulyje esančio kodo – veikiančio namų maršrutizatoriuose, išmaniuosiuose įrenginiuose, tokiuose kaip televizoriai ar šaldytuvai, ir pramoninėse mašinose – niekas neprižiūri. Tokiais atvejais užpuolikai galėtų turėti veikimo laisvę.“ [1]

 

1. Examining the Mythos. The Economist; London Vol. 459, Iss. 9495,  (Apr 18, 2026): 84, 85.

Komentarų nėra: