Ieškoti šiame dienoraštyje
Kiek kainuoja dirbtinio intelekto mokymasis sustiprinimo metodu?
OpenAI kompanijos 100 darbuotojų įmonė neseniai sukūrė sistemą, kuri galėjo nugalėti geriausius pasaulio žaidėjus vaizdo žaidime „Dota 2.“ Prieš kelerius metus toks dalykas neatrodė galimas.
„Dota 2“ yra žaidimas, kuriame kiekvienas žaidėjas kartu su keliais kitais žaidėjais turi naršyti sudėtingoje, trimatėje aplinkoje, koordinuodamas kruopščią atakos ir gynybos pusiausvyrą. Kitaip tariant, tai reikalauja senamadiško komandinio darbo, ir tai yra sunku mašinoms įvaldyti.
OpenAI įsisavino "Dota 2" dėka matematikos metodo, vadinamo sustiprinimo mokymu, kuris leidžia mašinoms mokytis užduočių ekstremalių bandymų ir klaidų dėka. Žaisdami žaidimą vėl ir vėl, automatizuotos programinės įrangos dalys, vadinamos agentais, sužinojo, kurios strategijos yra sėkmingos.
Agentai šiuos įgūdžius išmoko per kelis mėnesius, stengdamiesi žaisti daugiau nei 45 000 metų. Tam reikėjo milžiniškos skaičiavimo galios. „OpenAI“ išleido milijonus dolerių nuomos prieigai prie dešimčių tūkstančių kompiuterinių mikroschemų, esančių debesų kompiuterijos paslaugose, kurias valdo „Google“ ir „Amazon“."
Komentarų nėra:
Rašyti komentarą