Sekėjai

Ieškoti šiame dienoraštyje

2024 m. kovo 29 d., penktadienis

OpenAI pristato, žmogaus balsus atkuriančią, dirbtinio intelekto technologiją


     „Šis startuolis dalijasi technologija „Voice Engine“ su nedidele ankstyvųjų bandytojų grupe, bandydamas suprasti galimus pavojus.

 

     Pirma, „OpenAI“ pasiūlė įrankį, leidžiantį žmonėms kurti skaitmeninius vaizdus, tiesiog aprašant tai, ką jie nori matyti. Tada ji sukūrė panašią technologiją, kuri generavo viso judesio vaizdo įrašą, kaip kažką iš Holivudo filmo.

 

     Dabar ji pristatė technologiją, kuri gali atkurti kažkieno balsą.

 

     Aukšto lygio dirbtinio intelekto (A.I.) startuolis penktadienį pranešė, kad nedidelė įmonių grupė išbando naują „OpenAI“ sistemą „Voice Engine“, galinčią atkurti žmogaus balsą iš 15 sekundžių įrašo. Jei įkeliate savo įrašą ir teksto pastraipą, jis gali perskaityti tekstą sintetiniu balsu, kuris skamba, kaip jūsų.

 

     Tekstas nebūtinai turi būti jūsų gimtąja kalba. Pavyzdžiui, jei kalbate angliškai, jis gali atkurti jūsų balsą ispanų, prancūzų, kinų ar daugeliu kitų kalbų.

 

     OpenAI nesidalija šia technologija plačiau, nes vis dar bando suprasti galimus jos pavojus. Kaip ir vaizdo ir vaizdo generatoriai, balso generatorius gali padėti paskleisti dezinformaciją socialinėje žiniasklaidoje. Tai taip pat gali leisti nusikaltėliams apsimesti žmonėmis internete arba telefono skambučių metu.

 

     Bendrovė teigė esanti ypač susirūpinusi, kad tokios technologijos gali būti naudojamos balso autentifikatoriams, kurie kontroliuoja prieigą prie internetinės bankininkystės sąskaitų ir kitų asmeninių programų, sulaužyti.

 

     „Tai jautrus dalykas, ir svarbu tai padaryti teisingai“, – interviu sakė OpenAI produkto vadovas Jeffas Harrisas.

 

     Bendrovė tiria būdus, kaip sintetinius balsus pažymėti vandens ženklais arba pridėti valdiklius, neleidžiančius žmonėms naudoti šios technologijos politikų ar kitų žinomų veikėjų balsais.

 

     Praėjusį mėnesį OpenAI laikėsi panašaus požiūrio, kai pristatė savo vaizdo įrašų generatorių „Sora“. Ji demonstravo technologiją, bet viešai jos nepaskelbė.

 

     OpenAI yra viena iš daugelio įmonių, sukūrusių naują A.I. technologija, kuri gali greitai ir lengvai generuoti sintetinius balsus. Tarp jų yra technologijų gigantų, tokių, kaip „Google“, taip pat pradedančiųjų įmonių, tokių, kaip, Niujorke įsikūrusi, „ElevenLabs“. (The New York Times padavė į teismą OpenAI ir jos partnerę Microsoft dėl pretenzijų dėl autorių teisių pažeidimo, susijusio su tekstą generuojančiomis dirbtinio intelekto sistemomis.)

 

     Įmonės gali naudoti šias technologijas garsinėms knygoms generuoti, interneto pokalbių robotams įbalsinti ar net sukurti automatizuotą radijo stotį DJ. Nuo praėjusių metų „OpenAI“ naudojo savo technologiją, kad aprūpintų kalbančią „ChatGPT“ versiją. Ir jau seniai įmonėms siūlo daugybę balsų, kuriuos galima naudoti panašioms programoms. Visi jie buvo sukurti iš balso aktorių pateiktų klipų.

 

     Tačiau bendrovė dar nepasiūlė viešo įrankio, kuris leistų asmenims ir įmonėms atkurti balsus iš trumpo klipo, kaip tai daro Voice Engine. Gebėjimas tokiu būdu atkurti bet kokį balsą, sakė M. Harrisas, yra tai, kas daro technologiją pavojingą. Pasak jo, ši technologija gali būti ypač pavojinga rinkimų metais.

 

     Sausio mėnesį Naujojo Hampšyro gyventojai gavo automatinio skambučio pranešimus, kurie atgrasė juos nuo balsavimo valstijos pirminiuose rinkimuose balsu, kuris, greičiausiai, buvo dirbtinai sukurtas, kad skambėtų, kaip prezidentas Bidenas. Vėliau Federalinė ryšių komisija tokius skambučius uždraudė.

 

     P. Harrisas sakė, kad „OpenAI“ neketina užsidirbti pinigų iš šios technologijos. Jis sakė, kad įrankis gali būti ypač naudingas žmonėms, kurie prarado balsą dėl ligos ar nelaimingų atsitikimų.

 

     Jis pademonstravo, kaip ši technologija buvo panaudota moters balsui atkurti po to, kai smegenų vėžys jį pažeidė. Jis pasakė, kad dabar ji gali kalbėti, pateikus trumpą pristatymo, kurį kadaise buvo surengus vidurinėje mokykloje, įrašą." [1]


1. OpenAI Unveils A.I. Technology That Recreates Human Voices. Metz, Cade.  New York Times (Online)New York Times Company. Mar 29, 2024.

 

Komentarų nėra: