„Pagrindinės įmonės nerimauja dėl duomenų, kuriais grindžiamos dirbtinio intelekto (A.I.) programos, kilmės. Pramonės grupė sprendžia šį iššūkį.
Duomenys yra dirbtinio intelekto kuras. Tai taip pat yra kliūtis didelėms įmonėms, nes jos nenori visiškai pritaikyti technologijos, nežinodamos daugiau apie duomenis, naudojamus, kuriant A.I. programas.
Dabar įmonių konsorciumas sukūrė standartus, apibūdinančius duomenų kilmę, istoriją ir juridines teises. Standartai iš esmės yra ženklinimo sistema, nurodanti, kur, kada ir kaip duomenys buvo renkami ir generuojami, taip pat jų numatomas naudojimas ir apribojimai.
Ketvirtadienį paskelbtus duomenų kilmės standartus sukūrė „Data & Trust Alliance“, ne pelno siekianti grupė, susidedanti iš dviejų dešimčių didelių įmonių ir organizacijų, įskaitant „American Express“, „Humana“, IBM, „Pfizer“, UPS ir „Walmart“, taip pat keletas startuolių.
Aljanso nariai mano, kad duomenų ženklinimo sistema bus panaši į pagrindinius maisto saugos standartus, kuriems reikalinga pagrindinė informacija, pavyzdžiui, iš kur atkeliavo maistas, kas jį pagamino ir augino bei kas tvarkė maistą pakeliui į bakalėjos lentyną.
Didesnis aiškumas ir daugiau informacijos apie A.I. naudojamus duomenis modeliams, vadovų teigimu, sustiprins įmonių pasitikėjimą šia technologija. Nežinia, kaip plačiai bus naudojami siūlomi standartai, ir daug kas priklausys nuo to, kaip lengva standartus taikyti ir automatizuoti. Tačiau standartai paspartino visų svarbių technologijų, nuo elektros iki interneto, naudojimą.
„Tai žingsnis link duomenų, kaip turto, valdymo, ką šiandien stengiasi daryti visi pramonės atstovai“, – sakė UPS informacinių technologijų ir duomenų analizės prezidentas Kenas Finnerty. „Kad tai padarytumėte, turite žinoti, kur duomenys buvo sukurti, kokiomis aplinkybėmis, su kokiu numatytu tikslu ir kur juos naudoti teisėta, o kur - ne."
Apklausos rodo, kad reikia labiau pasitikėti duomenimis ir pagerinti duomenų tvarkymo efektyvumą. Vienoje įmonių vadovų apklausoje dauguma nurodė „susirūpinimą dėl duomenų kilmės“ kaip pagrindinę kliūtį A.I. įvaikinimui. Duomenų mokslininkų apklausa parodė, kad jie beveik 40 procentų laiko praleido duomenų ruošimo užduotims atlikti.
Duomenų iniciatyva daugiausia skirta verslo duomenims, kuriuos įmonės naudoja, kurdamos jų A.I. programos ar duomenys, kuriuos jie gali pasirinktinai įvesti į A.I. tokių kompanijų, kaip Google, OpenAI, Microsoft ir Anthropic sistemos. Kuo tikslesni ir patikimesni duomenys, tuo patikimesni A.I. generuojami atsakymai.
Jau daugelį metų įmonės naudoja A.I. įvairiose srityse: nuo gaminių rekomendacijų pritaikymo iki numatymo, kada reaktyviniams varikliams reikės priežiūros.
Tačiau praėjusiais metais kilęs vadinamasis generatyvinis A.I. kuris veikia per pokalbių robotus, tokius, kaip OpenAI ChatGPT, padidino susirūpinimą dėl duomenų naudojimo ir netinkamo naudojimo. Šios sistemos gali generuoti tekstą ir kompiuterinį kodą žmogiškai sklandžiai, tačiau jos dažnai viską sugalvoja – kaip teigia mokslininkai – „haliucinuoja“ priklausomai nuo duomenų, kuriuos jos pasiekia ir surenka.
Įmonės paprastai neleidžia savo darbuotojams laisvai naudotis vartotojų pokalbių robotų versijomis. Tačiau jie naudoja savo duomenis bandomuosiuose projektuose, kuriuose naudojamos A.I. sistemos, padedančios rašyti verslo ataskaitas, pristatymus ir kompiuterio kodą. Ir tie įmonės duomenys gali būti gaunami iš daugelio šaltinių, įskaitant klientus, tiekėjus, orų ir vietos duomenis.
„Slaptasis padažas nėra modelis“, – sakė IBM programinės įrangos vyresnysis viceprezidentas Robas Thomas. – "Tai yra duomenys."
Naujojoje sistemoje yra aštuoni pagrindiniai standartai, įskaitant kilmę, šaltinį, teisines teises, duomenų tipą ir generavimo metodą. Tada yra išsamesni daugelio standartų aprašymai, pavyzdžiui, pažymima, kad duomenys buvo gauti iš socialinės žiniasklaidos ar pramoninių jutiklių.
Duomenų dokumentacija gali būti atliekama įvairiais plačiai naudojamais techniniais formatais. Duomenų konsorciumo įmonės išbandė standartus, siekdamos juos patobulinti, ir planuojama, kad kitų metų pradžioje jie bus prieinami visuomenei.
Duomenis pagal tipą, datą ir šaltinį žymėjo atskiros įmonės ir pramonės šakos. Tačiau konsorciumas teigia, kad tai yra pirmieji išsamūs standartai, skirti naudoti visose pramonės šakose.
„Visą savo gyvenimą praleidau, skęsdamas duomenyse ir bandydamas išsiaiškinti, ką galiu naudoti ir kas yra tikslus“, – sakė duomenų mokslininkas ir „Transcarent“ ataskaitų teikimo ir analizės viceprezidentas Thi Montalvo.
„Transcarent“, duomenų konsorciumo narė, yra startuolis, kuris remiasi duomenų analize ir mašininio mokymosi modeliais, siekdamas individualizuoti sveikatos priežiūrą ir paspartinti mokėjimą paslaugų teikėjams.
D. Montalvo teigimu, duomenų standartų naudą lemia didesnis skaidrumas visiems duomenų tiekimo grandinės dalyviams. Šis darbo srautas dažnai prasideda derybomis dėl sutarčių su draudikams, kad gautų prieigą prie žalių duomenų, ir toliau dirba su pradedančios įmonės duomenų mokslininkais, statistikais ir sveikatos ekonomistais, kurie kuria nuspėjamuosius modelius, skirtus pacientų gydymui.
M. Montalvo skaičiuoja, kiekvienu etapu anksčiau sužinojus daugiau apie duomenis, padidėtų efektyvumas ir nebeliktų pasikartojančių darbų, o tai gali sutrumpinti duomenų projektams skiriamą laiką 15–20 procentų.
Duomenų konsorciumas teigia, kad A.I. šiandien rinkai reikia aiškumo, kurį gali suteikti grupės duomenų ženklinimo standartai. „Tai gali padėti išspręsti kai kurias A.I. problemas, apie kurias visi kalba“, – sakė Chrisas Hazardas, startuolio „Howso“, kuris gamina duomenų analizės įrankius ir A.I., vienas iš įkūrėjų ir vyriausiasis technologijų pareigūnas programinei įrangai." [1]
1. Companies Find Way to Spot Trustworthy A.I. Data: [Business/Financial Desk]. Lohr, Steve. New York Times, Late Edition (East Coast); New York, N.Y.. 01 Dec 2023: B.3.
Komentarų nėra:
Rašyti komentarą