„Duomenų analizė yra ateities sritis. Tačiau nors Amerikos technologijų įmonės jau nustato standartus, Vokietija atsilieka – iš dalies dėl to, kad studentams trūksta galimybių. Ką gali padaryti universitetai.
Duomenys, duomenys, duomenys. Jie formuoja mūsų gyvenimą, pakeičia patirtį ir, pavyzdžiui, padeda rasti naujų būdų, kaip išvengti statybviečių ar kamščių. „Svarbiausia, kad jie atskleidžia ryšius, kurie nėra iš karto akivaizdūs, ir tai mane taip žavi“, – sako Hannah Feltz. 23 metų studentė studijuoja duomenų mokslą Hamburgo technologijos universitete (TUHH). Dar prieš pradėdama studijas, ji susidūrė su terminu „duomenų gavyba“ Chaoso kompiuterių klube – duomenų rinkinių analizė ir įžvalgų išgavimas naudojant algoritmus. „Nepakankamai įvertinta sritis – ir vienas iš mano mėgstamiausių dalykų studijose“, – sako Feltz.
Penktajame semestre studentė išklausė privalomą duomenų gavybos paskaitą, o lydinčiame seminare gavo Hamburgo orientyrų duomenų rinkinį. Valymas, klasterizavimas, kodavimas – studentai turėjo parodyti, ko iki šiol išmoko studijose, ir profesionaliai išanalizuoti duomenis. „Hipotezė buvo, kad Hamburgą sudaro keli maži susilieję miesto centrai“, – sako Feltz, rodydama miesto kontūrą, nusėtą daugybe spalvingų taškų. „Ten daug ko nematyti, nes viskas yra vienas ant kito“, – savo grafiką komentuoja studentė ir kitame žingsnyje peržiūrai pasirenka tik seniausią aštuntadalį orientyrų. Klasteris apima laikotarpį nuo 1263 iki 1800 metų – toks ilgas laiko tarpas, nes yra mažiau duomenų. Kai kuriuos erdvinius klasterius iš principo galima atpažinti, tačiau yra daug išskirtinių rezultatų, ir rezultatas nėra galutinis.
Būtent šis atvirumas netikėtiems rezultatams apibūdina mokslinius tyrimus. „Mes iš tikrųjų nieko neradome“, – sako Feltz. Nepaisant to, grupinis darbas buvo smagus: „Užduotys buvo atviros, galėjote iš tikrųjų leisti savo kūrybiškumui lietis, ir manau, kad tai buvo šaunu.“ Klasterizacijos algoritmų programavimas studentams užtruko apie septynias valandas, todėl jie buvo šiek tiek išsekę, kol pasiekė grafinį pristatymą. Nors įtraukianti vizualizacija yra būtina duomenų gavybai, Feltz pabrėžia: „Geras grafikas daug pasako, nesvarbu, ar tai juostinė diagrama, ar linijinė diagrama.“ Studentė būtų norėjusi tai pademonstruoti savo bakalauro darbe, tačiau neturėjo tinkamos duomenų gavybos temos – kaip ir profesorius, su kuriuo ji konsultavosi.
Vis dėlto duomenų gavyba yra sritis su perspektyvia ateitimi. Įmonės išleidžia daug pinigų klasifikuodamos sparčiai augančius duomenų rinkinius arba nustatydamos modelius, išskirtis ir tendencijas.
Ir ne tik įmonės: ministerijos neseniai pateko į antraštes dėl policijos programinės įrangos įsigijimo iš JAV bendrovės „Palantir“.
Duomenų apsaugos gynėjų požiūriu, tai buvo klaida, nes neaišku, kaip tiksliai duomenys yra susieti ir kaip kuriami profiliai, be to, kyla susirūpinimas dėl ryšių su Amerikos saugumo agentūromis.
„Mes būtinai turime patys sukurti tokią patirtį ir programinę įrangą, kad išvengtume priklausomybės ir išliktume konkurencingi“, – reikalauja duomenų mokslo profesorė Marina Tropmann-Frick. Ji yra duomenų gavybos ekspertė Vokietijos informatikos draugijoje. Hamburgo taikomųjų mokslų universitete (HAW Hamburg) ji atlieka tyrimus Vokietijos vyriausybei tema „Atsakingas dirbtinis intelektas“.
Tropmann-Frick Europos dirbtinio intelekto reguliavimo „DI įstatymą“ vertina, kaip teigiamą plėtrai. „Visas pasaulis mus stebi, stebėdamasis, kad mes apskritai išdrįsome tai padaryti“, – sako profesorė. Europiečiai moka spręsti problemas struktūrizuotai, o tai galiausiai lemia patikimesnę programinę įrangą. Ir Vokietijos universitetai galėtų prie to prisidėti: „Vokietijai netrūksta patirties, bet ją reikia geriau remti“, – sako duomenų mokslininkė.
Vyriausybės sutartys ir rizikos kapitalistai, kurie lėmė „Palantir“ sėkmę, yra viena.
Kita vertus, daugiau profesorių pareigybių, daugiau finansavimo programų ir daugiau bendradarbiavimo su vidutinio dydžio programinės įrangos įmonėmis yra pagrindas, leidžiantis kurti tokius sudėtingus analitinius įrankius.
Apskritai Tropmann-Frick ragina universitetuose rengti daugiau duomenų gavybos kursų: „Galbūt nesiūlome pakankamai, be to, turime išteklių problemą“, – sako ji.
Profesorė neatmeta specialios studijų programos galimybės. Ji tam prieštarauja, sakydama, kad tai nebūtų prasminga: „Nuo duomenų valdymo ir duomenų rengimo iki duomenų gavybos vyksta sklandūs perėjimai; viskas priklauso kartu.“
Nesvarbu, ar studijų programa vadinasi duomenų mokslas, duomenų gavyba, ar mašininis mokymasis, ji visada apima plačias tyrimų sritis, įskaitant statistiką, duomenų bazes ir dirbtinį intelektą. „Galiausiai visos šios sritys yra susijusios su duomenų modelių, ryšių ir nuspėjamųjų modelių nustatymu“, – sako Berndas Bischlas, kuris daugiausia dėsto mašininį mokymąsi „Statistikos duomenų moksle“ srityje Liudviko Maksimiliano universitete Miunchene. Bischl iš pradžių studijavo informatiką. Vėliau Edinburge studijavo dirbtinį intelektą ir mašininį mokymąsi – ir turėjo sėkmingai baigti mašininio mokymosi studijų programą, nepaisydamas savo patikimo profesoriaus Vokietijos akademinių stipendijų fonde patarimo. „Mano atveju mane atkalbėjo fizikas, nes tai nebuvo laikoma tikru mokslu“, – pasakoja Bischl.
Tai buvo 2001 m., kai interneto startuoliai jau buvo aiškiai įrodę, kad duomenų mokslas turi tvirtus matematinius pagrindus ir gali būti ekonomiškai sėkmingas. „Mes praleidome progą“, – sako Bischl.
Šiandien norint pasivyti lyderius anapus Atlanto, reikia didžiulių duomenų kiekių, brangios skaičiavimo galios ir glaudaus bendradarbiavimo su technologijų įmone dėl reikalingos infrastruktūros.
„Turime keletą trūkumų vienu metu“, – sako statistikas ir tuoj pat pasitaiso. Jis nenori skambėti taip negatyviai: „Vokietija per pastaruosius 15 metų tikrai daug nuveikė.“ „Ypač šeši dirbtinio intelekto kompetencijos centrai yra didelis žingsnis teisinga kryptimi.“ Vienas iš jų yra „Miuncheno mašininio mokymosi centras“ arba trumpai MCML Miunchene – o Bischl yra vienas iš keturių jo direktorių.
„20 milijonų eurų per metus – nemaža suma, kad Miunchene suburtume geriausius mašininio mokymosi ir dirbtinio intelekto specialistus“, – giria profesorius.
Gebėjimas išgauti empirines žinias iš duomenų ir panaudoti jas priimant racionalius sprendimus tapo pagrindiniu įgūdžiu, ypač po COVID-19 pandemijos. Norint pasiekti platesnį poveikį, šią temą reikia pristatyti mokyklose. Norint daugiau tyrinėti ir kurti patentuotą programinę įrangą, reikia jaunų talentų, kurie norėtų penkerius metus skirti intensyvioms duomenų mokslo studijoms, o ne tik tęstiniam mokymuisi. Bendradarbiavimas visoje Europoje universitetų plečia studijų programų spektrą ir skatina tarptautinius ryšius.
Profesorė Tropmann-Frick rekomenduoja dvigubo laipsnio programas, kai studentai įgyja laipsnius dviejuose universitetuose. „Tai galima finansuoti per „Erasmus“ stipendiją.“
Vėliau laukia daug galimybių; duomenų mokslininkai yra labai paklausūs, o taikymo galimybės – didžiulės. Tropmann-Frick pasinėrė į dalelių fiziką ir tyrinėja „ChatGPT“ dalelių fizikams. Hannah Feltz tai yra federacinis mokymasis – mašininio mokymosi technika, kai modelis decentralizuotai apmokomas keliuose įrenginiuose – ir dabar yra jos bakalauro darbo tema. „Tai nesusiję su duomenų gavyba, bet taip pat įdomu“, – sako studentė. Vėliau ji planuoja siekti duomenų mokslo magistro laipsnio TUHH (Hamburgo technologijos universitete), bet kas bus toliau, dar neaišku. „Šiuo metu studijuoju ir man tai labai patinka“, – pabrėžia ji. Policijos IT tikriausiai nėra perspektyvios, nes jos tai netraukia, bet europietiška „Palantir“ versija yra galimybė. Studentė tuo įsitikinusi: „Mes turime patirties, čia, TUHH, bet tokios programinės įrangos rašymui reikia laiko ir išteklių.“ [1]
Kokia drąsi studentė, viena pasiruošusi dirbti už Amerikos karinį-pramoninį kompleksą. Tie profesoriai, gaunantys 20 mln. eurų per metus savo maistui, gali nugyventi gerą gyvenimą. Tačiau mašininio mokymosi tyrimams skirta 20 mln. eurų per metus yra juokingai mažas skaičius.
1. Ein eigenes Palantir? Frankfurter Allgemeine Zeitung; Frankfurt. 01 Nov 2025: 30. Von Deike Uhtenwoldt
Komentarų nėra:
Rašyti komentarą