„Scopus, Dimensions ir Web of Science duomenų bazėse pristatoma pokalbio dirbtinio intelekto (AI) paieška.
Atrodo, kad pokalbių AI varomi pokalbių robotai, atkeliavę į interneto paieškos sistemas, pvz., „Google Bard“ ir „Microsoft Bing“, taip pat vis labiau keičia mokslinę paiešką. Rugpjūčio 1 d. Nyderlandų leidybos milžinė Elsevier išleido į ChatGPT panašų dirbtinio intelekto (AI) sąsają kai kuriems savo duomenų bazės Scopus vartotojams, o britų įmonė Digital Science paskelbė apie uždarą AI didelės kalbos modelio (LLM) pagalbinės priemonės, skirtos Dimensijai, duomenų bazei, bandymą. Tuo tarpu JAV įmonė „Clarivate“ teigia, kad ji stengiasi įtraukti LLM į savo „Web of Science“ duomenų bazę.
Mokslinės paieškos LLM nėra naujiena: įrankiai, įskaitant Elicit, scite ir Consensus, jau turi dirbtinio intelekto sistemas, kurios padeda apibendrinti srities išvadas arba nustatyti geriausius tyrimus, pasikliaujant nemokamomis mokslinėmis duomenų bazėmis arba (scite atveju) prieiga prie mokamų mokslinių tyrimų straipsnių per partnerystę. su leidėjais. Tačiau įmonės, turinčios dideles patentuotas mokslinių santraukų ir nuorodų duomenų bazes, dabar prisijungia prie šio AI skubėjimo.
„Elsevier“ pokalbių robotas, vadinamas Scopus AI ir pradėtas naudoti, kaip bandomasis, skirtas, kaip lengvas, žaismingas įrankis, padedantis mokslininkams greitai gauti jiems nepažįstamų tyrimų temų santraukas, sako Maxim Khan, „Elsevier“ vadovas Londone, prižiūrėjęs įrankio kūrimą. Vartotojai užduoda klausimus natūralia kalba; atsakydamas, robotas naudoja LLM GPT-3.5 versiją, kad pateiktų sklandžią tyrimo temos santraukos pastraipą kartu su nurodytomis nuorodomis ir kitais klausimais, kuriuos reikia ištirti.
Vienas susirūpinimas dėl LLM naudojimo paieškai, ypač mokslinei paieškai, yra tas, kad jie yra nepatikimi. Modeliai nesupranta jų sukurto teksto; jie veikia, tiesiog išspjaunant žodžius, kurie yra stilistiškai tikėtini, remiantis duomenimis, kuriais jie buvo mokomi. Jų rezultatuose gali būti faktinių klaidų ir paklaidų ir, kaip greitai pastebėjo akademikai, gali būti pateikiamos neegzistuojančios nuorodos.
Todėl „Scopus AI“ yra suvaržytas: jis buvo paskatintas pateikti atsakymą tik remiantis penkiomis ar dešimt tyrimų santraukomis. Ir pats tų santraukų neranda – vartotojui įvedus užklausą, įprasta paieškos sistema pateikia atitinkamus dokumentus, aiškina Khanas.
Netikri faktai
Daugelis AI paieškos sistemų taiko panašią strategiją, pažymi Singapūro vadybos universiteto bibliotekininkas Aaronas Tay, kuris vadovaujasi AI paieškos įrankiais. Tai kartais vadinama papildyta paieška, nes LLM apsiriboja atitinkamos informacijos, kurią gauna kitas paieškos variklis, apibendrinimas. „LLM vis tiek retkarčiais gali haliucinuoti ar išsigalvoti“, – sako Tay, nurodydamas internetinės paieškos AI pokalbių robotų, tokių, kaip Bing ir perplexity.ai, kurie naudoja panašią techniką, tačiau dažnai pateikia sakinius, kurių neparemia citatos.
„Elsevier“ apribojo savo dirbtinio intelekto produktą, ieškodama straipsnių, paskelbtų nuo 2018 m., kad gautų tik naujausius straipsnius, ir nurodė savo pokalbių robotui atsakyme tinkamai cituoti grąžintas santraukas, kad būtų išvengta atsakymo į nesaugias ar kenkėjiškas užklausas ir nurodyta, ar jos gaunamose santraukose nėra jokios svarbios informacijos. Tai negali pašalinti klaidų, bet jas sumažinti. „Elsevier“ taip pat sumažino nenuspėjamumą, pasirinkdamas žemą roboto „temperatūros“ nustatymą – matą, kaip dažnai jis pasirenka nukrypti nuo labiausiai tikėtinų žodžių savo atsakyme.
Ar vartotojai gali tiesiog nukopijuoti ir įklijuoti roboto pastraipas į savo dokumentus, taip veiksmingai plagijuodami įrankį? Tai yra galimybė, sako Khanas. „Elsevier“ iki šiol tai sprendė, vadovaudamasi gairėmis, kuriose tyrėjai prašomi atsakingai naudoti santraukas, sako jis. Khanas atkreipia dėmesį į tai, kad finansuotojai ir kiti leidėjai paskelbė panašias gaires, prašydami skaidriai atskleisti, jei su LLM yra įpratę, pavyzdžiui, rašyti dokumentus ar atlikti tarpusavio vertinimus. Kai kurie teigia, kad LLM iš viso neturėtų būti naudojami.
Šiuo metu įrankis pristatomas tik maždaug 15 000 vartotojų, ty Scopus abonentų pogrupiui, o kiti tyrėjai kviečiami susisiekti su Elsevier, jei norės jį išbandyti. Bendrovė teigia, kad ji tikisi, kad jis bus visiškai paleistas 2024 m.
Viso teksto analizė
Be to, rugpjūčio 1 d. „Digital Science“ paskelbė, kad pristato AI asistentą savo didelei tyrimų publikacijų duomenų bazei „Dimensions“, nors šiuo metu jis prieinamas tik atrinktiems beta versijos testuotojams. Jis veikia panašiai, kaip Scopus AI: vartotojui įvedus klausimą, paieškos sistema nuskaito atitinkamus straipsnius. Tada GPT modelis generuoja suvestinę pastraipą, pagrįstą aukščiausios kategorijos santraukomis.
„Tai nepaprastai panašu, juokingai“, – sako Christianas Herzogas, Londone įsikūrusios firmos vyriausiasis produktų pareigūnas. („Digital Science“ priklauso Holtzbrinck Publishing Group, kuri yra pagrindinės akcijų dalies savininkė Nature's leidėjo Springer Nature.)
Dimensions taip pat naudoja LLM, kad pateiktų daugiau informacijos apie atitinkamus dokumentus, įskaitant trumpas perfrazuotas jų išvadų santraukas.
Herzogas teigia, kad įmonė tikisi iki metų pabaigos išleisti savo įrankį plačiau, tačiau šiuo metu ji bendradarbiauja su mokslininkais, finansuotojais ir kitais, kurie naudojasi Dimensions, kad išbandytų, kur LLM gali būti naudingi, o tai dar reikia pamatyti. „Kalbama apie laipsnišką perėjimą prie naujos technologijos ir pasitikėjimo stiprinimą“, – sako jis.
Tay sako, kad laukia įrankių, kuriuose LLM būtų naudojamas visam dokumentų tekstui, o ne tik santraukoms. Jis pažymi, kad tokios priemonės, kaip „Elicit“ jau leidžia žmonėms naudoti LLM, kad atsakytų į išsamius klausimus apie visą dokumentų, prie kurių robotai turi prieigą, tekstą, pavyzdžiui, kai kuriuos atviros prieigos straipsnius.
Tuo tarpu „Clarivate“ Filadelfijoje, Pensilvanijoje, Baras Veinsteinas, firmos akademinės bendruomenės ir vyriausybės skyriaus prezidentas, sako, kad bendrovė „dirba siekdama pridėti LLM pagrįstą paiešką Web of Science“, turėdamas omenyje strateginę partnerystę, pasirašytą su AI21 Labs. Tel Avive, Izraelyje, buvo paskelbta birželį. Veinsteinas nepateikė šio įrankio išleidimo termino." [1]
1. Nature 620, 258 (2023)