Mokslas, studijos ir ekonomika

2024 m. kovo 1 d., penktadienis

Į „ChatGPT“ panašios dirbtinio intelekto pagalbininkės ateina į pagrindines mokslo paieškos sistemas

   „Scopus, Dimensions ir Web of Science duomenų bazėse pristatoma pokalbio dirbtinio intelekto (AI) paieška.



     Atrodo, kad pokalbių AI varomi pokalbių robotai, atkeliavę į interneto paieškos sistemas, pvz., „Google Bard“ ir „Microsoft Bing“, taip pat vis labiau keičia mokslinę paiešką. Rugpjūčio 1 d. Nyderlandų leidybos milžinė Elsevier išleido į ChatGPT panašų dirbtinio intelekto (AI) sąsają kai kuriems savo duomenų bazės Scopus vartotojams, o britų įmonė Digital Science paskelbė apie uždarą AI didelės kalbos modelio (LLM) pagalbinės priemonės, skirtos Dimensijai, duomenų bazei, bandymą. Tuo tarpu JAV įmonė „Clarivate“ teigia, kad ji stengiasi įtraukti LLM į savo „Web of Science“ duomenų bazę.



     Mokslinės paieškos LLM nėra naujiena: įrankiai, įskaitant Elicit, scite ir Consensus, jau turi dirbtinio intelekto sistemas, kurios padeda apibendrinti srities išvadas arba nustatyti geriausius tyrimus, pasikliaujant nemokamomis mokslinėmis duomenų bazėmis arba (scite atveju) prieiga prie mokamų mokslinių tyrimų straipsnių per partnerystę. su leidėjais. Tačiau įmonės, turinčios dideles patentuotas mokslinių santraukų ir nuorodų duomenų bazes, dabar prisijungia prie šio AI skubėjimo.



     „Elsevier“ pokalbių robotas, vadinamas Scopus AI ir pradėtas naudoti, kaip bandomasis, skirtas, kaip lengvas, žaismingas įrankis, padedantis mokslininkams greitai gauti jiems nepažįstamų tyrimų temų santraukas, sako Maxim Khan, „Elsevier“ vadovas Londone, prižiūrėjęs įrankio kūrimą. Vartotojai užduoda klausimus natūralia kalba; atsakydamas, robotas naudoja LLM GPT-3.5 versiją, kad pateiktų sklandžią tyrimo temos santraukos pastraipą kartu su nurodytomis nuorodomis ir kitais klausimais, kuriuos reikia ištirti.



     Vienas susirūpinimas dėl LLM naudojimo paieškai, ypač mokslinei paieškai, yra tas, kad jie yra nepatikimi. Modeliai nesupranta jų sukurto teksto; jie veikia, tiesiog išspjaunant žodžius, kurie yra stilistiškai tikėtini, remiantis duomenimis, kuriais jie buvo mokomi. Jų rezultatuose gali būti faktinių klaidų ir paklaidų ir, kaip greitai pastebėjo akademikai, gali būti pateikiamos neegzistuojančios nuorodos.



     Todėl „Scopus AI“ yra suvaržytas: jis buvo paskatintas pateikti atsakymą tik remiantis penkiomis ar dešimt tyrimų santraukomis. Ir pats tų santraukų neranda – vartotojui įvedus užklausą, įprasta paieškos sistema pateikia atitinkamus dokumentus, aiškina Khanas.

     Netikri faktai



     Daugelis AI paieškos sistemų taiko panašią strategiją, pažymi Singapūro vadybos universiteto bibliotekininkas Aaronas Tay, kuris vadovaujasi AI paieškos įrankiais. Tai kartais vadinama papildyta paieška, nes LLM apsiriboja atitinkamos informacijos, kurią gauna kitas paieškos variklis, apibendrinimas. „LLM vis tiek retkarčiais gali haliucinuoti ar išsigalvoti“, – sako Tay, nurodydamas internetinės paieškos AI pokalbių robotų, tokių, kaip Bing ir perplexity.ai, kurie naudoja panašią techniką, tačiau dažnai pateikia sakinius, kurių neparemia citatos.



     „Elsevier“ apribojo savo dirbtinio intelekto produktą, ieškodama straipsnių, paskelbtų nuo 2018 m., kad gautų tik naujausius straipsnius, ir nurodė savo pokalbių robotui atsakyme tinkamai cituoti grąžintas santraukas, kad būtų išvengta atsakymo į nesaugias ar kenkėjiškas užklausas ir nurodyta, ar jos gaunamose santraukose nėra jokios svarbios informacijos. Tai negali pašalinti klaidų, bet jas sumažinti. „Elsevier“ taip pat sumažino nenuspėjamumą, pasirinkdamas žemą roboto „temperatūros“ nustatymą – matą, kaip dažnai jis pasirenka nukrypti nuo labiausiai tikėtinų žodžių savo atsakyme.



     Ar vartotojai gali tiesiog nukopijuoti ir įklijuoti roboto pastraipas į savo dokumentus, taip veiksmingai plagijuodami įrankį? Tai yra galimybė, sako Khanas. „Elsevier“ iki šiol tai sprendė, vadovaudamasi gairėmis, kuriose tyrėjai prašomi atsakingai naudoti santraukas, sako jis. Khanas atkreipia dėmesį į tai, kad finansuotojai ir kiti leidėjai paskelbė panašias gaires, prašydami skaidriai atskleisti, jei su LLM yra įpratę, pavyzdžiui, rašyti dokumentus ar atlikti tarpusavio vertinimus. Kai kurie teigia, kad LLM iš viso neturėtų būti naudojami.



     Šiuo metu įrankis pristatomas tik maždaug 15 000 vartotojų, ty Scopus abonentų pogrupiui, o kiti tyrėjai kviečiami susisiekti su Elsevier, jei norės jį išbandyti. Bendrovė teigia, kad ji tikisi, kad jis bus visiškai paleistas 2024 m.

     Viso teksto analizė



     Be to, rugpjūčio 1 d. „Digital Science“ paskelbė, kad pristato AI asistentą savo didelei tyrimų publikacijų duomenų bazei „Dimensions“, nors šiuo metu jis prieinamas tik atrinktiems beta versijos testuotojams. Jis veikia panašiai, kaip Scopus AI: vartotojui įvedus klausimą, paieškos sistema nuskaito atitinkamus straipsnius. Tada GPT modelis generuoja suvestinę pastraipą, pagrįstą aukščiausios kategorijos santraukomis.



     „Tai nepaprastai panašu, juokingai“, – sako Christianas Herzogas, Londone įsikūrusios firmos vyriausiasis produktų pareigūnas. („Digital Science“ priklauso Holtzbrinck Publishing Group, kuri yra pagrindinės akcijų dalies savininkė Nature's leidėjo Springer Nature.)



     Dimensions taip pat naudoja LLM, kad pateiktų daugiau informacijos apie atitinkamus dokumentus, įskaitant trumpas perfrazuotas jų išvadų santraukas.



     Herzogas teigia, kad įmonė tikisi iki metų pabaigos išleisti savo įrankį plačiau, tačiau šiuo metu ji bendradarbiauja su mokslininkais, finansuotojais ir kitais, kurie naudojasi Dimensions, kad išbandytų, kur LLM gali būti naudingi, o tai dar reikia pamatyti. „Kalbama apie laipsnišką perėjimą prie naujos technologijos ir pasitikėjimo stiprinimą“, – sako jis.



     Tay sako, kad laukia įrankių, kuriuose LLM būtų naudojamas visam dokumentų tekstui, o ne tik santraukoms. Jis pažymi, kad tokios priemonės, kaip „Elicit“ jau leidžia žmonėms naudoti LLM, kad atsakytų į išsamius klausimus apie visą dokumentų, prie kurių robotai turi prieigą, tekstą, pavyzdžiui, kai kuriuos atviros prieigos straipsnius.



     Tuo tarpu „Clarivate“ Filadelfijoje, Pensilvanijoje, Baras Veinsteinas, firmos akademinės bendruomenės ir vyriausybės skyriaus prezidentas, sako, kad bendrovė „dirba siekdama pridėti LLM pagrįstą paiešką Web of Science“, turėdamas omenyje strateginę partnerystę, pasirašytą su AI21 Labs. Tel Avive, Izraelyje, buvo paskelbta birželį. Veinsteinas nepateikė šio įrankio išleidimo termino." [1]

1. Nature 620, 258 (2023)

ChatGPT-like AIs are coming to major science search engines

"The Scopus, Dimensions and Web of Science databases are introducing conversational AI search.

The conversational AI-powered chatbots that have come to Internet search engines, such as Google’s Bard and Microsoft’s Bing, look increasingly set to change scientific search, too. On 1 August, Dutch publishing giant Elsevier released a ChatGPT-like artificial-intelligence (AI) interface for some users of its Scopus database, and British firm Digital Science announced a closed trial of an AI large language model (LLM) assistant for its Dimensions database. Meanwhile, US firm Clarivate says it’s working on bringing LLMs to its Web of Science database.

LLMs for scientific search aren’t new: tools including Elicit, scite and Consensus already have AI systems that help to summarize a field’s findings or identify top studies, relying on free scientific databases or (in scite’s case) access to paywalled research articles through partnerships with publishers. But firms that own large proprietary databases of scientific abstracts and references are now joining the AI rush.

Elsevier’s chatbot, called Scopus AI and launched as a pilot, is intended as a light, playful tool to help researchers quickly get summaries of research topics they’re unfamiliar with, says Maxim Khan, an Elsevier executive in London who oversaw the tool’s development. Users ask natural-language questions; in response, the bot uses a version of the LLM GPT-3.5 to return a fluent summary paragraph about a research topic, together with cited references and further questions to explore.

One concern about using LLMs for search — especially scientific search — is that they are unreliable. The models don’t understand the text they produce; they work simply by spitting out words that are stylistically plausible on the basis of the data they were trained on. Their output can contain factual errors and biases and, as academics have quickly found, can make up non-existent references.

Scopus AI is therefore constrained: it has been prompted to generate its answer only by reference to five or ten research abstracts. And it doesn’t find those abstracts itself — rather, after the user has typed in a query, a conventional search engine returns relevant papers, explains Khan.

Fake facts

Many AI search-engine systems adopt a similar strategy, notes Aaron Tay, a librarian at Singapore Management University who follows AI search tools. This is sometimes termed retrieval-augmented generation, because the LLM is limited to summarizing relevant information that another search engine retrieves. “The LLM can still occasionally hallucinate or make things up,” says Tay, pointing to research on Internet search AI chatbots, such as Bing and perplexity.ai, that use a similar technique but often return sentences not supported by citations.

Elsevier has limited its AI product to searching for articles published since 2018, so as to pick up only recent papers, and has instructed its chatbot to cite the returned abstracts appropriately in its reply, to avoid answering unsafe or malicious queries, and to state if there’s no relevant information in the abstracts it receives. This can’t eliminate mistakes, but minimizes them. Elsevier has also cut down on unpredictability by picking a low setting for the bot’s ‘temperature’ — a measure of how often it chooses to deviate from the most plausible words in its response.

Might users simply copy and paste the bot’s paragraphs into their own papers, effectively plagiarizing the tool? That’s a possibility, says Khan. Elsevier has so far tackled this with guidance that asks researchers to use the summaries responsibly, he says. Khan points out that funders and other publishers have issued similar guidance, asking for transparent disclosure if LLMs are used to, for instance, write papers or conduct peer reviews. Some state that LLMs shouldn’t be used at all.

For the moment, the tool is being rolled out to only around 15,000 users, a subset of Scopus subscribers, with other researchers invited to contact Elsevier if they want to try it. The firm says it expects a full launch in early 2024.

Full-text analysis

Also on 1 August, Digital Science announced that it was introducing an AI assistant for its large Dimensions database of research publications, although the assistant is currently available only to selected beta testers. It operates in a similar way to Scopus AI: after a user types in their question, a search engine retrieves relevant articles. A GPT model then generates a summary paragraph based on the top-ranked abstracts.

“It’s remarkably similar, funnily enough,” says Christian Herzog, the chief product officer for the firm, which is based in London. (Digital Science is part of Holtzbrinck Publishing Group, the majority shareholder in Nature’s publisher, Springer Nature.)

Dimensions also uses the LLM to provide some more details about relevant papers, including short rephrased summaries of their findings.

Herzog says the firm hopes to release its tool more widely by the end of the year, but for the moment it is working with scientists, funders and others who use Dimensions to test where LLMs might be useful — which remains to be seen. “This is about gradually easing into a new technology and building trust,” he says.

Tay says he’s looking forward to tools that use LLMs on the full text of papers, not just abstracts. Tools such as Elicit already let people use LLMs to answer detailed questions about the full text of papers that the bots have access to, such as some open-access articles, he notes.

At Clarivate in Philadelphia, Pennsylvania, meanwhile, Bar Veinstein, president of the firm’s academia and government section, says the company is “working on adding LLM-powered search in Web of Science”, referring to a strategic partnership signed with AI21 Labs, based in Tel Aviv, Israel, that was announced in June. Veinstein did not give a timeline for the release of this tool." [1]

1. Nature 620, 258 (2023)

Pesticidai pasiekia kalnų viršūnes

   "Net atokiuose slėniuose ir nacionaliniuose parkuose aplink Vinschgau Pietų Tirolyje augalai ir dirvožemis yra užteršti chemikalais iš obuolių auginimo. Tai taip pat turi įtakos gyvūnų pasauliui.



          Dešimt procentų visų Europos prekybos centruose parduodamų obuolių yra iš Pietų Tirolio auginimo vietovių. Vinschgau slėniuose palei Etschą obelų sodai driekiasi kiek akis užmato. Mokslininkai jau įtarė, kad pesticidai, kuriuos ten naudoja ūkininkai, taip pat išplito į kraštovaizdžius, esančius toliau nuo šių monokultūrų. Tai pirmą kartą buvo įrodyta ir paskelbta specializuotame žurnale „Nature Communications Earth & Environment“: RPTU Kaiserslautern-Landau ir Vienos gamtos išteklių ir gyvosios gamtos mokslų universiteto mokslininkai atrado 27 skirtingus augalų apsaugos produktus, dešimt insekticidų, vienuolika fungicidų ir šeši herbicidai.



          Nors pesticidų likučių kiekis mažėjo, didėjant aukščiui, jų taip pat buvo rasta aukštesniuose Vinschgau slėniuose, tokiuose, kaip Matscher slėnis. Net ir saugomose teritorijose su jautriomis ekosistemomis, Stelfer Joch nacionaliniame parke, aplink aukščiausią Pietų Tirolio kalną Ortlerį ir Texelgruppe gamtos parke, esančiame ant pagrindinio Alpių kalnagūbrio, šios medžiagos vis tiek buvo matuojamos.



          Pastaraisiais metais vis mažiau drugelių stebima vis didesniuose aukščiuose aplink Vinschgau. Autoriai rašo, kad pesticidai, tikriausiai, yra viena iš priežasčių. Matavimo taške, kur didžiausias drugelių skaičius, augaluose pesticidų likučių neaptikta, o dirvožemyje – tik dvi medžiagos.



          Iš viso mokslininkai ištyrė augalus ir dirvožemio mėginius 97 įprastiems pesticidams. Gegužės pradžioje jie rinko pavyzdinę medžiagą 53 vietose kas 300 metrų aukštyje, nuo 500 iki 2300 metrų virš jūros lygio.



          Cheminės analizės rodo pesticidų likučius 98 proc. augalų ir 59 proc. dirvožemio mėginių. Pievos slėniuose buvo užterštos iki 13 skirtingų medžiagų. Dauguma pesticidų yra skirti naudojimui nuo obuolių kenkėjų. Trijuose dirvožemio mėginiuose taip pat buvo rasti du neonikotinoidai. Tai insekticidai, kurių ES nebeleidžiama naudoti nuo 2020 m.



          Per vegetacijos sezoną, kuris trunka nuo kovo iki rugsėjo, ūkininkai obelų soduose purškia pesticidus iki 38 kartų.“ [1]

Mes, žmonės, dvokiame iki pat dangaus.

1. Pestizide gelangen bis auf die Berggipfel. Frankfurter Allgemeine Zeitung (online) Frankfurter Allgemeine Zeitung GmbH. Feb 12, 2024. Von Frauke Zbikowski

Pesticides reach the mountain peaks

"Even in remote valleys and national parks around Vinschgau in South Tyrol, plants and soil are contaminated with chemicals from apple cultivation. This also apparently affects the animal world.

     Ten percent of all apples sold in Europe's supermarkets come from South Tyrolean growing areas. In the valleys of the Vinschgau along the Etsch, apple orchards stretch as far as the eye can see. Scientists had already suspected that the pesticides that farmers use there also spread to landscapes away from these monocultures. This has now been proven for the first time and published in the specialist journal 'Nature Communications Earth & Environment': Scientists from the RPTU Kaiserslautern-Landau and the University of Natural Resources and Life Sciences in Vienna discovered 27 different plant protection products, ten insecticides, eleven fungicides and six weedkillers.

     Although the amount of pesticide residues decreased with increasing altitude, they were also found in higher side valleys of the Vinschgau such as the Matscher Valley. Even in the protected areas with sensitive ecosystems, in the Stelfer Joch National Park around the Ortler, the highest mountain in South Tyrol, and in the Texelgruppe Nature Park on the main Alpine ridge, the substances were still measured.

     In recent years, fewer and fewer butterflies have been observed at higher altitudes around Vinschgau. The authors write that pesticides are probably one of the causes. At the measuring point where the number of butterflies is highest, no pesticide residues were detectable in plants and only two substances in the soil.

     In total, the scientists tested plants and soil samples for 97 common pesticides. At the beginning of May, they collected sample material at 53 locations at elevations every 300 meters, from 500 to 2,300 meters above sea level.

     The chemical analyzes show residues of pesticides in 98 percent of the plant and 59 percent of the soil samples. Meadows in valley areas were contaminated with up to 13 different substances. Most of the pesticides are against apple pests. Two neonicotinoids were also found in three of the soil samples. These are insecticides that have no longer been allowed to be used in the EU since 2020.

     During a growing season, which lasts from March to September, farmers spray pesticides in the apple orchards up to 38 times." [1]

We humans stink to the high heaven.

1. Pestizide gelangen bis auf die Berggipfel. Frankfurter Allgemeine Zeitung (online) Frankfurter Allgemeine Zeitung GmbH. Feb 12, 2024. Von Frauke Zbikowski

G. Landsbergis (Broiler): the blockade of Polish farmers also raises questions about Lithuania's national security

When a person cuts off chicken's head, the person lets the chicken go. The chicken flails around, spewing blood. Broiler apparently doesn't have a brain at all either because he's running around spreading panic. Already in Lithuania, queues for psychiatrists are huge, because many believe and are afraid, and he still can't get enough. A pest.

G. Landsbergis: lenkų ūkininkų blokada kelia klausimų ir dėl Lietuvos nacionalinio saugumo

Kai vištai nupjauna galvą, tai ją paleidžia. Ji blaškosi aplink, šlakstydama kraują. Broileris, matyt, irgi neturi visai smegenų, nes blaškosi aplink, skleisdamas paniką. Jau Lietuvoje eilės pas psichiatrus didžiulės, nes daugelis tiki ir bijo, o jam vis negana. Kenkėjas.

Mokslas, studijos ir ekonomika

Sekėjai

Ieškoti šiame dienoraštyje

Subscribe Now: Feed Icon

Tinklaraščio archyvas

Apie mane