Vakarų mokslininkai pirmenybę teikia nemokamiems dirbtinio intelekto įrankiams, tokiems, kaip „Perplexity“ cituojantiems atsakymams, „Google Gemini“ bendroms užduotims, „Elicit“ ir „ResearchRabbit“ literatūros atradimui, „Semantic Scholar“ straipsnių paieškai ir „Llama“ / „DeepSeek“ modeliams atvirojo kodo pritaikymui, akcentuojant patikimą, cituojamą informaciją ir specializuotas tyrimų funkcijas, neapsiribojant pagrindiniu pokalbiu.
Bendriems tyrimams ir atsakymams
„Perplexity“: labai giriamas už tai, kad pateikia tiesioginius, šaltiniais pagrįstus, atsakymus su citatomis, veikdamas, kaip dirbtinio intelekto paieškos sistema patikimai informacijai.
„Google Gemini“ (nemokama pakopa): siūlo galingus modelius ir integraciją su „Google Workspace“ turinio kūrimui ir sudėtingiems klausimams.
„ChatGPT“ (nemokama): vis dar plačiai naudojamas, kaip universalus rašymo asistentas ir bendros informacijos paieškai, nors naujesni modeliai dažnai kainuoja pinigus.
Literatūros ir straipsnių atradimui
„Elicit“: automatizuoja literatūros apžvalgas, išskiria įžvalgas ir generuoja struktūrizuotas santraukas / lenteles iš straipsnių.
„ResearchRabbit“: vizualizuoja tyrimų tinklus, padeda rasti susijusius straipsnius ir seka tendencijas, naudodamas citavimo žemėlapius. „Semantic Scholar“: nemokama, dirbtiniu intelektu paremta mokslinės literatūros paieška, siūlanti filtravimą, prieigą prie PDF ir semantinę paiešką.
„ScienceOS“ („Science GPT“): specializuotas mokslo pokalbių robotas, kuris atsako į klausimus pateikdamas nuorodas ir kuria citavimo tinklus.
Atvirojo kodo ir pritaikymo galimybėms
„Llama“ („Meta“): populiari, atvirojo svorio modelių šeima, plačiai atsisiunčiama bendruomenės tyrimams ir pritaikytam naudojimui.
„DeepSeek“ („DeepSeek-R1“): atvirojo svorio modelis su pažangiu samprotavimu, leidžiantis tyrėjams atsisiųsti ir pritaikyti pagrindinį modelį.
Svarbiausi mokslininkams aspektai
Citatos: tokios priemonės, kaip „Perplexity“, „Elicit“ ir „ScienceOS“ yra pageidaujamos, nes jos cituoja šaltinius – tai labai svarbus tyrimo patikimumo elementas.
Specializacija: mokslininkai dažnai renkasi literatūrai pritaikytas priemones („Elicit“, „Semantic Scholar“), o ne bendrinius pokalbių robotus.
Atvirumas: atvirojo svorio modeliai („Llama“, „DeepSeek“) yra vertingi giliam pritaikymui.
Kaip atsisiųsti ir pritaikyti pagrindinį modelį „DeepSeek-R1“, atvirojo svorio modelį su pažangiu samprotavimu?
Norėdami atsisiųsti ir pritaikyti atvirojo svorio „DeepSeek-R1“ modelį, galite naudoti vietinius modelių vykdymo įrankius, tokius, kaip „Ollama“, arba sistemas, tokias, kaip „Hugging Face Transformers“, skirtas sudėtingesniam tiksliam derinimui.
Atsisiųskite modelį
„DeepSeek-R1“ modelis yra įvairių dydžių (1,5B, 7B, 8B, 14B, 32B, 70B parametrai). Mažesnes, distiliuotas versijas lengviau paleisti vartotojų aparatinėje įrangoje.
1 variantas: „Ollama“ naudojimas (lengviausia diegti ir paleisti vietoje)
„Ollama“ yra įrankis, kuris supaprastina didelių kalbos modelių paleidimą vietoje.
Įdiekite „Ollama“, atsisiųsdami atitinkamą diegimo programą savo operacinei sistemai („macOS“, „Linux“ arba „Windows“) iš oficialios „Ollama“ svetainės.
Atidarykite terminalą arba komandų eilutę.
Ištraukite norimą „DeepSeek-R1“ modelio versiją, naudodami komandą „ollama pull“:
„ollama pull deepseek-r1:1.5b“
„ollama pull deepseek-r1:8b“ (populiarus pasirinkimas)
„ollama pull deepseek-r1:70b“ (reikalinga didelė GPU galia)
Paleiskite modelį interaktyvioje sesijoje, naudodami komandą „ollama run deepseek-r1:[version]“ (pvz., „ollama run deepseek-r1:8b“).
2 variantas: „Hugging Face“ ir „Python“ naudojimas (integracijai / pritaikymui)
Šis metodas suteikia daugiau kontrolės ir yra būtinas tiksliam derinimui.
Įdiegimo prielaidos: Įsitikinkite, kad turite įdiegtus „Python“, „PyTorch“ ir „Hugging Face“ transformatorių biblioteką.
Modelio atsisiuntimas: Modelį galite įkelti Python scenarijuje, naudodami transformatorių biblioteką. Biblioteka automatiškai tvarko modelio failų atsisiuntimą ir talpyklą iš oficialios „DeepSeek-R1“ saugyklos „Hugging Face“.
Įkelkite modelį, naudodami atitinkamus kodo fragmentus, pateiktus modelio kortelės puslapyje. Paprastai tam reikia kelių „Python“ eilučių, kad būtų įkeltas iš anksto apmokytas modelis ir tokenizeris.
Modelio pritaikymas
Pritaikymas paprastai apima modelio tikslinimą konkrečiame duomenų rinkinyje arba tokių metodų, kaip „Retrieval-Augmented Generation“ (RAG) naudojimą išorinėms žinioms gauti.
Tikslinimas: tai yra pažangus procesas, apimantis tolesnį modelio mokymą kuruojamame duomenų rinkinyje, siekiant specializuoti jo elgesį.
Šiuo tikslu galite naudoti „Hugging Face“ mokymo API arba tokias paslaugas, kaip „Amazon SageMaker AI“.
„DeepSeek“ komanda išleido distiliuotus modelius, specialiai skirtus bendruomenei tikslinti ir tirti.
Tikslinimo vadovai dažnai apima specializuotų bibliotekų naudojimą ir reikalauja didelių skaičiavimo išteklių (GPU).
Raginimo inžinerija: norėdami paskatinti pažangias samprotavimo galimybes standartiniu būdu, nurodykite modeliui pradėti savo atsakymą žyme <think>\n jūsų raginime. Tai suaktyvina jo metodinį samprotavimo procesą.
RAG (paieška papildyta generacija): integruokite modelį su vektorinių duomenų baze (pvz., „Milvus“) ir programos sąsaja (pvz., „AnythingLLM“ arba „Open WebUI“), kad suteiktumėte jam prieigą prie konkrečių jūsų dokumentų ir duomenų. Tai leidžia modeliui pateikti, kontekstą atitinkančius, atsakymus nekeičiant pagrindinių svorių.
„Milvus“ yra pirmaujanti atvirojo kodo, debesijos pagrindu veikianti, vektorinė duomenų bazė, skirta našiai atlikti panašumų paiešką dideliuose duomenų rinkiniuose, kuri yra labai svarbi šiuolaikinėms dirbtinio intelekto programoms, tokioms, kaip semantinė paieška, rekomendacijų sistemos ir generatyvinis dirbtinis intelektas. Ji efektyviai saugo, indeksuoja ir tvarko įterpimo vektorius (skaitmeninius nestruktūrizuotų duomenų, pvz., teksto, vaizdų ar garso, atvaizdus), leisdama rasti semantiškai panašius elementus, neapsiribojant paprastu raktinių žodžių atitikimu. Ji pasižymi mastelio keitimu, veikia įvairiose aplinkose (nuo nešiojamųjų kompiuterių iki debesijos) ir palaiko integraciją su daugeliu įterpimo modelių, suteikdama maitinimą programoms, kurioms reikalinga greita, kontekstą suvokianti, duomenų paieška.
„Open WebUI“ yra nemokama, savarankiškai talpinama, atvirojo kodo žiniatinklio sąsaja, skirta sąveikai su dirbtinio intelekto modeliais. Ji siūlo patogią pokalbių patirtį, panašią į „ChatGPT“, tačiau su daugiau valdymo galimybių, neprisijungus veikiančiomis, funkcijomis ir palaikymu vietiniams modeliams (pvz., „Ollama“) arba „OpenAI“ API, su integruota RAG, žiniatinklio paieška, vaizdų generavimu ir vartotojų valdymu, skirtais privačioms, saugioms ir pritaikomoms dirbtinio intelekto darbo eigoms. Ji leidžia kurti pasirinktinius pokalbių robotus, naudoti raginimų šablonus ir valdyti duomenis vietoje, todėl galingas dirbtinis intelektas tampa prieinamas asmeniniam ar organizacijos naudojimui.
Komentarų nėra:
Rašyti komentarą