Sekėjai

Ieškoti šiame dienoraštyje

2026 m. vasario 21 d., šeštadienis

Ar „Moonshot AI“ agentai gali analizuoti paveikslėlį mano jutikliniame ekrane ir ten atlikti užduotis? Kiek tai kainuoja?

 


 

Taip, naujausias „Moonshot AI“ „Kimi K2.5“ modelis (išleistas 2026 m. pradžioje) skirtas ekrano kopijoms ir ekrano įrašams analizuoti, kad atliktų užduotis. Jis specialiai sukurtas vizualiniams išdėstymams, vartotojo sąsajoms ir sąveikai suprasti, leisdamas jam tai, ką jis „mato“, paversti veiksmais, kodu arba duomenų analize.

 

Galimybės

 

Vizualinė analizė: agentas gali interpretuoti vaizdus ir vaizdo įrašus, kas leidžia jam suprasti vartotojo sąsajos elementus, išdėstymus ir sąveiką iš ekrano kopijų.

 

Veiksmų atlikimas: „Kimi K2.5“ gali veikti, kaip agentas, kuris perima valdymą, pvz., automatiškai kurti kodą pagal svetainės išdėstymo ekrano kopiją arba atlikti „vizualinį derinimą“, tikrindamas savo išvestį.

 

Agentų spiečius: jis gali koordinuoti iki 100 AI agentų, kad jie dirbtų lygiagrečiai su sudėtingomis, ilgalaikėmis užduotimis.

 

Kaina

 

API naudojimas: „Kimi K2.5“ kaina yra maždaug 0,60 USD už 1 mln. įvesties žetonų ir 2,50 USD už 1 mln. išvesties žetonų (apytikriai lygu apie 2 000 knygos puslapių).

 

Prenumerata: Agentų spiečiaus galimybėms komandoms ar intensyviems vartotojams reikalinga mokama prenumerata, kurios kaina svyruoja nuo 31 iki 159 USD per mėnesį.

 

Nemokama prieiga: Svetainėje galima rasti nemokamą versiją su naudojimo apribojimais.

 

Pagrindiniai aspektai

 

Tikslinė auditorija: Vizualinio kodo ir ekrano analizės funkcijos yra glaudžiai integruotos į „Kimi Code“ – įrankį, skirtą kūrėjams, skirtiems kurti sąsajas, svetaines ir valdyti darbo eigas.

Apribojimai: Nors technologija yra pajėgi, ji specializuojasi, kuriant ir analizuojant žiniatinklio sąsajas ir kodą, pagrįstus vaizdiniais elementais, o ne tiesiogiai pakeičia žmogaus įvestį visose mobiliosiose jutiklinio ekrano programose.

Komentarų nėra: