Umetna inteligenca (AI) še naprej izjemno hitro napreduje, na sceno pa je stopil nov igralec, ki pretresa obstoječe mejnike in konkurenco. Kitajsko podjetje DeepSeek je predstavilo svoj najnovejši model umetne inteligence Janus-Pro, ki obljublja izjemne zmogljivosti na področju analize in ustvarjanja slik. Z njim naj bi podjetje neposredno konkuriralo uveljavljenim rešitvam, kot sta DALL-E 3 in Stable Diffusion, ter celo izzvalo ChatGPT.
Janus-Pro je revolucionaren AI-model, ki temelji na napredni avtoregresijski arhitekturi. Združuje večmodalno razumevanje in generativne sposobnosti, kar pomeni, da je sposoben hkrati analizirati slike in ustvarjati nove vsebine. Ključna inovacija je v uporabi enotne arhitekture transformatorja, ki vizualno kodiranje razdeli na več poti, a za obdelavo uporablja integrirano zasnovo. To zagotavlja izjemno učinkovitost in natančnost pri obdelavi slik.
Jedro Janus-Pro sloni na temeljnem modelu DeepSeek-LLM-1.5b in DeepSeek-LLM-7b. Za razumevanje slik uporablja SigLIP-L, napredni vizualni kodirnik, ki omogoča obdelavo slik v ločljivosti 384 x 384 pik. Te tehnološke izboljšave omogočajo modelu globoko analizo vizualnih podatkov in ustvarjanje vizualnih vsebin na povsem novi ravni.
Podobno kot predhodnik, model R1, je tudi Janus-Pro izdan pod licenco MIT, kar pomeni, da je brezplačno dostopen za komercialno uporabo. To omogoča podjetjem in razvijalcem, da model integrirajo v svoje rešitve brez pravnih omejitev, kar bi lahko pospešilo njegov globalni sprejem.
Trenutno je Janus-Pro na voljo prek platforme Hugging Face, ki omogoča enostaven dostop in uporabo modela. Kljub temu pa DeepSeek še ni predstavil uradne spletne strani ali aplikacije za neposredno generiranje slik, kar bi uporabnikom omogočilo enostavnejšo interakcijo z Janus-Pro.