DeepSeek je izdal Janus-Pro-7B, ki presega DALL-E 3 in Stable Diffusion v zmožnostih generiranja slik

Kitajsko podjetje DeepSeek je predstavilo svojo novo multimodalno nevronsko mrežo, Janus-Pro-7B, zasnovano za učinkovito prepoznavanje in generiranje slik. V primerjavi s prejšnjimi različicami je bil nov model znatno izboljšan: optimizirani so bili algoritmi usposabljanja, podatkovni niz je bil razširjen, velikost modela pa povečana. Te spremembe so omogočile, da je nevronska mreža močno izboljšala svoje delovanje pri nalogah, povezanih z generiranjem slik iz besedilnih opisov in analizo slik.

Janus-Pro-7B je prekašal dobro znane modele, kot sta DALL-E 3 in Stable Diffusion, v testih GenEval in DPG-Bench. Ta nevronska mreža ponuja visoke ravni podrobnosti in realizma pri ustvarjanju slik, kar jo postavlja kot močnega konkurenta drugim rešitvam. Model je že na voljo na platformi Hugging Face, kodo pa je mogoče prenositi brezplačno z GitHub-a, kar omogoča raziskovalcem in razvijalcem, da prispevajo k njenemu razvoju.

Objava je bila prevedena Pokaži izvirnik (EN)
0
Komentarji 0