Microsoftova umetna inteligenca deluje na nizkocenovnih procesorjih, kar prihrani 6-krat več pomnilnika

18 april 2025, 18:27

Microsoftovi strokovnjaki so razvili jezikovni model BitNet b1.58 2B4T, ki, kljub svoji kompaktni velikosti, prinaša rezultate, primerljive z večjimi nasprotniki. Njegova ključna značilnost je sposobnost delovanja na standardnih CPU-jih brez potrebe po grafičnih pospeševalnikih. To odpira dostop do tehnologij umetne inteligence za naprave z omejenimi viri.

Namesto standardnih 16- ali 32-bitnih izračunov model uporablja poenostavljene 1-bitne operacije s tremi stanji: -1, 0 in +1. Ta pristop zmanjša porabo pomnilnika na 400MB — za primerjavo, najbližji konkurent iz Googla (Gemma 3 1B) zahteva 1.4GB. Prihranki so doseženi s temeljnim drugačnim pristopom k obdelavi podatkov: namesto zapletenih matematičnih operacij sistem temelji na optimiziranih binarnih algoritmih.

Med testiranjem je bil BitNet primerjan z modeli iz Meta (LLaMa 3.2 1B), Googla (Gemma 3 1B) in Alibabe (Qwen 2.5 1.5B). Kljub svoji manjši velikosti je Microsoftov razvoj dosegel povprečno oceno 54.19 v celovitih testih, kar presega LLaMa (44.90) in Gemma (43.74), ter le malo zaostaja za Qwen (55.23), ki zaseda 6.5-krat več pomnilnika. Pri specifičnih nalogah, povezanih z analizo besedil, je BitNet prevzel vodstvo.

Za maksimalno učinkovitost model zahteva poseben okvir bitnet.cpp, ki je na voljo v odprtem GitHub repozitoriju. Standardna orodja, kot je knjižnica Transformers, ne odklenejo v celoti njegovega potenciala. Razvijalci opažajo, da je trenutna različica optimizirana za CPU-je, vendar bodo prihodnje posodobitve dodale podporo za nevroprocesorje in GPU-je.

BitNet je primer trenda k „lahkim“ modelom umetne inteligence. Takšne rešitve zmanjšujejo porabo energije in omogočajo izvajanje zapletenih algoritmov na napravah brez dostopa do oblačnih storitev. To je še posebej pomembno za regije s počasnim internetom ali pri obdelavi zaupnih podatkov, kjer je prenos informacij v podatkovne centre nezaželen. Po besedah razvijalcev je njihov cilj narediti tehnologije umetne inteligence dostopne brez nadgradenj strojne opreme, kar bi lahko spremenilo pristop k razvoju aplikacij, ki temeljijo na umetni inteligenci.

Objava je bila prevedena Pokaži izvirnik (EN)

PC Novice Strojna oprema in tehnologije Microsoft

O avtorju

Arkadiy Andrienko

Avtor člankov in novic

Kot tehnični novinar VGTimes z enakim veseljem razpravljam o najnovejših grafičnih procesorjih in se poglabljam v podrobnosti klasičnih RPG-jev. Od leta 2018 pišem o igrah in opremi, moje izkušnje na področju avdio produkcije so mi omogočile, da dobro razumem nianse avdiotehnologij, in vedno sem v iskanju nečesa novega na področju igralne opreme. Ko ne pišem o tehnologijah, verjetno raziskujem postapokaliptične puščave v Fallout, upravljam kolonijo v RimWorld ali poveljujem armadam v Hearts of Iron IV. Zame so igre več kot le hobi — so strast, ki napaja moj ustvarjalni potencial in ohranja povezavo s stalno razvijajočim se svetom tehnologij.

...Razširi

Komentarji0