DeepSeek atacă piața AI cu modelul V4:…

DeepSeek, gigantul tehnologic chinez, se pregătește să lanseze o nouă generație de model de inteligență artificială, V4, promițând un salt semnificativ în performanță. Debutul este așteptat spre finalul lunii aprilie, marcând o etapă importantă în dezvoltarea tehnologiilor AI în China. Această lansare vine într-un context internațional tensionat, cu accent pe autonomia tehnologică și competiția acerbă în domeniul inteligenței artificiale.

O arhitectură revoluționară Mixture-of-Experts

Unul dintre aspectele cele mai discutate ale noului model este dimensiunea sa impresionantă. DeepSeek V4 ar putea integra aproximativ un trilion de parametri, plasându-l în categoria celor mai avansate modele existente. Folosirea unei arhitecturi de tip Mixture-of-Experts (MoE) reprezintă o strategie cheie pentru optimizarea resurselor. Această abordare permite activarea doar a unei părți din parametri pentru fiecare sarcină, menținând costurile de operare la un nivel controlat, în timp ce se obțin performanțe ridicate.

Prin activarea a aproximativ 32-37 de miliarde de parametri pentru fiecare operațiune, modelul reușește să combine dimensiunea mare cu eficiența. Această strategie permite extinderea capacităților fără o creștere proporțională a resurselor necesare pentru rulare. Conceptul nu este nou, însă V4 duce această abordare la un nivel superior, atât din punct de vedere al dimensiunii, cât și al optimizării. Un alt aspect important îl reprezintă capacitatea extinsă de procesare a contextului.

Implicații strategice și dependența de tehnologie internă

Un element esențial al acestui proiect îl reprezintă utilizarea procesoarelor dezvoltate de Huawei, din gama Ascend. Această decizie reflectă o orientare strategică către dezvoltarea unui ecosistem tehnologic independent. Alegerea de a colabora cu furnizori locali, în detrimentul unor companii precum NVIDIA sau AMD, sugerează o schimbare de direcție în industria AI din China. De asemenea, se discută despre posibilitatea ca modelul să suporte un context de până la un milion de tokeni, deși specificațiile exacte nu au fost încă confirmate oficial. Cercetările companiei în domeniul memoriei condiționale indică o orientare clară către modele capabile să gestioneze volume mari de informații într-o singură interacțiune.

Cu toate că lansarea ar putea înregistra întârzieri, testele unei versiuni preliminare, V4-Lite, sugerează că debutul complet este iminent. Industria urmărește cu atenție acest moment, având în vedere impactul semnificativ pe care l-au avut modelele anterioare DeepSeek. Din punct de vedere strategic, DeepSeek V4 ar putea reprezenta un punct de referință. Combinația dintre performanța ridicată, eficiența și independența față de furnizorii occidentali ar putea influența direcția întregii industrii.

Potrivit informațiilor disponibile, lansarea modelului V4 este programată pentru luna aprilie, dar o dată exactă nu a fost încă anunțată.

Sursa: Go4IT