DeepSeek a anunțat că va menține permanent o reducere semnificativă pentru modelul său emblematic V4-Pro, menținând prețurile pentru dezvoltatori la un sfert din nivelul inițial.
Reducere 75% pentru modelul DeepSeek V4-Pro
Într-o declarație de pe site-ul său, DeepSeek a indicat că va menține reducerea de 75% la prețul V4-Pro, care inițial trebuia să expire la sfârșitul lunii mai. Această mișcare este menită să intensifice concurența în industria inteligenței artificiale, deoarece firmele chineze concurează direct cu rivalii lor americani și europeni la nivel global.
Prețurile încep de la doar 0,025 yuani per milion de tokenuri pentru datele de intrare stocate în cache, crescând la 3 yuani pentru datele de intrare nestocate în cache și 6 yuani pentru cele de ieșire, conform comunicatului.
Prin asigurarea unor costuri mai mici, DeepSeek își consolidează atractivitatea pe o piață din ce în ce mai aglomerată, unde companiile au redus prețurile API-urilor pentru a atrage dezvoltatori și utilizatori enterprise.
O reducere permanentă de 75% din preț nu reprezintă doar o simplă strategie de vânzare rapidă, ci chair o declarație de forță în ceea ce privește modelul de afaceri al companiei, totul fiind susținut de piloni tehnologici și financiari solizi.
La baza acestei sustenabilități se află, în primul rând, eficiența remarcabilă a arhitecturii MoE. Modelul V4 utilizează o structură dispersă de tip Mixture-of-Experts cu un total impresionant de 1,6 trilioane de parametri, însă simplitatea sistemului constă în faptul că activează doar o mică parte din această rețea uriașă pentru fiecare token procesat. Prin urmare, costul inferenței este strâns legat doar de parametrii activi în acel moment, nu de volumul total al rețelei, optimizând masiv resursele consumate.
Acestui avantaj i se alătură un mecanism inovator de atenție comprimată, livrat direct cu versiunea V4. Această tehnologie reduce dramatic presiunea exercitată asupra memoriei KV-cache, care reprezintă în mod tradițional costul dominant și cel mai problematic în cazul inferențelor ce implică un context lung.
În plus, strategia este completată de o stocare în cache extrem de agresivă a prefixelor. Noua rată de intrare în cache, redusă la doar 0,0036 dolari pentru un milion de tokeni, reprezintă o prăbușire de aproximativ 99,8% comparativ cu o introducere proaspătă de date. Această schimbare radicală transformă fluxurile de lucru agentice, sistemele de tip RAG și solicitările lungi de sistem în procese aproape gratuite pe partea de input, fiind exact pârghia care trage prețul mixt în jos până la valoarea remarcabilă de 0,18 dolari.
Dincolo de aceste salturi tehnologice brute, stabilitatea pe termen lung a acestui ecosistem este garantată și din punct de vedere financiar. Compania a primit o rundă masivă de finanțare de 10 miliarde de dolari, astfel că dispune în prezent atât de capitalul necesar, cât și de avantajul arhitectural crucial pentru a susține fără probleme presiunea prețurilor la cel mai înalt nivel al pieței.