Charlie b23 schreef op 1 maart 2025 21:38:
De Chinese AI-startup DeepSeek heeft zaterdag een aantal kosten- en inkomstengegevens bekendgemaakt met betrekking tot haar succesvolle V3- en R1-modellen, en claimt een theoretische kosten-batenverhouding van wel 545% per dag, hoewel ze waarschuwde dat de werkelijke inkomsten aanzienlijk lager zouden zijn.
Dit is de eerste keer dat het in Hangzhou gevestigde bedrijf informatie heeft vrijgegeven over de winstmarges van minder rekenintensieve "inferentietaken", de fase na de training waarbij opgeleide AI-modellen voorspellingen doen of taken uitvoeren, zoals via chatbots.
De onthulling kan de AI-aandelen buiten China, die in januari kelderden nadat chatbots op het web en in apps die worden aangestuurd door de R1- en V3-modellen, wereldwijd sterk in populariteit toenamen, verder door elkaar schudden.
De verkoopgolf werd gedeeltelijk veroorzaakt door de beweringen van DeepSeek dat het minder dan $6 miljoen heeft uitgegeven aan chips om het model te trainen, veel minder dan wat Amerikaanse rivalen zoals OpenAI hebben uitgegeven.
De chips die DeepSeek beweert te hebben gebruikt, de H800 van Nvidia, zijn ook veel minder krachtig dan waar OpenAI en andere Amerikaanse AI-firma's toegang toe hebben, waardoor investeerders nog meer vraagtekens zetten bij de beloften van Amerikaanse AI-firma's om miljarden dollars te spenderen aan geavanceerde chips.
DeepSeek zei in een GitHub-post die op zaterdag werd gepubliceerd dat, ervan uitgaande dat de kosten voor het huren van een H800-chip $2 per uur bedragen, de totale dagelijkse inferentiekosten voor haar V3- en R1-modellen $87.072 bedragen. Daarentegen bedragen de theoretische dagelijkse inkomsten die deze modellen genereren $562.027, wat leidt tot een kosten-batenverhouding van 545%. In een jaar tijd zou dit neerkomen op iets meer dan $200 miljoen aan inkomsten.
Het bedrijf voegde er echter aan toe dat de "werkelijke inkomsten aanzienlijk lager zijn" omdat de kosten van het gebruik van het V3-model lager zijn dan die van het R1-model, omdat slechts enkele diensten te gelde worden gemaakt omdat web- en app-toegang gratis blijven, en omdat ontwikkelaars minder betalen tijdens daluren.