Çinli yapay zekâ geliştiricisi DeepSeek, akıl yürütme odaklı R1 modelinin eğitim maliyetini 294 bin dolar olarak açıkladı. Şirketin bugüne kadarki ilk resmi maliyet tahmini, Nature’da yayımlanan hakemli bir makalede yer aldı. Çalışmaya göre R1, 512 adet Nvidia H800 hızlandırıcıdan oluşan bir kümede toplam 80 saat eğitildi; DeepSeek ayrıca ilk kez, hazırlık aşamalarında A100 GPU’larını kullandığını ek bilgi dosyasında doğruladı. Bu veriler, ABD ihracat kısıtları nedeniyle H100/A100 yerine H800’ün Çin pazarı için geliştirildiği dönemin koşullarıyla da örtüşüyor.
DeepSeek’in Ocak 2025’te “düşük maliyetli” modellerini duyurması, Wall Street’te sert satışları tetiklemiş; Nasdaq belirgin gerilerken özellikle yapay zekâ tedarik zinciri hisselerinde günlük rekor kayıplar görülmüştü. Bir gün sonra teknoloji hisseleri kısmen toparlansa da, bu dalga DeepSeek’in maliyet/performans iddiasının piyasa algısı üzerindeki etkisini göstermişti. Analizlerde, Nvidia ve veri merkezi ekosistemindeki düşüş ve ardından gelen tepki alımlarının altı çizilmişti.
Açıklanan rakam, büyük ABD modellerinde görülen eğitim bütçeleriyle keskin bir tezat oluşturuyor. OpenAI CEO’su Sam Altman, 2023’te temel modellerin eğitim maliyetinin “100 milyon doların çok üzerinde” olduğunu belirtmişti. Eğitim maliyeti; haftalar-aylar boyunca büyük model kümelerinin çalıştırılması, veri işleme ve optimizasyon için gereken donanım/sarf giderlerini kapsıyor.
Donanım tarafında ise tartışma sürüyor. ABD’li yetkililer, DeepSeek’in ihracat kontrollerine rağmen sınırlı da olsa H100erişimine sahip olabileceğini öne sürerken, Nvidia, şirketin “hukuka uygun şekilde temin edilmiş H800 kullandığını” vurguluyor. DeepSeek’in Nature makalesi ve eki, hazırlık safhasında A100, ana eğitiminse H800 kümesinde yapıldığını belirterek tabloyu kısmen netleştiriyor.
Metodoloji cephesinde de dikkat çeken bir nokta var: DeepSeek, Nature çalışmasında V3 hattının eğitim verilerinin web kazıması üzerinden oluşturulduğunu; bu sayfalarda OpenAI üretimi yanıtların “dolaylı ve kasıtsız” biçimde bulunmuş olabileceğini belirtiyor. Bilimsel değerlendirmelerde, bunun sektörde yaygın bir durum olduğu; ancak distillasyon/öğrenme süreçlerinin sınırlarının şeffaflıkla tanımlanması gerektiği vurgulanıyor.
Özetle, DeepSeek’in açıkladığı 294 bin $ seviyesi; veri seçimi, mimari verimlilik ve donanım/algoritma birlikte optimizasyonu sayesinde eğitim maliyetlerinin dramatik biçimde düşürülebileceğini iddia ediyor. Bu iddia doğru ölçeklerde tekrarlanırsa, hem değerleme anlatılarında hem de hesaplama tedarik stratejilerinde baskı yaratabilir. Piyasa, bundan sonraki aşamada bağımsız kıyaslamalar, çoğaltılabilirlik ve uzun vadeli hizmet maliyetleri(çıkarım/enerji) gibi metriklere bakacak. DeepSeek cephesi için kritik soru, R1’in maliyet avantajını ürün olgunluğu ve güvenilirlik standartlarını koruyarak sürdürülebilir kılıp kılmayacağı olacak.