MacroScope

Büyük dil modeli eğitimindeki tekelleşmenin başlıca nedenlerinden birinin ileri seviye GPU’lara erişim. Buna karşın, son dönemde, özellikle DeepSeek üzerinden, Çinli şirketlerin daha düşük maliyetle yetkin modeller eğitebildiği iddiası öne çıktı. Çin’in düşük maliyetli yapay zeka iddiası ne kadar gerçek?

Önce bir yanlış okumayı ayıklamak gerek. DeepSeek’in V3 modelini “5,6 milyon dolara” eğittiği iddiası yalnızca son eğitim koşusundaki GPU kullanım maliyetini gösteriyor. Ar-Ge giderleri, başarısız denemeler, veri hazırlığı, personel, veri merkezi yatırımları, enerji, ağ altyapısı ve önceki mimari iterasyonlar bu hesaba dahil değil. Dolayısıyla burada gördüğümüz şey tam yaşam döngüsü maliyeti değil, dar tanımlı bir maliyet kalemi.

Ama mesele yalnızca muhasebe oyunu da değil. Çinli şirketler verimlilik kazanımları sağladı. “Mixture of Experts” (MoE) mimarileri, “8-bit Floating Point” (FP8) eğitim, “Multi-head Latent Attention” (MLA) ve iletişim optimizasyonu gibi yöntemler, model eğitimi için gereken işlem gücünü ve donanım yükünü azaltıyor. Donanım kısıtları altında geliştirilen bu çözümler, aynı işi daha az aktif parametreyle, daha düşük bellek baskısıyla ve daha sınırlı eğitim maliyetiyle yapmayı mümkün kılıyor. Bu yüzden Çin örneğinde iki durum aynı anda geçerli. Maliyet raporlaması eksik, mühendislik tarafındaki ilerleme ise gerçek.

ABD’nin ihracat kontrolleri de bu gelişmelerde etkili olmuş gibi görünüyor. NVIDIA H100 yerine, ara bağlantı kapasitesi daha sınırlı H800 gibi çiplerle çalışmak zorunda kalan ekipler, kaba ölçek büyütme yerine optimizasyona yönelmiş. Bu baskı bazı alanlarda teknik yenilik üretmiş.

Çin’in elinde büyük bir donanım stoğu, iç pazar ve güçlü devlet desteği var. Çinli modellerin ucuz görünmesi sadece teknik verimlilikten kaynaklanmıyor. Mühendis ücretleri ABD’ye göre daha düşük. Veri merkezi inşaatı daha ucuz. Enerji ve hesaplama teşvikleri daha yaygın. Büyük platform şirketleri yapay zeka hizmetlerini çapraz sübvanse edebiliyor. Bu nedenle düşük API fiyatları her zaman kalıcı bir maliyet üstünlüğünü değil, bilinçli bir pazar kapma stratejisini yansıtıyor.

Özet olarak, GenAI alanındaki tekeli kırmanın bir yolu model eğitim maliyetini düşüren mimari yenilikler, düşük işgücü maliyetleri, devlet destekleri ve agresif fiyatlamadan gelebilir. Eğitilmiş model dosyalarının paylaşılması, yeni ekiplerin sıfırdan model kurmak yerine mevcut modelleri uyarlayarak daha düşük maliyetle ilerlemesini sağlıyor.

Çin, maliyeti teknik, ticari ve politik araçlarla aşağı çekmeye çalışıyor. Bu yaklaşım henüz GenAI oligopolünü bütünüyle dağıtamamış olsa da, çip tekeli altındaki rekabetin zeminini değiştiriyor.

Tags:

No responses yet

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir