DeepSeek, yeni modeli V3.2-Exp ile uzun metin yazılımında maliyetleri yarı yarıya düşürdü

Çinli yapay zeka girişimi DeepSeek, V3.2-Exp adını verdiği yeni deneysel modelini tanıttı. Şirket bu modelin “DeepSeek Sparse Attention (DSA)” diye adlandırdığı mekanizmayla, geniş bağlamlı metin işleme süreçlerinde önemli ölçüde maliyet düşürücü etkiler sunduğunu belirtti. DeepSeek tarafından yapılan duyuruda yeni modelin açık kaynak (open-weight) olduğunun altı çizilerek dünya çapındaki geliştiricilerin erişimine açıldığı bildirildi.

Açık kaynak nedir?

Yeni modelin temel özelliği, bağlam penceresindeki tüm veriyi işlemek yerine “lightning indexer” adı verilen bir modülle önemli pasajları seçmeye odaklanarak, “fine-grained token selection” modülüyle bu pasajlardaki kritik unsurları belirleyerek sınırlı dikkat penceresine yüklemesi olarak tanımlanıyor. Bu yaklaşım, geleneksel dikkat (attention) mekanizmalarının işlem yükünü azaltmayı amaçlıyor. DeepSeek’e göre bu sayede basit bir API çağrısının maliyeti uzun metinlerde yarı yarıya düşürülmüş durumda.

Çin’in yeni DeepSeek hamlesiyle yer yerinden oynadı

Firma yetkilileri, V3.2-Exp’in V3.1-Terminus ile aynı çıktı kalitesini koruyarak benzer benchmark performansı sergilediğini, ancak işlem verimliliğini ciddi oranda artırdığını söylüyor. DeepSeek ayrıca API fiyatlarını %50’nin üzerinde indirdiğini, kullanıcıların güncel fiyat avantajından yararlanabileceğini açıkladı. Şirketin resmi duyurularına göre bu sürüm hem uygulama hem web hem de API katmanında aktif durumda.

Tencent, DeepSeek'i tahtından etti

DeepSeek’in V3.2-Exp hamlesi, şirketin daha önceki R1 modeliyle oluşturduğu ivmeyi sürdürme çabasının bir parçası. R1, hem açık kaynak kodlu olması hem de düşük maliyetle yüksek performans sunmasıyla dikkat çekmişti.

R1’in politik içerikli konularda filtreleme ya da sansür uyguladığına dair analizler de yapılmış durumda. Bir araştırmaya göre R1, Çin hükümeti açısından hassas konulara ilişkin soruların %85’ine cevap vermeyi reddediyor. Bu tür modellerinin kaynak kod seviyesinde gömülü olabileceğine dair analizler de bulunmakta. Başka bir güvenlik çalışması, DeepSeek modellerinin zararlı yönlendirmelere karşı savunmasız kalabildiğini, R1’in bazı durumlarda %100 saldırı başarısı gösterdiğini bildiriyor.

DeepSeek R1: Çin’den dünyayı şaşırtan yapay zeka hamlesi

DeepSeek’in arka plandaki donanım stratejisi de tartışma konusu. Şirket, R1 eğitiminde NVIDIA GPU’larını yoğun şekilde kullandıktan sonra, devlet baskısıyla Huawei’in Ascend donanımına geçiş yapmaya çalıştı. Bu girişim, teknik zorluklar nedeniyle tam başarılı olamadı ve eğitim yeniden NVIDIA altyapısına taşındı, yalnızca çıkarım aşamasında Ascend donanımı kullanılması planlandı.

DeepSeek ile Çin askeri bağlantıları, NVIDIA’nın gelişmiş H100 GPU’larına erişim iddialarıyla birlikte sektörde tartışma yarattı.

Uluslararası alanda DeepSeek’in yükselişi, yapay zeka alanındaki güç dengelerinde etkili olabilir. Reuters, firmanın V3.2-Exp sürümünü “ara adım” olarak tanımlarken, bu modelin ABD’li ve Çinli rakipleri üzerinde baskı kurma potansiyeli taşıdığını belirtiyor. Reuters CSIS analizine göre bu gelişme AI yarışı bağlamında ABD-Çin arasındaki farkın önceki kadar geniş olmadığını gösterirken, ihracat kontrol rejimlerinin de yeniden düşünülmesi gerektiğini vurguluyor.

DeepSeek, V3 ve R1 modelleriyle elde ettiği teorik maliyet-kâr oranlarını paylaşarak günlük %545’e varan kar iddialarında bulunmuştu.

DeepSeek’in yeni modeli, özellikle uzun metin işleme gereken uygulamalarda maliyet baskısını hafifletebilir; bu da AI sağlayıcıları arasında fiyat rekabetini artırabilir. Ancak modelin güvenlik açıkları, sansür potansiyeli ve donanım bağımlılığı gibi yönleri henüz tam olarak netlik kazanmış değil. Gelecekte yapılacak bağımsız testler ve kullanıcı deneyimleri, V3.2-Exp’in vaatlerini doğrulama açısından kritik olacak.

DeepSeek, yeni modeli V3.2-Exp ile uzun metin yazılımında maliyetleri yarı yarıya düşürdü

Çin merkezli DeepSeek, V3.2-Exp modeliyle “sparse attention” adlı "seyrek odaklanma" yaklaşımıyla hayata geçirerek API maliyetlerini uzun metin işlemlerinde yarıya varan oranda düşürdüğünü açıkladı.