Çin merkezli bir yapay zekâ firması olan Moonshot AI, Kimi K2 adlı modelini tanıttı. Modelin performansı, beklentileri aşarak dört standart testten üçünde liderliği ele geçirdi. Henüz bu gelişmenin yankıları sürerken, 30 Temmuz'da Z.ai şirketi GLM 4.5 modelini sahneye çıkardı. Bu modelin hem DeepSeek’ten daha güçlü hem de daha ucuz olduğu iddia ediliyor. Çin’in bu atakları, sadece teknik değil, aynı zamanda ekonomik bir meydan okumaya da işaret ediyor.
20 Ocak’ta, ABD Başkanı Donald Trump’ın göreve başlama töreni günü tanıtılan DeepSeek modeli, %3 maliyetle ve %10 enerji tüketimiyle Batılı rakiplerini geride bırakarak büyük ilgi toplamıştı. Açık kaynaklı olarak sunulan bu sistem, Nvidia hisselerinin bir günde %17 değer kaybetmesine ve şirketin toplamda 589 milyar dolar zarara uğramasına neden olmuştu. CNBC dışında ABD ve Avrupa basını bu gelişmeleri büyük ölçüde görmezden geldi.
Ancak bu sessizlik, tehlikenin büyüklüğünü ortadan kaldırmıyor. Kimi K2, sadece cevap üretmekle kalmayıp, kendi başına araçlar kullanabilen ve çok adımlı görevleri planlayıp uygulayabilen bir yapıda geliştirildi. Bu özellikleriyle dijital bir temsilci gibi hareket edebiliyor.
BATI SESSİZ, ÇİNLİ MODELLER İLERLİYOR
Kimi K2’nin başarısı, MoE yani "Mixture of Experts" adı verilen mimariye dayanıyor. Bu yaklaşım, her biri farklı alanda uzmanlaşmış 384 mini modelin, bir router sistemi aracılığıyla görev bazlı olarak devreye girmesiyle çalışıyor. NYU Hukuk Fakültesi’nde görevli Winston Ma’ya göre, “Kimi, ajan tabanlı yapay zekâda bir paradigma değişimini temsil ediyor.” Ona göre bu model, önceki büyük dil modellerinde eksik olan uzman düzeyinde otonom düşünme kabiliyetini gösteriyor.
Fiyat rekabeti açısından da Çinli modeller iddialı. Kimi K2’nin internet sitesinde yer alan bilgilere göre, Claude adlı modele kıyasla veri girişi için 100 kat, çıktı içinse 30 kat daha az ücret talep ediliyor. Bu rakamlar, yalnızca performansla değil, erişilebilirlikle de üstünlük kurulduğunu gösteriyor.
ABD merkezli OpenAI’nin CEO’su Sam Altman, Kimi K2’nin tanıtımından bir gün sonra, ChatGPT’nin uzun süredir beklenen açık sürümünün bir kez daha ertelendiğini açıkladı. Gerekçe olarak “ek güvenlik testleri ve yüksek riskli alanların gözden geçirilmesi gerektiği” belirtildi.
Çin’in bu hamleleri, artık rastlantı değil, sistematik bir yarışın sonucu. ABD'li yapay zekâ yazarı Nathan Lambert'in ifadesiyle: “İlk DeepSeek anı bizi uyandırmadıysa, umarım üçüncüye gerek kalmaz.”