Çin merkezli teknoloji devi Alibaba, Qwen3 adını verdiği yeni büyük dil modeli ailesini duyurdu. Şirketin açıklamasına göre bu modeller, hem çözümleme hem de hızlı yanıt verme yeteneklerini bir arada sunan “hibrit” yapıda tasarlandı. Toplamda sekiz modelden oluşan seri, 0.6 milyar parametreden 235 milyar parametreye kadar ölçeklenebiliyor. Bu parametre sayıları, modellerin problem çözme kapasitesine doğrudan etki ediyor.
Alibaba, Metaverse yatırımlarını azaltıyor
HİBRİT MİMARİ VE MoE DESTEĞİ
Qwen3 ailesinde yer alan bazı modeller, MoE yani "uzman karışımı" mimarisi kullanıyor. Bu yapı, görevleri daha küçük alt görevlere ayırarak bunları özel uzman modellere yönlendiriyor. Sonuç olarak daha az hesaplama gücüyle daha yüksek verimlilik sağlanıyor. Alibaba, hibrit tasarım sayesinde kullanıcıların modelin düşünme süresini kendi ihtiyaçlarına göre ayarlayabileceklerini belirtiyor.
Blog gönderisinde yapılan açıklamada, “Düşünen ve düşünmeyen modları sorunsuz şekilde entegre ettik. Bu yapı, görev bazlı bütçelemede esneklik sağlıyor” ifadelerine yer verildi.
36 TRİLYON TOKEN İLE EĞİTİLDİ
Alibaba'nın Qwen3 modelleri 119 dili destekliyor. Bu çok dilli yapı, 36 trilyon token içeren devasa bir veri kümesi üzerinde eğitildi. Kullanılan veri kaynakları arasında ders kitapları, soru-cevap eşleşmeleri, kod parçaları ve AI üretimi içerikler yer alıyor. Bu geniş çaplı eğitim süreci, Qwen2’ye göre ciddi bir performans artışı sağladı.
Veri merkezindeki yangın Alibaba'yı vurdu
DİKKAT ÇEKEN SONUÇLAR
Qwen3-235B-A22B modeli, kodlama platformu Codeforces üzerinde OpenAI’nin o3-mini modelini ve Google’ın Gemini 2.5 Pro modelini geride bırakmayı başardı. Aynı model, zorlu matematik testi AIME ve problem çözümleme becerilerini ölçen BFCL’de de öne çıkıyor. Ancak bu model şu an için kamuya açık olarak sunulmadı.
Halihazırda erişime açık olan en büyük model olan Qwen3-32B ise, birçok kapalı ve açık kaynak modele karşı rekabetçi bir performans sergiliyor. OpenAI’nin o1 modelini LiveCodeBench gibi kodlama testlerinde geride bırakıyor.
Çin'in yapay zeka destekli sansür makinesi ortaya çıktı
QWEN3’ÜN GÜÇLÜ YÖNLERİ NELER?
Alibaba, Qwen3 modellerinin araç çağırma, komutları izleme ve veri formatlarını doğru şekilde taklit etme gibi görevlerde “üstün” olduğunu belirtiyor. Ayrıca Qwen3 modelleri yalnızca indirme yoluyla değil, aynı zamanda Fireworks AI ve Hyperbolic gibi bulut sağlayıcılar üzerinden de erişilebilir durumda.
Baseten CEO’su Tuhin Srivastava, Qwen3’ün açık kaynak modellerin kapalı sistemlerle rekabet gücünü bir kez daha gösterdiğini ifade ederek şunları söyledi:
Amerika Birleşik Devletleri, Çin’e çip satışlarını kısıtlarken Çin’de geliştirilen Qwen3 gibi modeller, ülkede yaygın şekilde kullanılmaya devam edecek. Bu durum, şirketlerin kendi araçlarını geliştirme ile dış kaynaklardan satın alma stratejilerini birlikte yürüttüğünü yansıtıyor.
Kader mi suikast mı? Çin'de yapay zekâ uzmanları tek tek ölüyor
ÇİN İLE BATI ARASINDAKİ YAPAY ZEKA REKABETİ DERİNLEŞİYOR
Qwen3 gibi Çin menşeli modellerin yükselişi, OpenAI ve benzeri Amerikan laboratuvarları üzerinde baskı oluşturuyor. Bu gelişmeler, Batı'da çip erişimini kısıtlayan yasal düzenlemelerin artmasına neden oldu. Çinli şirketlerin ileri düzey yapay zeka modellerini eğitmek için gerekli donanıma ulaşmaları bu nedenle gittikçe zorlaşıyor.
Ancak Alibaba’nın Qwen3 hamlesi, teknoloji yarışında Çin’in elini bir kez daha güçlendirmişe benziyor. Açık lisanslı olarak sunulan ve GitHub ile Hugging Face üzerinden geliştiricilere ulaştırılan bu modeller, özellikle yazılım geliştirme ve çok dilli etkileşim alanlarında önemli bir etki yaratabilir.
Qwen3'ün kamuya açık sürümleriyle sınırlı kalıp kalmayacağı veya daha büyük modellerin ne zaman açılacağı henüz netlik kazanmasa da, küresel yapay zeka rekabetinde artık yalnızca birkaç Amerikan şirketinin adı anılmıyor. Çin, teknolojik inovasyonda hız kesmeden ilerliyor.