San Francisco merkezli Galileo, yapay zeka (AI) teknolojisinde yeni bir dönemi başlatıyor. Şirket, otonom sistemlerin yani AI ajanlarının hatalarını önceden tespit etmek ve işletmelerin bu sistemlere duyduğu güveni artırmak amacıyla geliştirdiği Agentic Evaluations aracını tanıttı. Şirketin CEO’su Vikram Chatterji, “Bu araç, yapay zeka sistemlerini yalnızca metin üretmekten çıkarıp, gerçek görevleri başarıyla tamamlayabilecek hale getiren bir köprüdür,” diyerek ürünün önemini vurguladı.

AI ajanları, çok aşamalı görevleri otomatikleştiren otonom sistemler olarak işletmelerde hızla yaygınlaşıyor. Ancak bu teknolojilerin güvenilirliği ve doğruluğu, işletmeler için büyük bir soru işareti yaratıyor. Galileo’nun yeni aracı, işletmelerin AI sistemlerini dağıtmadan önce güvenle test etmelerini sağlıyor.

YAPAY ZEKA AJANSLARINDA HATA TESPİTİ VE ÇÖZÜM MEKANİZMASI

Galileo’nun Agentic Evaluations aracı, üç temel aşamada işliyor: doğru araçların seçimi, araç kullanım hatalarının tespiti ve genel görev başarısının izlenmesi. Ayrıca, büyük ölçekli AI dağıtımları için maliyet ve gecikme gibi kritik metrikleri analiz ediyor. Örneğin, Cisco ve Ema gibi dev şirketler, Galileo’nun platformunu müşteri hizmetlerinden finansal analizlere kadar çeşitli alanlarda kullanarak büyük verimlilik artışı sağladı. Chatterji, bu sistemlerin, normalde bir haftada tamamlanacak işlemleri yalnızca iki gün içinde gerçekleştirebildiğini ifade etti.

Bu araç, yalnızca performans izleme sağlamakla kalmıyor, aynı zamanda işletmelerin AI ajanlarının olası hatalarını önceden tespit ederek operasyonel sorunların önüne geçiyor. Chatterji, “Birçok müşteri, sistemlerini piyasaya sürmeden önce yüksek güven standartlarına ulaşmak istiyor. Biz de bu noktada gerekli test araçlarını sunuyoruz,” dedi.

68 MİLYON DOLARLIK YATIRIM VE 2025 HEDEFLERİ

Galileo, geçtiğimiz Ekim ayında Scale Venture Partners liderliğindeki B Serisi fonlamayla 45 milyon dolar topladı ve toplam yatırımını 68 milyon dolara çıkardı. Yapay zeka operasyon araçlarının 2025 yılına kadar 4 milyar dolarlık bir pazara dönüşmesi bekleniyor.

Bununla birlikte, yapay zeka modellerinin, özellikle GPT-4 gibi ileri düzey sistemlerin bile %23 oranında yanlış bilgi üretebildiği biliniyor. Galileo, bu gibi sorunları tespit etmek ve işletmelerin üretkenliği artırmasına katkı sağlamak amacıyla güvenilir çözümler sunuyor.

Chatterji, “2025 yılı, AI ajanlarının yılı olacak. Ancak bu sistemlerin doğru test edilmeden piyasaya sürülmesi olumsuz sonuçlar doğurabilir. Bu yüzden güvenilir değerlendirme araçlarına ihtiyaç her zamankinden fazla,” diyerek bu yılın önemine dikkat çekti.

homepage-og-image.png