Databricks'ten yeni araştırma. Bu, kurumsal arama ajanlarını RL yoluyla eğitmekle ilgili. KARL, ajanların heterojen arama davranışları, kısıtlama odaklı varlık arama, çapraz belge sentezi ve tablo akıl yürütme üzerinde eğitildiği çok görevli bir RL yaklaşımı sunar. Herhangi bir ölçüt için optimize edilenlerden çok daha iyi genelleştirir. KARL, hem maliyet-kalite hem de gecikme kalite dengelerinde Pareto optimaldir, Claude 4.6 ve GPT 5.2'ye kıyasla karşılaştırıldığında. Yeterli test süresi hesaplamasıyla en güçlü kapalı modelleri geride bırakır ve daha maliyet verimlidir. Makale: Akademimizde etkili yapay zeka ajanları oluşturmayı öğrenin: