Cercetări noi de la Databricks. Este vorba despre instruirea agenților de căutare enterprise prin RL. KARL introduce o abordare RL multi-task, în care agenții sunt antrenați prin comportamente de căutare eterogene, căutare de entități bazată pe constrângeri, sinteză între documente și raționament tabelar. Se generalizează mult mai bine decât cele optimizate pentru orice benchmark individual. KARL este optim Pareto atât în ceea ce privește compromisurile cost-calitate, cât și latență-calitate, comparativ cu Claude 4.6 și GPT 5.2. Cu un calcul suficient în timpul testului, depășește cele mai puternice modele închise, fiind totodată mai eficiente din punct de vedere al costurilor. Hârtie: Învață să construiești agenți AI eficienți în academia noastră: