Nueva investigación de Databricks. Se trata de entrenar agentes de búsqueda empresarial a través de RL. KARL introduce un enfoque de RL multitarea donde los agentes son entrenados en comportamientos de búsqueda heterogéneos, búsqueda de entidades impulsada por restricciones, síntesis entre documentos y razonamiento tabular. Se generaliza sustancialmente mejor que aquellos optimizados para cualquier único punto de referencia. KARL es óptimo de Pareto en las compensaciones de costo-calidad y latencia-calidad en comparación con Claude 4.6 y GPT 5.2. Con suficiente capacidad de cómputo en tiempo de prueba, supera a los modelos cerrados más fuertes mientras es más eficiente en costos. Artículo: Aprende a construir agentes de IA efectivos en nuestra academia: