Nova pesquisa da Databricks. É sobre o treinamento de agentes de busca empresarial via RL. O KARL introduz uma abordagem de RL multi-tarefa onde os agentes são treinados em comportamentos de busca heterogêneos, busca de entidades orientada por restrições, síntese entre documentos e raciocínio tabular. Ele generaliza substancialmente melhor do que aqueles otimizados para qualquer benchmark único. O KARL é Pareto-ótimo tanto em trade-offs de custo-qualidade quanto de latência-qualidade em comparação com o Claude 4.6 e o GPT 5.2. Com computação suficiente em tempo de teste, ele supera os modelos fechados mais fortes enquanto é mais eficiente em termos de custo. Artigo: Aprenda a construir agentes de IA eficazes em nossa academia: