Нове дослідження від Databricks. Йдеться про навчання агентів корпоративного пошуку через RL. KARL впроваджує багатозадачний підхід RL, де агенти навчаються гетерогенним пошуковим поведінкам, пошуку сутностей на основі обмежень, синтезу між документами та табличному мисленню. Він узагальнює значно краще, ніж ті, що оптимізовані для будь-якого конкретного бенчмарку. KARL є парето-оптимальним як у співвідношенні вартості та якості, так і за затримкою порівняно з Claude 4.6 та GPT 5.2. Завдяки достатньому обчисленню за час тестування він перевершує найміцніші закриті моделі та є більш економічно ефективним. Стаття: Навчіться створювати ефективних агентів ШІ в нашій академії: