Новое исследование от Databricks. Оно посвящено обучению корпоративных поисковых агентов с помощью RL. KARL представляет собой подход многозадачного RL, где агенты обучаются на основе гетерогенных поисковых поведений, поиска сущностей с ограничениями, синтеза между документами и табличного рассуждения. Он значительно лучше обобщает, чем те, которые оптимизированы для какой-либо одной контрольной точки. KARL является парето-оптимальным как по соотношению стоимость-качество, так и по соотношению задержка-качество по сравнению с Claude 4.6 и GPT 5.2. При достаточных вычислительных мощностях во время тестирования он превосходит самые сильные закрытые модели, оставаясь более экономичным. Статья: Научитесь создавать эффективных AI-агентов в нашей академии: