Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Доцент UIUC CS. Раніше працював у Стенфордській лабораторії DAWN та Berkeley Sky Lab.
SWE-bench Verified – це золотий стандарт оцінки кодуючих агентів: 500 реальних проблем + тести від OpenAI. Звучить куленепробивно? Не зовсім.
Ми показуємо проходження його одиничних тестів != відповідну правду. У нашому документі ACL ми виправили помилки: 24% агентів перемістилися вгору або вниз по таблиці лідерів!
1/7

24,89K
Навчання з підкріпленням дозволяє LLM перемагати людей на змаганнях з програмування/математики та є рушійною силою останніх досягнень (o-серія OpenAI, Claude 4 від Anthropic)
Чи дозволить РЛ здійснювати широке узагальнення так само, як це робить попередня підготовка? Не з сучасними технологіями
🧵 1/7
2,61K
Я буду виступати на постерній сесії 2 в SIGMOD (середа 16:00 в Потсдамі II). Приходьте привітатися!

Daniel Kang24 черв. 2025 р.
Approximate query processing (AQP) може прискорити виконання довгострокових аналітичних запитів на порядки. Але чому AQP все ще рідко зустрічається у виробництві?
Щоб вирішити цю проблему, ми розробляємо PilotDB, онлайн-середовище AQP, яке вносить 0 змін до СУБД, видає результати з апріорними гарантіями помилок і досягає прискорення до 126x.
1/8
679
Approximate query processing (AQP) може прискорити виконання довгострокових аналітичних запитів на порядки. Але чому AQP все ще рідко зустрічається у виробництві?
Щоб вирішити цю проблему, ми розробляємо PilotDB, онлайн-середовище AQP, яке вносить 0 змін до СУБД, видає результати з апріорними гарантіями помилок і досягає прискорення до 126x.
1/8
1,55K
@ZhanQiusi1 представимо нашу роботу на постерній сесії в середу об 11 годині ранку та на суботньому семінарі TrustNLP (spotlight talk)! Привітайся, якщо побачиш її

Daniel Kang13 бер. 2025 р.
Агенти штучного інтелекту стають все більш популярними (наприклад, оператор OpenAI), але можуть бути атаковані, щоб завдати шкоди користувачам!
Ми показуємо, що навіть за умови захисту агенти штучного інтелекту все ще можуть бути скомпрометовані за допомогою непрямих швидких ін'єкцій за допомогою «адаптивних атак» у нашому документі NAACL 2025
🧵 та посилання нижче

134
Інженери з обробки даних витрачають понад 60% свого часу на конвеєри даних. Чи можуть агенти штучного інтелекту допомогти?
Представляємо ELT-Bench, перший бенчмарк, який оцінює агентів штучного інтелекту на побудові наскрізних конвеєрів ELT. Нинішні агенти SOTA досягають лише 3,9% успіху - це величезний шлях, який потрібно пройти!
1/7

4,03K
Користувач Daniel Kang поділився
Сьогодні штучний інтелект може генерувати тонни коду, але як ми знаємо, що він хороший?
Ось чому ми створили Sculptor: перше середовище кодувального агента.
Sculptor допомагає вам виявляти проблеми, писати тести та вдосконалювати код — і все це під час роботи в улюбленому редакторі.
99,44K
Агенти штучного інтелекту стають все більш популярними (наприклад, оператор OpenAI), але можуть бути атаковані, щоб завдати шкоди користувачам!
Ми показуємо, що навіть за умови захисту агенти штучного інтелекту все ще можуть бути скомпрометовані за допомогою непрямих швидких ін'єкцій за допомогою «адаптивних атак» у нашому документі NAACL 2025
🧵 та посилання нижче

4,19K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги