Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Asst. professor ved UIUC CS. Tidligere i Stanford DAWN-laboratoriet og Berkeley Sky Lab.
SWE-bench Verified er gullstandarden for evaluering av kodeagenter: 500 virkelige problemer + tester av OpenAI. Høres skuddsikkert ut? Bortimot.
Vi viser å bestå enhetstestene != samsvarende grunnsannhet. I ACL-artikkelen vår fikset vi buggy-vurderinger: 24 % av agentene flyttet opp eller ned på ledertavlen!
1/7

24,84K
Jeg skal presentere på postersesjon 2 på SIGMOD (onsdag 16:00 i Potsdam II). Kom og si hei!

Daniel Kang24. juni 2025
Approximate query processing (AQP) can accelerate long-running analytical queries by orders of magnitude. But why is AQP still rare in production?
To address it, we develop PilotDB, an online AQP middle that makes 0 changes to DBMSs, delivers results with a priori error guarantees, and achieves up to 126x speedup.
1/8
616
Omtrentlig spørringsbehandling (AQP) kan akselerere langvarige analytiske spørringer etter størrelsesordener. Men hvorfor er AQP fortsatt sjelden i produksjon?
For å løse det utvikler vi PilotDB, en online AQP-midte som gjør 0 endringer i DBMS-er, leverer resultater med a priori feilgarantier og oppnår opptil 126x hastighet.
1/8
1,49K
@ZhanQiusi1 vil presentere arbeidet vårt på onsdag kl. 11 plakatsesjon og lørdagens TrustNLP-workshop (spotlight talk)! Si hei hvis du ser henne

Daniel Kang13. mars 2025
AI-agenter blir stadig mer populære (f.eks. OpenAIs operatør), men kan angripes for å skade brukere!
Vi viser at selv med forsvar kan AI-agenter fortsatt bli kompromittert via indirekte raske injeksjoner via "adaptive angrep" i vår NAACL 2025-funnartikkel
🧵 og lenker nedenfor

87
Daniel Kang lagt ut på nytt
I dag kan AI generere tonnevis av kode – men hvordan vet vi om det er bra?
Derfor bygde vi Sculptor: det første miljøet for kodeagenter.
Sculptor hjelper deg med å fange opp problemer, skrive tester og forbedre koden din – alt mens du jobber i favorittredigeringsprogrammet ditt.
99,42K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til