DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-7,05 %

Boopa+3,46 %

PORK-5,89 %

swyx

Atinge ambiția cu intenționalitate, intensitate și integritate - @smol_ai - @dxtipshq - @sveltesociety - @aidotengineer - @coding_career - @latentspacepod

swyxCu 3 ore în urmă

Real Gell Mann Moment de amnezie 10 minute Ascultând discuția @twentyminutevc realizând că Jason Lemkin nu are nicio idee despre diferența dintre Claude API și Claude Code și își imaginează că toată lumea vibrează codificând bâjbâind bazele de date de producție ca el în a 11-a zi de codare Ce facem aici

2,44K

swyx23 iul., 12:26

Muncă incredibilă despre steganografia de aliniere de la Anthropic Fellows Am căutat o explicație straussiană a motivului pentru care China continuă să publice modele deschise din bunătatea inimii lor Dacă faceți lucruri precum utilizarea modelelor deschise pentru a vă parafraza sintetic datele la calitatea manualului, s-ar putea foarte bine să importați prejudecăți pe care nu le puteți detecta decât mult timp după ce este prea târziu. așa că dacă doriți să vă exportați sistemul de valori în restul lumii, acesta este cel mai puternic instrument Soft Power inventat de la Hollywood încoace. Pentru a fi foarte clar, nu avem nicio dovadă reală că acest lucru să motiveze niciunul dintre laboratoarele chineze. Dar această lucrare este un pas clar către o posibilă explicație.

Owain Evans23 iul., 00:06

Hârtie nouă și rezultat surprinzător. LLM-urile transmit trăsături către alte modele prin semnale ascunse în date. Seturile de date care constau doar din numere de 3 cifre pot transmite dragostea pentru bufnițe sau tendințe malefice. 🧵

41,81K

swyx23 iul., 05:10

felicitări lui Bee pentru că a fost preluat de Amazon; similar cu Blink, Ring, Eero și ofc noul Claude + Nova + Alexa, cred că @panos_panay pune împreună un al doilea act destul de solid al strategiei hardware AI a Amazon Știa că Bee câștigă când @dharmesh apărut la @latentspacepod lui legănând unul

14,29K

swyx22 iul., 13:38

motivul pentru care analiza LLM (și reglementarea și PMing) este dificilă* este ca DIMENSIUNILE relevante să continue să se miște cu fiecare generație de model de frontieră; Nu este suficient doar să puneți axa X sau Y în scara logaritmică și legile de scalare a urmăririi, trebuie să faceți de fapt munca pentru a vă gândi la modul în care modelele sunt diferite structural în 2025 vs 2024 vs 2023 și așa mai departe Exemplu toată lumea s-a concentrat pe elo timp de 2 ani, elo este jucat și își pierde credibilitatea toată lumea s-a concentrat pe prețul pe jeton timp de 3 ani, modelele de raționament au o variație de 10-40 de ori a jetoanelor de ieșire pe sarcină, prețul pe jeton își pierde sensul Colectați date cât doriți, dar dacă colectați doar serii de timp curate, puteți pierde din vedere imaginea de ansamblu *(și de ce afirmații precum "AI Engineer nu este un lucru pentru că toți inginerii software sunt ingineri AI" sunt Cope și nu vor fi niciodată corecte decât în cel mai banal sens)

Scott Huston22 iul., 08:30

Există o foaie de calcul publică cu toate modelele LLM de top de la diferite companii care arată prețurile, scorurile de referință, scorurile elo de arenă etc.?

10,02K

swyx21 iul., 07:55

încercând să găsesc tweet-ul care este de genul: Cele trei mari misiuni actuale ale omenirii sunt: - Construiește-l pe Dumnezeu - Explorează stelele - Învinge moartea Știe cineva cine a spus asta? @xai @grok mă dezamăgește

23,42K

swyx21 iul., 05:25

whoa, mulțumiri lui @tferriss pentru că a prezentat Hyperstitions of Moloch la Five Bullet Friday!

61,46K

swyx20 iul., 18:04

Voi muri pe acest deal că o1-preview este un rezumat mult mai bun decât o1 sau o3 și lumea este pe cale să piardă accesul la un model grozav care nu a fost niciodată scos în producție în mod corespunzător

16,64K

swyx a repostat

AI Engineer20 iul., 05:31

🆕 Lansăm întreaga noastră piesă RL + Reasoning! Featuring: • @willccbb, intelect primar • @GregKamradt, Premiul Arc • @natolambert, AI2/Interconexiuni • @corbtt, OpenPipe • @achowdhery, Reflecție • @ryanmart3n, personalizat • @ChrSzegedy, Metamorfoză cu atelier special de 3 ore de la: @danielhanchen de Unsloth! Începeți aici: La mulți ani de vizionare! Și mulțumesc @OpenPipeAI pentru susținerea și găzduirea acestei piese!

106,66K

swyx a repostat

dex19 iul., 23:02

Dacă, așa cum propune @sgrove, specificațiile sunt codul viitorului, atunci ce este depanarea? 1) Compilarea specificațiilor este procesul unui agent de codificare care transformă specificațiile în cod 2) din ce în ce mai multe "compilații" vor fi nesupravegheate, mai puțină urmărire a agentului lucrând diferență cu diferență, mai multe specificații înăuntru, cod de ieșire 3) Erori de tip -> erori de adevăr: Cea mai mare parte a depanării va fi săparea prin planurile de cercetare și implementare în Markdown pentru a găsi o linie de context incorect care face ca agentul de codare să nu reușească la implementare. Suitele de testare vor verifica, printre altele, adevărul și consistența logică. 4) Există o nouă aromă de ordin superior de "atașare a unui depanator de pas" care urmărește agentul implementând un plan pas cu pas pentru a identifica eroarea logică din specificații. Când găsiți o eroare când parcurgeți un program linie cu linie, schimbați codul, reporniți procesul și repetați până când funcționează. Când găsiți o eroare într-o *specificație* în timp ce parcurgeți o implementare, mergeți în amonte, remediați specificația și reporniți *implementarea*

10,27K

swyx a repostat

ARC Prize19 iul., 04:48

Ascultați @GregKamradt vorbiți despre ARC-AGI-3 cu @swyx și @FanaHOVA pe @latentspacepod * De ce benchmark-uri interactive? * Definirea inteligenței * Joacă jocurile ARC-AGI-3

10,2K

Limită superioară

Clasament

Favorite

La modă pe lanț

La modă pe X

Principalele finanțări recente

Cele mai importante