Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
Uppnå ambition med avsiktlighet, intensitet och integritet
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
Real Gell Mann Amnesia Moment 10 minuter Lyssna på den @twentyminutevc diskussionen inser att Jason Lemkin inte har någon aning om skillnaden mellan Claude API och Claude Code och föreställer sig att alla är vibe kodning runt fumliga produktionsdatabaser som honom på sin 11: e dag av kodning
vad gör vi ens här


4,04K
Otroligt arbete med Alignment Steganografi från Anthropic-stipendiater
Jag har letat efter en straussiansk förklaring till varför Kina fortsätter att publicera öppna modeller av hjärtans godhet
Om du gör saker som att använda öppna modeller för att, IDK, rensa *ahem* syntetiskt parafrasera dina data till lärobokskvalitet kan du mycket väl importera fördomar som du inte kan upptäcka förrän långt efter att det är för sent.
så om du vill exportera ditt värdesystem till resten av världen är detta det mest kraftfulla Soft Power-verktyget som uppfunnits sedan Hollywood.
För att vara supertydlig har vi inga faktiska bevis för att detta motiverar något av de kinesiska laboratorierna. Men den här uppsatsen är ett tydligt steg mot en möjlig förklaring.


Owain Evans23 juli 00:06
Nytt papper och överraskande resultat.
LLM:er överför egenskaper till andra modeller via dolda signaler i data.
Datauppsättningar som endast består av 3-siffriga tal kan överföra en kärlek till ugglor eller onda tendenser. 🧵

42,73K
grattis till Bee för att ha blivit upplockad av Amazon; i likhet med Blink, Ring, Eero och ofc den nya Claude + Nova + Alexa tror jag att @panos_panay sätter ihop en ganska solid andra akt av Amazons AI-hårdvarustrategi
visste att Bee höll på att vinna när @dharmesh dök upp till hans @latentspacepod och rockade en

14,29K
anledningen till att llm-analys (och reglering och PMing) är svårt*
är att de relevanta DIMENSIONERNA fortsätter att röra sig med varje generation av frontier-modellen; Det räcker inte att bara placera din X- eller Y-axel i logaritmisk skala och spåra skalningslagar, du måste faktiskt göra jobbet för att tänka på hur modeller är strukturellt olika 2025 vs 2024 vs 2023 och så vidare
T.ex
Alla fokuserade på Elo i 2 år, Elo blir spelad och förlorar trovärdighet
Alla fokuserade på pris per token i 3 år, resonemangsmodeller har 10-40x variation i utdata tokens per uppgift, pris per token förlorar mening
Samla in data så mycket du vill, men om du bara samlar in orörda tidsserier kan du förlora den större bilden ur sikte
*(Och varför uttalanden som "AI-ingenjör är inte en sak eftersom alla mjukvaruingenjörer är AI-ingenjörer" är okej och kommer aldrig att vara rätt förutom i den mest triviala meningen)

Scott Huston22 juli 08:30
Finns det ett offentligt kalkylblad över alla ledande LLM-modeller från olika företag som visar deras prissättning, benchmarkpoäng, arena elo-poäng etc?
10,06K
swyx delade inlägget
🆕 Släpper hela vår RL + Reasoning-låt!
Med:
• @willccbb, Ursprungligt intellekt
• @GregKamradt, Arc-pris
• @natolambert, AI2/sammankopplingar
• @corbtt, OpenPipe
• @achowdhery, Reflektion
• @ryanmart3n, Skräddarsydd
• @ChrSzegedy, Morfning
med speciell 3 timmars workshop från:
@danielhanchen av lättja!
Börja här:
Trevlig helg tittande! Och tack till @OpenPipeAI för att stödja och vara värd för den här låten!

106,66K
swyx delade inlägget
Om, som @sgrove föreslår, specifikationer är framtidens kod, vad är då felsökning?
1) Specifikationskompilering är processen där en kodningsagent omvandlar specifikationer till kod
2) Mer och mer "kompilering" kommer att vara obevakad, mindre titta på agenten arbeta diff för diff, mer spec in, kod ut
3) Typfel - > sanningsfel : De flesta felsökningar kommer att gräva igenom forsknings- och implementeringsplaner i Markdown för att hitta den enda raden av felaktigt sammanhang som gör att kodningsagenten misslyckas med att lyckas vid implementering. Testsviter kommer bland annat att kontrollera sanning och logisk konsistens.
4) Det finns en ny högre ordningsvariant av "Bifoga en stegfelsökare" som ser agenten implementera en plan steg för steg för att lokalisera logikfelet i specifikationen. När du hittar ett fel när du går igenom ett program rad för rad ändrar du koden, startar om processen och upprepar tills den fungerar. När du hittar ett fel i en *spec* när du går igenom en implementering går du uppströms, åtgärdar specifikationen och startar om *implementeringen*
10,28K
Topp
Rankning
Favoriter
Trendande på kedjan
Trendande på X
Senaste toppfinansieringarna
Mest anmärkningsvärda