Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Å bygge @EurekaLabsAI. Tidligere direktør for AI @ Tesla, grunnleggerteam @ OpenAI, CS231n/PhD @ Stanford. Jeg liker å trene store dype nevrale nett 🧠🤖💥
Diffusjonsvideomodeller, men nå - **sanntid**!
Enkle videofiltre er i sanntid, men kan bare gjøre grunnleggende omfarging og stiler. Videodiffusjonsmodeller (Veo og venner) er magiske, men de tar mange sekunder/minutter å generere. MirageLSD er magi i sanntid. I motsetning til enkle videofiltre, *forstår* diffusjonsmodeller faktisk hva de ser på, slik at de kan style alle deler av feeden intelligent (f.eks. sette hatter på hodet, eller lyssabler i hendene, etc.). Og de kan styres vilkårlig, for eksempel ved hjelp av tekstmeldinger.
Tilpassbare, intelligente videofiltre låser opp mange kule ideer over tid:
- forvandle kamerafeeder til alternative virkeligheter
- Regisser og ta opp dine egne filmer, og rollespill scener med rekvisitter. Sanntid => umiddelbar tilbakemelding/gjennomgang.
- Vibe Code-spill rundt bare enkle kuler/blokker, og bruk deretter en sanntidsdiffusjonsmodell for å strukturere spillet ditt for å gjøre det vakkert.
- Stil og tilpass hvilken som helst videofeed: spill, videoer, ... f.eks. Skyrim, men "MER EPISK"? DOOM II, men moderne Unreal Engine-kvalitet med bare en melding? Skrekkfilm, men "søte, rosa og bare kaniner"? Jeg vet ikke!
- Zoom samtalebakgrunner+++
- Prøv klær i sanntid virtuelt
- briller: f.eks. tegneserier av synet ditt i sanntid?
- vi kan nå bygge Harry Potter Mirror of Erised, som viser den "rå feeden" av deg i speilet, men forsterket med dine dypeste ønsker (som utledet av AI).
- Jeg vet ikke, jeg går nok glipp av den største, så mange ting!
(Avsløring Jeg er (veldig liten) engleinvestor i Decart, jeg var spent fordi imo denne teknologien vil bli veldig bra veldig raskt, og den føles generell, kraftig, men den er også teknisk veldig vanskelig. Gratulerer med lanseringen til teamet!)

Decart18. juli, 04:44
Vi introduserer MirageLSD: Den første AI-modellen for live-stream diffusion (LSD)
Legg inn hvilken som helst videostrøm, fra et kamera eller videochat til en dataskjerm eller et spill, og forvandle den til hvilken som helst verden du ønsker, i sanntid (<40 ms ventetid).
Slik fungerer det (med demo du kan bruke!):
357,35K
Jeg raljerer ofte om hvordan 99 % av oppmerksomheten er i ferd med å være LLM-oppmerksomhet i stedet for menneskelig oppmerksomhet. Hvordan ser en forskningsoppgave ut for en LLM i stedet for et menneske? Det er definitivt ikke en pdf. Det er enorm plass til en ekstremt verdifull "forskningsapp" som finner ut av dette.

Michael Levin10. juli, 22:47
Jeg er konstant irritert over at jeg ikke har tid til å lese strømmen av kule artikler som kommer raskere og raskere fra fantastiske mennesker på relevante felt. Andre forskere har det samme problemet og har heller ikke tid til å lese de fleste av mine lange konseptuelle artikler. Så hvem skriver vi disse oppgavene for?
Jeg antar, i det minste inntil de faller inn i det samme problemet fra sitt eget arbeid, vil AI-er være de eneste som faktisk har båndbredde til å lese alle disse tingene. Jeg snakker ikke spesifikt om dagens språkmodeller - la oss anta at vi mener den uunngåelige AI som dukker opp, som er i stand til å lese litteraturen og ha innvirkning på forskningen (enten ved å snakke med mennesker eller ved å kjøre laboratorieautomatisering/robotforskerplattformer).
Så da: hvordan skal vi skrive, vel vitende om at mye av publikummet vårt vil være AI (pluss cyborger, hybroter, utvidede mennesker, etc.)? Kanskje det er for tidlig å vite hva vi skal gjøre, men vi bør begynne å tenke på det, for det virker uholdbart å anta at publikummet vårt alltid vil være dagens mennesker. Når vi tar på alvor ideen om at det virkningsfulle publikummet en dag vil være veldig annerledes, og at tingene vi skriver nå på en eller annen måte er et treningssett for virkelig mangfoldige fremtidige vesener, hvordan endres skrivingen vår? Eller gjør det det?
Hva sier du @danfaggella @mpshanahan @Plinz @blaiseaguera ?
498,09K
Hvordan bygge et blomstrende åpen kildekode-fellesskap ved å skrive kode som bakterier gjør 🦠. Bakteriekode (genomer) er:
- liten (hver kodelinje koster energi)
- Modulær (organisert i grupper av utskiftbare operoner)
- selvstendig (lett å "kopiere og lime" via horisontal genoverføring)
Hvis biter av kode er små, modulære, selvstendige og trivielle å kopiere og lime inn, kan fellesskapet trives via horisontal genoverføring. For enhver funksjon (gen) eller klasse (operon) som du skriver: kan du forestille deg at noen går "yoink" uten å kjenne resten av koden din eller trenger å importere noe nytt, for å få en fordel? Kan koden din være en populær GitHub-kjerne?
Denne kodingsstilguiden har gjort det mulig for bakterier å kolonisere alle økologiske kroker fra kalde til varme til sure eller alkaliske i jordens dyp og verdensrommets vakuum, sammen med et vanvittig mangfold av karbonanabolisme, energimetabolisme, etc. Den utmerker seg ved rask prototyping, men... den kan ikke bygge komplekst liv. Til sammenligning er det eukaryote genomet en betydelig større, mer kompleks, organisert og koblet monorepo. Betydelig mindre oppfinnsom, men nødvendig for komplekst liv - for å bygge hele organer og koordinere deres aktivitet. Med vår fordel av intelligent design, bør det være mulig å dra nytte av begge. Bygg en eukaryot monorepo-ryggrad hvis du må, men maksimer bakterielt DNA.

538,76K
Kappløpet om LLM "kognitiv kjerne" - en noen milliarder param-modell som maksimalt ofrer encyklopedisk kunnskap for evne. Den lever alltid på og som standard på alle datamaskiner som kjernen til LLM personlig databehandling.
Funksjonene krystalliseres sakte:
- Naturlig multimodal tekst/bilde/lyd ved både inngang og utgang.
- Arkitektur i Matryoshka-stil som tillater en skive med kapasitet opp og ned på testtidspunktet.
- Resonnement, også med en skive. (system 2)
- Aggressiv verktøybruk.
- Finjustering av LoRA-spor på enheten for opplæring i testtid, personalisering og tilpasning.
- Delegerer og dobbeltsjekker akkurat de riktige delene med oraklene i skyen hvis internett er tilgjengelig.
Den vet ikke at Vilhelm Erobrerens regjeringstid endte i september 9 1087, men den gjenkjenner vagt navnet og kan slå opp datoen. Den kan ikke resitere SHA-256 av tom streng som e3b0c442..., men den kan beregne den raskt hvis du virkelig ønsker det.
Det LLM personlig databehandling mangler i bred verdenskunnskap og problemløsningsevne på toppnivå, vil det gjøre opp i superlav interaksjonslatens (spesielt når multimodal modnes), direkte / privat tilgang til data og tilstand, offline kontinuitet, suverenitet ("ikke vektene dine, ikke hjernen din"). det vil si mange av de samme grunnene til at vi liker, bruker og kjøper personlige datamaskiner i stedet for å ha tynne klienter tilgang til en sky via eksternt skrivebord eller så.
1,03M
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til