Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Construindo @EurekaLabsAI. Anteriormente Diretor de AI @ Tesla, equipe fundadora @ OpenAI, CS231n/PhD @ Stanford. Eu gosto de treinar grandes redes 🧠🤖💥 neurais profundas
Modelos de vídeo de difusão, mas agora - **em tempo real**!
Filtros de vídeo simples são em tempo real, mas só podem fazer recoloração e estilos básicos. Os modelos de difusão de vídeo (Veo e amigos) são mágicos, mas levam muitos segundos/minutos para serem gerados. MirageLSD é magia em tempo real. Ao contrário dos filtros de vídeo simples, os modelos de difusão realmente *entendem* o que estão vendo, para que possam estilizar todas as partes do feed de forma inteligente (por exemplo, colocar chapéus na cabeça ou sabres de luz nas mãos, etc.). E eles são arbitrariamente orientáveis, por exemplo, por prompts de texto.
Filtros de vídeo personalizáveis e inteligentes desbloqueiam muitas ideias interessantes ao longo do tempo:
- Transforme feeds de câmera em realidades alternativas
- Dirija e grave seus próprios filmes, encenando cenas com adereços. Tempo real = > feedback / revisão instantânea.
- Vibe Code Games em torno de apenas esferas/blocos simples e, em seguida, use um modelo de difusão em tempo real para texturizar seu jogo e torná-lo bonito.
- Estilize e personalize qualquer feed de vídeo: jogos, vídeos, ... por exemplo, Skyrim, mas "MAIS ÉPICO"? DOOM II, mas a qualidade moderna do Unreal Engine com apenas um prompt? Filme de terror, mas "fofo, rosa e apenas coelhos"? Eu não sei!
- planos de fundo de chamadas de zoom +++
- Experimente roupas em tempo real virtualmente
- óculos: por exemplo, caricaturar sua visão em tempo real?
- agora podemos construir Harry Potter Mirror of Ojesed, mostrando a "alimentação bruta" de você no espelho, mas aumentada com seus desejos mais profundos (como inferido pela IA).
- Não sei, provavelmente estou perdendo o maior, tantas coisas!
(Divulgação Eu sou (muito pequeno) investidor anjo na Decart, fiquei animado porque, na minha opinião, essa tecnologia ficará muito boa muito rápido e parece geral, poderosa, mas também é tecnicamente muito difícil. Parabéns pelo lançamento para a equipe!)

Decart18 de jul., 04:44
Apresentando o MirageLSD: o primeiro modelo de IA de difusão de transmissão ao vivo (LSD)
Insira qualquer fluxo de vídeo, de uma câmera ou bate-papo por vídeo para uma tela de computador ou jogo, e transforme-o em qualquer mundo que desejar, em tempo real (latência de <40 ms).
Veja como funciona (com demonstração que você pode usar!):
357,42K
Costumo reclamar sobre como 99% da atenção está prestes a ser atenção LLM em vez de atenção humana. Como é um trabalho de pesquisa para um LLM em vez de um humano? Definitivamente não é um pdf. Há um enorme espaço para um "aplicativo de pesquisa" extremamente valioso que descobre isso.

Michael Levin10 de jul., 22:47
Estou constantemente irritado por não ter tempo para ler a torrente de artigos legais que chegam cada vez mais rápido de pessoas incríveis em áreas relevantes. Outros cientistas têm o mesmo problema e também não têm tempo para ler a maioria dos meus longos artigos conceituais. Então, para quem estamos escrevendo esses artigos?
Eu acho que, pelo menos até que eles caiam no mesmo problema de seu próprio trabalho, os AIs serão os únicos que realmente terão largura de banda para ler todas essas coisas. Não estou falando especificamente sobre os modelos de linguagem de hoje - vamos supor que queremos dizer qualquer IA inevitável que apareça, que seja capaz de ler a literatura e ter impacto na pesquisa (seja conversando com humanos ou executando plataformas de automação de laboratório / cientistas robôs).
Então: como devemos escrever, sabendo que grande parte do nosso público será IA (além de ciborgues, hybrots, humanos aprimorados, etc.)? Talvez seja muito cedo para saber o que fazer, mas é melhor começarmos a pensar nisso, porque presumir que nosso público sempre será os humanos de hoje parece insustentável. Levando a sério a ideia de que algum dia o público impactante será muito diferente, e que as coisas que escrevemos agora são, em certo sentido, um conjunto de treinamento para seres futuros verdadeiramente diversos, como nossa escrita muda? ou não?
o que você @danfaggella @mpshanahan @Plinz @blaiseaguera diz?
498,13K
Como construir uma comunidade próspera de código aberto escrevendo código como as bactérias fazem 🦠 . Os códigos bacterianos (genomas) são:
- pequeno (cada linha de código custa energia)
- modular (organizado em grupos de operons intercambiáveis)
- independente (facilmente "copiável e colável" via transferência horizontal de genes)
Se pedaços de código são pequenos, modulares, independentes e triviais para copiar e colar, a comunidade pode prosperar por meio da transferência horizontal de genes. Para qualquer função (gene) ou classe (operon) que você escreve: você pode imaginar alguém indo "yoink" sem saber o resto do seu código ou ter que importar algo novo, para obter um benefício? Seu código poderia ser uma essência de tendência do GitHub?
Este guia de estilo de codificação permitiu que as bactérias colonizassem todos os recantos ecológicos, do frio ao quente, ao ácido ou alcalino, nas profundezas da Terra e no vácuo do espaço, juntamente com uma diversidade insana de anabolismo de carbono, metabolismo energético, etc. Ele se destaca na prototipagem rápida, mas... não pode construir uma vida complexa. Em comparação, o genoma eucariótico é um monorepo significativamente maior, mais complexo, organizado e acoplado. Significativamente menos inventivo, mas necessário para a vida complexa - para construir órgãos inteiros e coordenar sua atividade. Com a nossa vantagem de design inteligente, deve ser possível tirar proveito de ambos. Construa um backbone monorepo eucariótico se for necessário, mas maximize o DNA bacteriano.

538,8K
A corrida pelo "núcleo cognitivo" do LLM - um modelo de alguns bilhões de parâmetros que sacrifica ao máximo o conhecimento enciclopédico pela capacidade. Ele vive sempre ativo e, por padrão, em todos os computadores como o kernel da computação pessoal LLM.
Suas características estão se cristalizando lentamente:
- Texto/visão/áudio nativamente multimodal na entrada e na saída.
- Arquitetura no estilo Matryoshka que permite um dial de capacidade para cima e para baixo no momento do teste.
- Raciocínio, também com um mostrador. (sistema 2)
- Uso agressivo de ferramentas.
- Slots LoRA de ajuste fino no dispositivo para treinamento, personalização e customização em tempo de teste.
- Delega e verifica as partes certas com os oráculos na nuvem, se a Internet estiver disponível.
Ele não sabe que o reinado de Guilherme, o Conquistador, terminou em 9 de setembro de 1087, mas reconhece vagamente o nome e pode procurar a data. Ele não pode recitar o SHA-256 de string vazia como e3b0c442..., mas pode calculá-lo rapidamente, caso você realmente queira.
O que falta à computação pessoal LLM em amplo conhecimento mundial e capacidade de resolução de problemas de primeira linha, ela compensará em latência de interação super baixa (especialmente à medida que o multimodal amadurece), acesso direto / privado a dados e estado, continuidade offline, soberania ("não são seus pesos, não são seu cérebro"). ou seja, muitas das mesmas razões pelas quais gostamos, usamos e compramos computadores pessoais em vez de ter thin clients acessando uma nuvem via área de trabalho remota ou algo assim.
1,03M
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável