Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alexander Long
Fundador @PluralisHQ | Doutoramento ML
Aprendizagem de protocolo: modelo paralelo multiparticipante e de baixa largura de banda
Noam tende a não exagerar.

Noam Brown19/07, 15:52
Para onde isto vai? Por mais rápido que tenha sido o progresso recente da IA, espero plenamente que a tendência continue. Importante, acho que estamos perto de a IA contribuir substancialmente para a descoberta científica. Há uma grande diferença entre a IA estar ligeiramente abaixo do desempenho humano de topo e estar ligeiramente acima.
793
Concordo totalmente - Flower labs é outro grupo que está a publicar coisas excelentes e agora está totalmente focado em formação descentralizada. Deve ser um ponto de dados importante para todos que ainda são céticos nesta área - a equipa da flower é tão legítima quanto se pode imaginar e Nic Lane é praticamente o topo da pirâmide em Aprendizagem Federada.
Cada sinal para mim indica que estamos prestes a testemunhar um enorme ponto de viragem académico nesta área do lado do ML. Já não é realmente contrariano, passou de isso para ser claramente os primeiros dias do que se tornará um campo importante e muito impactante.

nic lane16/07, 19:35
Parabéns pelo artigo @_AlexanderLong. Mas você deixou de fora @flwrlabs que publicou um sistema completo (photon) com treinamento totalmente descentralizado validado em campo de até 13B @MLSysConf. Juntamente com uma técnica chave da pilha descentralizada (embeddings desacoplados) publicada como uma apresentação oral @iclr_conf. Este foi um trabalho realizado junto com @CaMLSys na @Cambridge_Uni.
1,02K
Alexander Long republicou
Com a minha experiência, conseguir que um artigo sobre DL descentralizado seja aceito em conferências de alto nível pode ser bastante difícil. A motivação não é familiar para muitos revisores, e as configurações experimentais padrão não levam em conta os problemas que você pretende resolver.
Portanto, estou muito entusiasmado em ver empresas como @PluralisHQ e @PrimeIntellect a investir o esforço para compartilhar os seus resultados e publicá-los em grandes conferências! Na minha opinião, até preparar a submissão obriga você a ser mais rigoroso em relação aos seus experimentos + o feedback externo dos revisores ajuda a afinar a mensagem do artigo.
7,24K
Sinto que o encerramento dos modelos meta foi muito previsível. Eu disse explicitamente que isso aconteceria no ano passado e expliquei porquê (de ).


Shane Gu15/07, 05:35
Descansem em paz as startups de IA unicórnio que não têm produtos, nem modelos de base, e que apenas iam depender de grandes laboratórios a lançarem modelos de código aberto gratuitamente para fusão de modelos. Conheço uma ou duas.

3,62K
Alexander Long republicou
Falei 50 minutos seguidos para uma sala cheia de pesquisadores de IA entusiasmados na ICML, apresentando trabalhos de @akashnet_, @PrimeIntellect, @gensynai, @NousResearch, @PluralisHQ e @GoogleDeepMind.
Agora há um enorme interesse em DeAI.
Missão (Parcialmente) Cumprida.
10,77K
Para pessoas que não estão familiarizadas com a publicação em IA; existem 3 principais conferências todos os anos. ICML, ICLR e NeurIPS. Estas são conferências técnicas e o equivalente a revistas em outras disciplinas - são o principal local de publicação para IA. A competição para ter artigos aceites nessas conferências está agora em um nível ridículo, conseguir que os artigos sejam aceites é muito difícil, e há muita preocupação com o processo de revisão, que está bastante barulhento neste momento. Um artigo forte, sem falhas, tem cerca de 50% de chance de ser aceito, e tipicamente um artigo é submetido com alterações dos revisores várias vezes até ser aceito. Apesar de tudo isso, os artigos nesses locais continuam a ser o principal selo de legitimidade no mundo da IA, e provavelmente ainda são as principais métricas de carreira para pesquisadores de ML (embora isso esteja a enfraquecer na minha opinião, já que grande parte da pesquisa nos laboratórios de fronteira não é publicada).
Os artigos da Main Track são significativamente diferentes dos artigos de workshop. A main track tem uma revisão por pares intensa e séria. Os artigos de workshop são para trabalhos preliminares, que dão alguma indicação de um resultado interessante, mas que estão incompletos ou o resultado não é significativo o suficiente para a main track. Eles só precisam ser revisados pelo grupo de revisores do workshop e não aparecem nos anais.
Muitos grandes artigos apareceram pela primeira vez em workshops (por exemplo, grokking) - mas os artigos de workshop e da main track são coisas fundamentalmente diferentes, com um nível de impacto fundamentalmente diferente. As únicas duas empresas em IA descentralizada que têm artigos da main track este ano são @PrimeIntellect e Pluralis.
18,77K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável