Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alexander Long
Fundador @PluralisHQ | Doctorado en ML
Aprendizaje de protocolo: Modelo paralelo de bajo ancho de banda y múltiples participantes
Noam tiende a no exagerar.

Noam Brown19 jul, 15:52
¿A dónde va esto? A pesar de lo rápido que ha sido el progreso reciente de la IA, espero que la tendencia continúe. Es importante destacar que creo que estamos cerca de que la IA contribuya sustancialmente al descubrimiento científico. Hay una gran diferencia entre la IA ligeramente por debajo del rendimiento humano superior y ligeramente por encima.
756
Totalmente de acuerdo: Flower Labs es otro grupo que publica activamente cosas geniales y ahora se centra directamente en la formación descentralizada. Debería ser un punto de datos importante para todos los que aún son escépticos de la zona: el equipo de flores es lo más legítimo que hay y Nic Lane es prácticamente la cima del pináculo en el aprendizaje federado.
Para mí, cada señal es que estamos a punto de presenciar un punto de inflexión académico masivo en esta área en el lado del ML. En realidad, ya ni siquiera es contrario, se ha pasado de eso a los primeros días de lo que se convertirá en un campo importante y muy impactante.

nic lane16 jul, 19:35
Felicidades por el papel @_AlexanderLong. Pero omitió @flwrlabs que publicó un sistema completo (fotón) con entrenamiento validado en la naturaleza totalmente descentralizado de hasta 13 mil millones @MLSysConf. Junto con una técnica clave de la pila descentralizada (incrustaciones desacopladas) publicada como un @iclr_conf oral. Este fue un trabajo realizado junto con @CaMLSys en @Cambridge_Uni.
992
Alexander Long reposteó
Desde mi experiencia, conseguir que un documento sobre DL descentralizado sea aceptado en conferencias de alto nivel puede ser bastante difícil. La motivación no es familiar para muchos revisores, y la configuración estándar de los experimentos no tiene en cuenta los problemas que se pretenden resolver.
Por lo tanto, estoy muy emocionado de ver que empresas como @PluralisHQ y @PrimeIntellect invierten el esfuerzo de compartir sus resultados y publicarlos en conferencias importantes. En mi opinión, incluso preparar la presentación te obliga a ser más riguroso con tus experimentos, + los comentarios externos de los revisores te ayudan a afinar el mensaje del artículo.
7.23K
Siento que los modelos de cierre meta eran muy predecibles. Dije explícitamente que esto sucedería el año pasado y expliqué por qué (de ).


Shane Gu15 jul, 05:35
RIP a las startups de IA unicornio que tienen cero productos, cero modelos de base, y solo iban a depender de los grandes laboratorios que lanzan modelos de código abierto de forma gratuita para fusionar modelos. Conozco uno o dos.

3.6K
Para las personas que no están familiarizadas con la publicación de IA; Hay 3 conferencias principales cada año. ICML, ICLR y NeurIPS. Se trata de conferencias técnicas y el equivalente a las revistas de otras disciplinas: son el principal lugar de publicación de la IA. La competencia para tener trabajos en estas conferencias está ahora en un nivel ridículo, conseguir que los trabajos sean aceptados es muy difícil, y hay mucha preocupación sobre el proceso de revisión, que es bastante ruidoso en este momento. Un artículo sólido y sin defectos tiene alrededor de un 50% de posibilidades de ser aceptado y, por lo general, un artículo se envía con cambios de revisor varias veces hasta que es aceptado. A pesar de todo eso, los artículos en estos lugares siguen siendo el principal sello de legitimidad en el mundo de la IA, y probablemente sigan siendo las principales métricas de carrera para los investigadores de ML (aunque esto se está debilitando, en mi opinión, ya que gran parte de la investigación en los laboratorios de frontera no se publica).
Los documentos de la pista principal son significativamente diferentes a los documentos de taller. La pista principal tiene una revisión por pares intensa y seria. Los documentos de taller son para trabajos preliminares, que dan alguna indicación de un resultado interesante, pero no están completos o el resultado no es lo suficientemente significativo para la pista principal. Solo se requiere que sean revisados por el grupo de revisores del taller y no aparecen en las actas.
Muchos grandes trabajos han aparecido por primera vez en talleres (por ejemplo, grokking), pero los trabajos de taller y de pista principales son cosas fundamentalmente diferentes, con un nivel de impacto fundamentalmente diferente. Las dos únicas empresas de IA descentralizada que tienen un seguimiento principal este año son @PrimeIntellect y Pluralis.
18.75K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas