Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Uno de mis artículos favoritos en los últimos años incluía este diagrama.
Muestra el impacto de controlar tres tipos diferentes de variables: factores de confusión, colisionadores y mediadores.
Con los factores de confusión, el control es bueno. Con los demás, arruinas tu resultado al controlar.

Si tiene variables con error de medición, puede encontrarse con otra variable problemática: el proxy.
Las variables proxy pueden hacer que todas estas distorsiones sean mucho peores y mucho más difíciles de tratar.

El documento hace esta simple observación: el control estadístico requiere una justificación causal. Ese es en realidad el título.
Dieron varios ejemplos basados en DAG. Considere esto: ¿es el entretenimiento educativo un factor de confusión o un mediador? ¿Debería controlarlo, o eso sesgaría su estimación?

Esto es algo que siempre hay que considerar, pero es, francamente, excepcional pensar causalmente en el control estadístico.
Muchos artículos hacen cosas como controlar variables posteriores irrelevantes (proxies), o controlan involuntariamente a los mediadores. ¡Esa es la norma!
Mi artículo repasa muchos más problemas con el uso y mal uso de los controles.
Por ejemplo, señala que puede tomar una gran cantidad de datos y esfuerzo para obtener una puntuación de propensión que coincida con los experimentos:

Señala que un hallazgo dado puede no significar lo que dice que significa:

Y muestra que incluso el estándar de oro de la inferencia causal, el ECA, debe hacerse correctamente, o terminará en una situación en la que sus estimaciones de efectos están infladas y sus conclusiones son incorrectas.

55.86K
Populares
Ranking
Favoritas