Одна из моих любимых статей за последние годы содержала эту диаграмму. Она показывает влияние контроля за тремя различными типами переменных: конфаундерами, коллайдерами и медиаторами. С конфаундерами контроль полезен. С остальными вы портите свой результат, контролируя.
Если у вас есть переменные с ошибкой измерения, вы можете столкнуться с другой проблемной переменной: прокси. Прокси-переменные могут значительно усугубить все эти искажения и сделать их гораздо более сложными для решения.
В статье делается простое наблюдение: статистический контроль требует причинного обоснования. Это на самом деле и есть заголовок. Они привели несколько примеров на основе DAG. Рассмотрим этот: является ли образовательное развлечение конфаундером или медиатором? Следует ли контролировать его, или это исказит вашу оценку?
Это всегда то, что нужно учитывать, но, откровенно говоря, исключительно думать о статистическом контроле причинно-следственных связей. Многие статьи делают такие вещи, как контроль за несущественными переменными (прокси), или они непреднамеренно контролируют медиаторы. Это норма!
Моя статья рассматривает гораздо больше проблем, связанных с использованием и злоупотреблением контролями. Например, в ней отмечается, что для того, чтобы сопоставить оценку склонности с экспериментами, может потребоваться много данных и усилий:
Отмечается, что данное заключение может не означать то, что оно говорит.
И это показывает, что даже золотой стандарт причинно-следственного вывода — РКИ — должен быть выполнен правильно, иначе вы окажетесь в ситуации, когда ваши оценки эффектов завышены, а ваши выводы неверны.
65,35K