Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Một trong những bài báo yêu thích của tôi trong những năm gần đây có bao gồm sơ đồ này.
Nó cho thấy tác động của việc kiểm soát ba loại biến khác nhau: biến gây nhiễu, biến giao thoa và biến trung gian.
Với biến gây nhiễu, việc kiểm soát là tốt. Với những biến khác, bạn làm hỏng kết quả của mình bằng cách kiểm soát.

Nếu bạn có các biến với lỗi đo lường, bạn có thể gặp phải một biến vấn đề khác: biến proxy.
Các biến proxy có thể làm cho tất cả những biến dạng này trở nên tồi tệ hơn và khó xử lý hơn rất nhiều.

Bài báo đưa ra một quan sát đơn giản: kiểm soát thống kê yêu cầu sự biện minh nguyên nhân. Thực tế đó là tiêu đề.
Họ đã đưa ra một số ví dụ dựa trên DAG. Hãy xem xét ví dụ này: edutainment có phải là một yếu tố gây nhiễu hay một yếu tố trung gian? Bạn có nên kiểm soát nó, hay điều đó sẽ làm sai lệch ước lượng của bạn?

Điều này luôn là điều bạn phải xem xét, nhưng thật sự mà nói, thật đặc biệt khi nghĩ một cách nguyên nhân về kiểm soát thống kê.
Nhiều tài liệu làm những việc như kiểm soát cho các biến hạ nguồn không liên quan (proxy), hoặc họ vô tình kiểm soát cho các trung gian. Đó là điều bình thường!
Bài viết của tôi đề cập đến nhiều vấn đề hơn về việc sử dụng và lạm dụng các công cụ kiểm soát.
Ví dụ, nó lưu ý rằng có thể mất rất nhiều dữ liệu và nỗ lực để có được điểm số xu hướng phù hợp với các thí nghiệm:

Nó lưu ý rằng một phát hiện nhất định có thể không có nghĩa như những gì nó nói.

Và điều đó cho thấy ngay cả tiêu chuẩn vàng của suy diễn nguyên nhân - RCT - cũng cần phải được thực hiện đúng, nếu không bạn sẽ rơi vào tình huống mà các ước lượng hiệu ứng của bạn bị thổi phồng và kết luận của bạn là sai.

72,77K
Hàng đầu
Thứ hạng
Yêu thích