ฉันสามารถแสดงให้เห็นว่ามันลำเอียง (ฉันคิดว่า) แต่ฉันไม่สามารถอธิบายได้ว่าทำไม ฉันหวังว่าบางคนสามารถเห็นคำตอบของฉันและช่วยอธิบายเพิ่มเติม
เช่นเดียวกับใน meta-analyzes และรูปภาพที่คุณโพสต์หลายคนตีความ BESD ว่า: หากคุณแบ่งค่าตัวแปรทั้งสองคุณจะต้องใส่คนในเซลล์ "ขวา" ของตารางฉุกเฉิน 2 x 2 เปอร์เซ็นต์ที่กำหนด เวลา.
.50 + r / 2 = .70R
R
r = .38.50+r/2
จากนั้นผมจึงหาค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของแต่ละเวกเตอร์เหล่านี้ที่มีความยาว 10,000 รหัส:
library(MASS)
# set population params
mu <- rep(0,2)
Sigma <- matrix(.38, nrow=2, ncol=2) + diag(2)*.62
# set seed
set.seed(1839)
# generate population
pop <- as.data.frame(mvrnorm(n=1000000, mu=mu, Sigma=Sigma))
# initialize vectors
besd_correct <- c()
actual_correct <- c()
# actually break up raw data by median split, see how it works
for (i in 1:10000) {
samp <- pop[sample(1:1000000, 100),]
besd_correct[i] <- round(100*(.50 + cor(samp)[1,2]/2),0)
samp$V1_split <- ifelse(samp$V1 > median(samp$V1), 1, 0)
samp$V2_split <- ifelse(samp$V2 > median(samp$V2), 1, 0)
actual_correct[i] <- with(samp, table(V1_split==V2_split))[[2]]
}
# cells for BESD
mean(besd_correct)
100 - mean(besd_correct)
# cells for actual 2 x 2 table with median split
mean(actual_correct)
100 - mean(actual_correct)
จาก BESD เราจะได้รับตารางนี้ที่ไหนv1
และv2
อ้างถึงตัวแปรและlow
และhigh
อ้างถึงด้านล่างและเหนือมัธยฐานตามลำดับ:
+---------+--------+---------+
| | v2 low | v2 high |
+---------+--------+---------+
| v1 low | 69 | 31 |
+---------+--------+---------+
| v1 high | 31 | 69 |
+---------+--------+---------+
จากการแบ่งค่ามัธยฐานกับข้อมูลดิบจริง ๆ แล้วเราได้ตารางนี้:
+---------+--------+---------+
| | v2 low | v2 high |
+---------+--------+---------+
| v1 low | 62 | 38 |
+---------+--------+---------+
| v1 high | 38 | 62 |
+---------+--------+---------+
ดังนั้นในขณะที่บางคนอาจโต้เถียงโดยใช้ BESD ว่ามี "38 เปอร์เซ็นต์จุดแตกต่างในการควบคุมและการทดลอง" แบ่งค่าเฉลี่ยที่แท้จริงมีจำนวนนี้ที่ 24
ฉันไม่แน่ใจว่าทำไมสิ่งนี้ถึงเกิดขึ้นหรือถ้ามันขึ้นอยู่กับขนาดของกลุ่มตัวอย่างและความสัมพันธ์ ฉันจะรักถ้าใครบางคนสามารถพูดสอดกับคณิตศาสตร์ - มากกว่าการคำนวณ - คำอธิบาย