การแสดงผลขนาดทวินาม (BESD) เป็นการนำเสนอขนาดที่ทำให้เข้าใจผิดหรือไม่?


10

มันยากสำหรับฉันที่จะยอมรับว่าโดนัลด์รูบินจะมาพร้อมกับเทคนิคมะนาวที่แท้จริง แต่นั่นคือการรับรู้ของฉันเกี่ยวกับ BESD [ 1 , 2 , 3 ]

กระดาษต้นฉบับโดย Rosenthal และ Rubin (1982)อ้างว่ามีค่าในการแสดง "วิธีการสร้างความสัมพันธ์กับช่วงเวลาของผลิตภัณฑ์ใด ๆ ในการแสดง [2x2] ไม่ว่าจะเป็นข้อมูลต้นฉบับที่ต่อเนื่องหรือเป็นหมวดหมู่"

ตารางด้านล่างมาจากหน้า 451 ของลิงค์ที่ 2 ด้านบน:

ป้อนคำอธิบายรูปภาพที่นี่

R2ϕ

ฉันขาดสิ่งที่มีค่าอย่างแท้จริงที่นี่ นอกจากนี้ฉันมีความประทับใจว่าในช่วง 10 ปีที่ผ่านมาชุมชนสถิติได้ปฏิเสธโดยวิธีนี้อย่างมากและถูกต้องตามกฎหมาย - ฉันผิดหรือเปล่า?

ECsr

Esr=.50+r/2

และ

Csr=.50r/2


อ้างอิง:

Rosenthal, R. , & Rubin, DB (1982) จุดประสงค์ทั่วไปที่เรียบง่ายแสดงขนาดของผลการทดลอง วารสารจิตวิทยาการศึกษา, 74 , 166–169


1
r

ความคิดที่ดีของคุณเป็นเพียงความคิดเห็นหรือคำตอบเดียวที่ฉันเคยเห็น
rolando2

2
ฉันไม่ได้อ่าน แต่ดูเหมือนว่าจะเกี่ยวข้องกันมาก: Hsu, LM (2004) อคติของความแตกต่างของอัตราความสำเร็จที่แสดงในขนาดเอฟเฟกต์ทวินาม วิธีการทางจิตวิทยา, 9 (2), 183-197 นอกจากนี้ยังมีการวิพากษ์วิจารณ์บางอย่างใน: Randolph, JJ, & Edmondson, RS (2005) การใช้จอแสดงผลขนาด Binomial Effect (BESD) เพื่อแสดงขนาดของเอฟเฟกต์ต่อผู้ชมการประเมินผล การประเมินการปฏิบัติ, การวิจัย & การประเมิน, 10 (14)
Wolfgang

คำตอบ:


4

ฉันสามารถแสดงให้เห็นว่ามันลำเอียง (ฉันคิดว่า) แต่ฉันไม่สามารถอธิบายได้ว่าทำไม ฉันหวังว่าบางคนสามารถเห็นคำตอบของฉันและช่วยอธิบายเพิ่มเติม

เช่นเดียวกับใน meta-analyzes และรูปภาพที่คุณโพสต์หลายคนตีความ BESD ว่า: หากคุณแบ่งค่าตัวแปรทั้งสองคุณจะต้องใส่คนในเซลล์ "ขวา" ของตารางฉุกเฉิน 2 x 2 เปอร์เซ็นต์ที่กำหนด เวลา.

.50+r/2=.70r

ป้อนคำอธิบายรูปภาพที่นี่

r

r=.38.50+r/2

จากนั้นผมจึงหาค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของแต่ละเวกเตอร์เหล่านี้ที่มีความยาว 10,000 รหัส:

library(MASS)
# set population params
mu <- rep(0,2)
Sigma <- matrix(.38, nrow=2, ncol=2) + diag(2)*.62
# set seed
set.seed(1839)
# generate population
pop <- as.data.frame(mvrnorm(n=1000000, mu=mu, Sigma=Sigma))
# initialize vectors
besd_correct <- c()
actual_correct <- c()
# actually break up raw data by median split, see how it works
for (i in 1:10000) {
  samp <- pop[sample(1:1000000, 100),]
  besd_correct[i] <- round(100*(.50 + cor(samp)[1,2]/2),0)
  samp$V1_split <- ifelse(samp$V1 > median(samp$V1), 1, 0)
  samp$V2_split <- ifelse(samp$V2 > median(samp$V2), 1, 0)
  actual_correct[i] <- with(samp, table(V1_split==V2_split))[[2]]
}
# cells for BESD
mean(besd_correct)
100 - mean(besd_correct)
# cells for actual 2 x 2 table with median split
mean(actual_correct)
100 - mean(actual_correct)

จาก BESD เราจะได้รับตารางนี้ที่ไหนv1และv2อ้างถึงตัวแปรและlowและhighอ้างถึงด้านล่างและเหนือมัธยฐานตามลำดับ:

+---------+--------+---------+
|         | v2 low | v2 high |
+---------+--------+---------+
| v1 low  | 69     | 31      |
+---------+--------+---------+
| v1 high | 31     | 69      |
+---------+--------+---------+

จากการแบ่งค่ามัธยฐานกับข้อมูลดิบจริง ๆ แล้วเราได้ตารางนี้:

+---------+--------+---------+
|         | v2 low | v2 high |
+---------+--------+---------+
| v1 low  | 62     | 38      |
+---------+--------+---------+
| v1 high | 38     | 62      |
+---------+--------+---------+

ดังนั้นในขณะที่บางคนอาจโต้เถียงโดยใช้ BESD ว่ามี "38 เปอร์เซ็นต์จุดแตกต่างในการควบคุมและการทดลอง" แบ่งค่าเฉลี่ยที่แท้จริงมีจำนวนนี้ที่ 24

ฉันไม่แน่ใจว่าทำไมสิ่งนี้ถึงเกิดขึ้นหรือถ้ามันขึ้นอยู่กับขนาดของกลุ่มตัวอย่างและความสัมพันธ์ ฉันจะรักถ้าใครบางคนสามารถพูดสอดกับคณิตศาสตร์ - มากกว่าการคำนวณ - คำอธิบาย


2

สัญชาตญาณของ Mark White ไม่ถูกต้อง BESD ไม่ได้จำลองการแบ่งแบบมัธยฐาน ค่ามัธยฐานแบ่งมีความสัมพันธ์กับการสูญเสียข้อมูลทางสถิติที่แท้จริง - มันลดทอนความสัมพันธ์อย่างเป็นระบบ (ดูhttp://psycnet.apa.org/record/1990-24322-001) ซึ่งเป็นเหตุผลที่ค่าแบ่งเฉลี่ยแสดงความแม่นยำน้อยกว่า BESD BESD แสดงให้เห็นถึงความถูกต้องของการจำแนกประเภทราวกับว่าตัวแปรนั้นมีการแบ่งขั้วอย่างแท้จริงไม่ใช่การแบ่งขั้วแบบเทียมผ่านการแบ่งค่ามัธยฐาน หากต้องการดูสิ่งนี้ให้คำนวณความสัมพันธ์ของข้อมูลแบ่งค่ามัธยฐาน คุณจะเห็นว่ามันเล็กกว่าค่าสหสัมพันธ์ของตัวแปรดั้งเดิม หากตัวแปรเดิมเป็นไบนารีทั้งสองวิธีจะเห็นด้วย โดยธรรมชาติแล้ว BESD จะแสดงตัวแปรราวกับว่ามันเป็นไบนารีอย่างแท้จริง เมื่อมันถูกใช้สำหรับตัวแปรต่อเนื่องสิ่งนี้แสดงให้เห็นถึงสิ่งที่เป็นนามธรรม - กลุ่ม "ความสำเร็จ" และ "ความล้มเหลว" หรือ "การรักษา" และ "การควบคุม" ไม่ได้จริงๆ

BESD ไม่ลำเอียง มันสะท้อนถึงผลกระทบของการรักษาที่เฉพาะเจาะจงต่อความแม่นยำในการจำแนกประเภทอย่างแม่นยำหากเราทำงานกับตัวแปรไบนารีสองตัว มันเป็นจอแสดงผลที่มีประโยชน์สำหรับการแสดงให้เห็นถึงคุณค่าในทางปฏิบัติที่เป็นไปได้ของการวัดหรือการรักษาและใช่มันแสดงให้เห็นว่าแม้เอฟเฟกต์ที่มีความแปรปรวนเล็กน้อยซึ่งคิดเป็นสถิติก็มีความสำคัญ BESD ถูกนำมาใช้กันอย่างแพร่หลายในการปฏิบัติทางจิตวิทยาและองค์กรที่ใช้และเห็นด้วยอย่างยิ่งกับการแสดงผลขนาดจริงอื่น ๆ (เช่นการเลือกกลุ่มจากบนลงล่างโดยใช้การวัดที่มีค่าสหสัมพันธ์ r = .25 จะนำไปสู่. 25 เพิ่มประสิทธิภาพของผลลัพธ์ SD ในกลุ่มที่เลือกกับกลุ่มที่ไม่ได้เลือก)

ความแปรปรวนคิดเป็นสถิติอย่างต่อเนื่องนำไปสู่การเข้าใจผิดและประเมินขนาดของความสัมพันธ์ของตัวแปรเนื่องจากการดำเนินการกำลังสองเป็นแบบไม่เชิงเส้น นักวิธีการประยุกต์ใช้หลายคน (เช่นhttps://us.sagepub.com/en-us/nam/methods-of-meta-analysis/book240589 ) ขอแนะนำให้ใช้อย่างมากเพื่อสนับสนุนรากที่สองของพวกเขา (ซึ่งถ่ายทอดขนาดของ ผลกระทบ)


1

สำหรับคำตอบโดยละเอียดการวิเคราะห์เวลาที่สร้างความแตกต่างและวิธีแก้ปัญหาที่ดีกว่าโปรดดูวิธีการคำนวณที่แน่นอนสำหรับการคำนวณเปอร์เซ็นต์การเปลี่ยนแปลงแบบสัมบูรณ์ในผลลัพธ์แบบสองทางจากขนาดของเมตาดาต้าวิเคราะห์: การปรับปรุงผลกระทบและการประมาณการต้นทุน J Derzon, D Hendrie, คุณค่าด้านสุขภาพ, 14: 1, 144-151, 2011 นี่คือคำตอบสรุปในนามธรรมของบทความนั้น วัตถุประสงค์: โดยทั่วไปการวิเคราะห์ Meta จะคำนวณขนาดเอฟเฟกต์การรักษา (Cohen's d) ซึ่งจะถูกแปลงเป็นมาตรการทั่วไปอีกอย่างอย่างง่ายดายคือการแสดงผลขนาดทวินาม (BESD) BESD คือสัมประสิทธิ์สหสัมพันธ์และแสดงถึงความแตกต่างเปอร์เซ็นต์ในผลลัพธ์ที่เป็นผลมาจากการแทรกแซง ทั้ง d และ BESD อยู่ในหน่วยโดยพลการ ไม่มีการวัดการเปลี่ยนแปลงแบบสัมบูรณ์ซึ่งเกิดจากการแทรกแซง วิธีที่ใช้ในการประเมินการเปลี่ยนแปลงที่แน่นอนจาก BESD ถือว่าทั้งแยก 50-50 ของผลและการออกแบบที่สมดุล ดังนั้นสมมติฐานที่ไม่ถูกต้องจึงสนับสนุนการประมาณการ meta-analytic ส่วนใหญ่เกี่ยวกับผลกำไรที่เกิดจากการแทรกแซง (และประสิทธิผลด้านต้นทุน) บทความนี้พัฒนาสูตรที่แน่นอนโดยไม่มีสมมติฐานเหล่านี้ วิธีการ: สูตรได้รับการพัฒนาทางพีชคณิตจาก 1) สูตรสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ที่แสดงเป็นตารางฉุกเฉิน 2-by-2 ที่สร้างขึ้นจากขนาดที่สัมพันธ์กันของกลุ่มการรักษาและกลุ่มควบคุมและร้อยละของคนที่จะไม่เข้าแทรกแซง และ 2) สูตรค่าสัมประสิทธิ์สหสัมพันธ์ BESD แสดงการเปลี่ยนแปลงในความน่าจะเป็นความสำเร็จกับการรักษา ผล: การจำลองแสดงให้เห็นว่า BESD เพียงการลดลงของผลการแทรกแซงที่อาจประสบความสำเร็จเมื่อผลลัพธ์ของปัญหาเกิดขึ้นใน 35% -65% ของกรณี สำหรับผลลัพธ์ที่พบได้น้อย BESD ประเมินผลกระทบของการแทรกแซงอย่างมีนัยสำคัญ แม้ว่า BESD จะประมาณการเปลี่ยนแปลงเปอร์เซ็นต์ของผลที่คาดว่าจะเป็นไปได้อย่างแม่นยำ แต่มันก็จะวาดภาพที่ทำให้เข้าใจผิดเกี่ยวกับสัดส่วนของกรณีที่จะบรรลุผลในเชิงบวก


และเต็มไปด้วยข้อความที่sciencedirect.com/science/article/pii/S1098301510000148 ขอบคุณ @Ted Miller
rolando2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.