วิธีการเห็นภาพตัวอย่างการทดสอบสองตัวอย่าง


11

วิธีที่ได้รับการยอมรับมากที่สุดในการแสดงภาพผลลัพธ์ของการทดสอบตัวอย่างสองตัวอย่างที่เป็นอิสระคืออะไร ตารางตัวเลขใช้บ่อยขึ้นหรือมีการเรียงลำดับบางอย่างหรือไม่? เป้าหมายคือเพื่อให้ผู้สังเกตการณ์แบบชั่วคราวมองดูรูปและเห็นได้ทันทีว่าพวกเขาอาจมาจากประชากรสองกลุ่มที่แตกต่างกัน


"ยอมรับ" โดยใครในบริบทใด "ใช้บ่อยกว่า" ที่ไหน
Glen_b -Reinstate Monica

คำตอบ:


18

มันมีค่าที่ชัดเจนเกี่ยวกับวัตถุประสงค์ของการวางแผนของคุณ โดยทั่วไปแล้วมีเป้าหมายสองแบบที่แตกต่างกัน: คุณสามารถทำแผนสำหรับตัวคุณเองเพื่อประเมินสมมติฐานที่คุณทำและเป็นแนวทางในกระบวนการวิเคราะห์ข้อมูลหรือคุณสามารถแปลงเพื่อสื่อสารผลลัพธ์ให้ผู้อื่นได้ สิ่งเหล่านี้ไม่เหมือนกัน ตัวอย่างเช่นผู้ชม / ผู้อ่านหลายคนเกี่ยวกับการวางแผน / การวิเคราะห์ของคุณอาจไม่มีความซับซ้อนทางสถิติและอาจไม่คุ้นเคยกับแนวคิดการพูดความแปรปรวนที่เท่ากันและบทบาทในการทดสอบ t คุณต้องการให้พล็อตของคุณถ่ายทอดข้อมูลสำคัญเกี่ยวกับข้อมูลของคุณแม้แต่กับผู้บริโภคอย่างพวกเขา พวกเขาเชื่อมั่นโดยปริยายว่าคุณทำสิ่งต่าง ๆ ได้อย่างถูกต้อง จากการตั้งค่าคำถามของคุณฉันรวบรวมคุณหลังจากประเภทหลัง

ตามความจริงแล้วพล็อตส่วนใหญ่ที่เป็นที่ยอมรับและเป็นที่ยอมรับสำหรับการสื่อสารผลลัพธ์ของ t-test 1ให้กับผู้อื่น (กันว่ามันเหมาะสมที่สุดหรือไม่) เป็นแผนภูมิแท่งที่มีแถบข้อผิดพลาดมาตรฐาน สิ่งนี้ตรงกับการทดสอบ t-t มาก ๆ โดยที่ t-test เปรียบเทียบสองวิธีโดยใช้ข้อผิดพลาดมาตรฐาน เมื่อคุณมีกลุ่มอิสระสองกลุ่มสิ่งนี้จะทำให้ได้รูปภาพที่เป็นธรรมชาติแม้สำหรับผู้ที่ไม่มีความซับซ้อนทางสถิติและผู้คน (ยินดีรับข้อมูล) สามารถ "เห็นได้ทันทีว่าพวกเขาอาจมาจากประชากรสองกลุ่ม" นี่เป็นตัวอย่างง่ายๆโดยใช้ข้อมูลของ @ Tim:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

ป้อนคำอธิบายรูปภาพที่นี่

ที่กล่าวว่าผู้เชี่ยวชาญด้านการสร้างภาพข้อมูลมักจะดูหมิ่นแผนการเหล่านี้ พวกเขามักเยาะเย้ยว่า "แผนการระเบิด" (cf. , ทำไมแปลงของไดนาไมต์ถึงไม่ดี ) โดยเฉพาะอย่างยิ่งถ้าคุณมีเพียงไม่กี่ข้อมูลก็มักจะแนะนำว่าคุณก็จะแสดงข้อมูลของตัวเอง หากจุดทับซ้อนกันคุณสามารถกระวนกระวายใจในแนวนอน (เพิ่มเสียงรบกวนเล็กน้อย) เพื่อไม่ให้ทับซ้อนกันอีกต่อไป เนื่องจากการทดสอบ t เป็นพื้นฐานเกี่ยวกับค่าเฉลี่ยและข้อผิดพลาดมาตรฐานจึงเป็นการดีที่สุดที่จะวางค่าเฉลี่ยและข้อผิดพลาดมาตรฐานลงบนพล็อตดังกล่าว นี่คือรุ่นอื่น:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

ป้อนคำอธิบายรูปภาพที่นี่

หากคุณมีข้อมูลจำนวนมาก boxplots อาจเป็นทางเลือกที่ดีกว่าในการรับภาพรวมอย่างรวดเร็วของการแจกแจงและคุณสามารถวางค่าเฉลี่ยและ SE ที่นั่นได้เช่นกัน

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

ป้อนคำอธิบายรูปภาพที่นี่

พล็อตเรื่องง่าย ๆ ของข้อมูลและบ็อกซ์พล็อตนั้นเรียบง่ายพอที่คนส่วนใหญ่จะสามารถเข้าใจได้แม้ว่าพวกเขาจะไม่เข้าใจในเรื่องสถิติก็ตาม อย่างไรก็ตามโปรดจำไว้ว่าไม่มีสิ่งใดที่ทำให้ง่ายต่อการประเมินความถูกต้องของการใช้แบบทดสอบ t-test เพื่อเปรียบเทียบกลุ่มของคุณ เป้าหมายเหล่านั้นให้บริการที่ดีที่สุดโดยแปลงที่แตกต่างกัน

1. โปรดทราบว่าการสนทนานี้ถือว่าตัวอย่างอิสระ t-test พล็อตเหล่านี้สามารถใช้กับตัวอย่างที่ต้องพึ่งพาการทดสอบ t แต่อาจทำให้เข้าใจผิดในบริบทนั้น (เช่นการใช้แถบข้อผิดพลาดสำหรับวิธีการในการศึกษาในวิชาที่ไม่ถูกต้องหรือไม่ )


ปัญหาใหญ่กับการใช้แถบ + พล็อต CI คือว่าบางครั้งความแตกต่างอย่างมีนัยสำคัญทางสถิติ แต่ทับซ้อน เนื่องจากพล็อตบาร์ + CI พยายามดึงดูดผู้ชมทั่วไปเราไม่ต้องการใช้เวลาอธิบายริ้วรอยพิเศษนี้
ไฮเซนเบิร์ก

@ ไฮเซนเบิร์กฉันรู้เรื่องนั้นแล้ว ไม่มีแผนเดียวที่สมบูรณ์แบบสำหรับทุกโอกาสและทุกวัตถุประสงค์ ฉันยังไม่ได้พูดถึง CIs เพียง SEs (แม้ว่าจะเทียบเท่ากับ CI บางอย่างขึ้นอยู่กับ df) ความสำคัญมีการกล่าวถึงทั่วไปในคำบรรยายใต้ภาพและกล่าวถึงในข้อความ หากคุณต้องการให้มันแสดงอย่างชัดเจนในเนื้อเรื่องคุณสามารถเพิ่มวงเล็บและค่า p (เช่นที่นี่ )
gung - Reinstate Monica

ฉันขอโทษถ้าเสียงฟังดูดุดัน ฉันแค่สับสนนิดหน่อยว่าในท้ายที่สุดก็ยังไม่มีวิธีที่สง่างามในการแสดงภาพการทดสอบ t ให้กับผู้ชมทั่วไปโดยไม่ต้องอธิบายเพิ่มเติม มันอาจจะลงมาถึงพล็อต: 2 บาร์แปลงแสดงหมายถึงกลุ่มที่มี SE และพล็อตที่สามแสดงให้เห็นถึงความแตกต่างและ CI มัน (เช่นการเชื่อมโยงของคุณ ) แต่การสร้างภาพข้อมูลนั้นแสดงข้อมูลซ้ำซ้อน (กลุ่มหมายถึงและความแตกต่างในวิธีการ) ซึ่งอาจสร้างความสับสนให้ผู้ชม
ไฮเซนเบิร์ก

@ ไฮเซนเบิร์กฉันจะไม่ใช้พล็อตจากคำตอบอื่นของฉันเว้นแต่ฉันจะพยายามแสดงการทดสอบผู้ป่วยใน ฉันคิดว่ามันอาจจะดีที่จะนำเสนอ 2 บาร์ w / SEs สำหรับการทดสอบ t, w / คำบรรยายภาพที่เรียบง่าย หากคุณต้องการความสำคัญในพล็อตคุณสามารถเพิ่มวงเล็บเหลี่ยมหรืออะไรทำนองนั้น (โดยทั่วไปฉันคิดว่าไม่จำเป็น)
gung - Reinstate Monica

14

วิธีที่ใช้กันมากที่สุดที่จะเห็นภาพ -test เหมือนเปรียบเทียบคือการใช้boxplots ด้านล่างฉันมีตัวอย่างโดยใช้ชุดข้อมูลที่อธิบาย "ความสัมพันธ์ระหว่างการสูบบุหรี่ของกัญชาและการขาดประสิทธิภาพในงานที่วัดหน่วยความจำระยะสั้น" จากไซต์นี้t

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

ป้อนคำอธิบายรูปภาพที่นี่

ที่จริงแล้ว boxplots มักใช้สำหรับการทดสอบสมมติฐาน "ไม่เป็นทางการ" ตัวอย่างที่อธิบายโดย Yoav Benjamini ในปี 1988 การเปิดกล่อง Boxplot :

boxplot ปกติเสริมด้วยช่วงความเชื่อมั่นโดยประมาณสำหรับค่ามัธยฐานของแบทช์แสดงเป็นคู่ของเวดจ์ที่นำออกมาจากด้านข้างของกล่อง ช่วงความเชื่อมั่นเหล่านี้ถูกสร้างขึ้นในลักษณะที่เมื่อสองหยักของ boxplots ที่แตกต่างกันไม่ทับซ้อนค่ามัธยฐานของพวกเขาจะแตกต่างกันอย่างมีนัยสำคัญ (... ) เนื่องจากสูตรสำหรับช่วงความเชื่อมั่นเป็นช่วงเวลาคงที่ช่วง interquartile หารด้วยสแควร์รูทของขนาดแบทช์จึงสามารถรับรู้ช่วงหลังจากความยาวของเวดจ์ที่สัมพันธ์กับความยาวของกล่อง

ดูเพิ่มเติม: T-test โดยใช้ข้อมูลสรุปเฉพาะในพล็อตกล่อง

พล็อตนี้ไม่ได้แสดงปริมาณส่วนเกี่ยวข้องโดยตรงใน -test เป็น@NickCoxสังเกตเห็น หากคุณต้องการเปรียบเทียบค่าเฉลี่ยโดยตรงกับช่วงความมั่นใจคุณสามารถใช้บาร์พล็อตที่มีช่วงความมั่นใจที่ระบุไว้ การใช้ค่าเฉลี่ยและช่วงความมั่นใจช่วยให้คุณสามารถทำการทดสอบสมมติฐาน (ดูที่นี่หรือที่นี่ )t

ป้อนคำอธิบายรูปภาพที่นี่

อย่างที่คุณเห็นจากการโพสต์และความคิดเห็นอื่น ๆ ภายใต้หัวข้อนี้ทั้งบ็อกซ์พล็อตและไดนาไมท์เป็นทางเลือกที่ถกเถียงกันดังนั้นฉันขอเสนออีกหนึ่งทางเลือกที่ยังไม่ได้กล่าวถึง ก่อนอื่นให้จำไว้ว่าการทดสอบและการถดถอยมีความสัมพันธ์กัน คุณสามารถพล็อต -test เหมือนเปรียบเทียบกับสองจุดด้วย errorbars (ช่วงความเชื่อมั่น) ที่มีการเชื่อมต่อกับสาย ความชันของเส้นเป็นสัดส่วนกับความชันการถดถอยถ้าคุณใช้การถดถอยเชิงเส้นมากกว่าttt- ทดสอบในสถานการณ์นี้ ข้อได้เปรียบที่สำคัญของพล็อตดังกล่าวคือช่วยให้คุณสามารถตัดสินขนาดของความแตกต่างของวิธีการได้อย่างง่ายดายโดยดูที่ความชันของเส้น ข้อเสียของมันอาจเป็นได้ว่าอาจแนะนำว่ามี "ความต่อเนื่อง" บางอย่างระหว่างค่าเฉลี่ย (นั่นคือคุณได้จับคู่ตัวอย่าง)

ป้อนคำอธิบายรูปภาพที่นี่

Boxplots ดูเหมือนจะใช้กันอย่างแพร่หลายเนื่องจากพวกเขาให้ข้อมูลเพิ่มเติมเกี่ยวกับการกระจายของตัวแปรที่มองเห็น (เปรียบเทียบกับค่าเฉลี่ยกับช่วงความมั่นใจเท่านั้น) พวกเขายังเติมเต็มมากกว่าการทำซ้ำข้อมูลจากการทดสอบและการใช้พล็อตดังกล่าวได้รับการสนับสนุนโดยไกด์นำเที่ยวส่วนใหญ่เช่นโดยคู่มือการตีพิมพ์ของสมาคมจิตวิทยาอเมริกัน :t

ข้อพิจารณาแรกคือค่าข้อมูลของตัวเลขในข้อความของกระดาษที่จะปรากฏ หากตัวเลขไม่เพิ่มขึ้นอย่างมากในความเข้าใจของกระดาษหรือทำซ้ำองค์ประกอบอื่น ๆ ของกระดาษก็ไม่ควรรวม


4
นี่เป็นเรื่องธรรมดาจริง ๆ แม้ในตำราที่พูดถึงการทดสอบ t และ ANOVA แต่ก็เป็นทางเลือกที่พิเศษ พล็อตกล่องไม่แสดงปริมาณใด ๆ ที่เกี่ยวข้องในการทดสอบ t โดยตรง พล็อตที่เกี่ยวข้องควรแสดงค่าเฉลี่ยและให้รายละเอียดเพิ่มเติมเกี่ยวกับการแจกแจงน้อยกว่าพล็อตกล่อง รายละเอียดภายในก้อยมักมีความสำคัญในการตีความการทดสอบ
Nick Cox

ตกลง @NickCox ชุดข้อมูลถูกเลือกเพียงเพื่อการสร้างภาพ แต่ตอนนี้ฉันเปลี่ยนเป็นตัวอย่างที่เหมาะสมกว่า
ทิม

3
พล็อตแท่ง (หรือที่รู้จักว่า "dynamite plot") มีอัตราส่วนของหมึกต่อข้อมูลสูงมาก
Frank Harrell

ใบเสนอราคาจากคู่มือ APA ​​(ฉันไม่ได้ตรวจสอบในบริบท) เป็นคำแนะนำทั่วไปที่ดี แต่ไม่ได้อยู่ในตัวอาร์กิวเมนต์โดยตรงสำหรับการใช้พล็อตกล่องที่เกี่ยวข้องบางส่วนในบริบทนี้ ฉันเห็นด้วยตามธรรมชาติแล้ว boxplots นั้นมีประโยชน์มากและมักจะเสริมและมันใช้บ่อยมาก แต่ประเด็นแรกของฉันยังคงอยู่
Nick Cox

@ NickCox ฉันไม่สามารถพูดได้ว่าฉัน diasagree กับคุณ แต่ฉันจะยังคงพิจารณา boxplot เพื่อให้ข้อมูลเพิ่มเติมและไม่ซ้ำกันผลการทดสอบ t แม้ว่ามันจะไม่เกี่ยวข้องโดยตรงกับการทดสอบ t มันง่ายชัดเจนและให้ข้อมูล
ทิม

8

นี่เป็นรูปแบบส่วนใหญ่เกี่ยวกับคำตอบที่เป็นประโยชน์โดย @Tim และ @gung แต่กราฟไม่สามารถแสดงความคิดเห็นได้

จุดเล็ก ๆ แต่มีประโยชน์:

  1. พล็อตสตริปหรือพล็อตจุดตามที่แสดงโดย @gung ต้องการการแก้ไขหากมีความสัมพันธ์เนื่องจากมีอยู่ในข้อมูลตัวอย่าง จุดที่สามารถซ้อนกันหรือ jittered หรือในตัวอย่างด้านล่างนี้คุณสามารถใช้ไฮบริดพล็อต quantile กล่องตามที่แนะนำโดยเอมานูเอลพาร์เซน (อ้างอิงที่เข้าถึงได้มากที่สุดน่าจะเป็นปี 1979 อิงพารามิเตอร์การสร้างแบบจำลองข้อมูลทางสถิติ. วารสารสมาคมอเมริกันสถิติ74: 105-121) สิ่งนี้มีข้อดีอื่น ๆ เช่นกันโดยการขีดเส้นใต้ว่าหากข้อมูลครึ่งหนึ่งอยู่ในกล่องครึ่งหนึ่งก็อยู่ข้างนอกด้วยและในการแสดงรายละเอียดทั้งหมดของการแจกแจง ในกรณีที่มีเพียงสองกลุ่มดังที่มีในบริบทนี้พล็อตแบบดั้งเดิมที่เป็นกล่อง ๆ อาจมีการแสดงผลน้อยที่สุด บางคนคิดว่าเป็นคุณธรรม แต่มีขอบเขตสำหรับแสดงรายละเอียดเพิ่มเติม อาร์กิวเมนต์ Converse คือพล็อตกล่องทำเครื่องหมายจุดเฉพาะโดยเฉพาะอย่างยิ่งที่มากกว่า 1.5 IQR จากควอไทล์ใกล้เป็นคำเตือนที่ชัดเจนสำหรับผู้ใช้: ระวังด้วยการทดสอบ t เนื่องจากอาจมีจุดในก้อยที่คุณควร กังวลเกี่ยวกับ.

  2. คุณสามารถเพิ่มการบ่งชี้ของค่าเฉลี่ยลงในพล็อตของกล่องซึ่งค่อนข้างบ่อย การเพิ่มเครื่องหมายหรือสัญลักษณ์จุดที่แตกต่างกันเป็นเรื่องปกติ ที่นี่เราเลือกบรรทัดอ้างอิง

ป้อนคำอธิบายรูปภาพที่นี่

แปลงกล่องแบบ Quantile สำหรับผู้สูบบุหรี่และผู้ไม่สูบบุหรี่ กล่องแสดงค่ามัธยฐานและควอไทล์ เส้นแนวนอนในการแสดงสีน้ำเงินหมายถึง

บันทึก. กราฟถูกสร้างใน Stata นี่คือรหัสสำหรับผู้ที่สนใจ จะต้องติดตั้งก่อนหน้านี้ด้วยstripplotssc inst stripplot

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

แก้ไข ความคิดเพิ่มเติมนี้ในการตอบสนองต่อคำตอบโดย @Frank Harrell จะเพิ่มความน่าจะเป็นสองแบบปกติ เส้นแนวนอนแสดงถึงความหมาย บางคนต้องการเพิ่มบรรทัดสำหรับแต่ละกลุ่มที่แสดงถึงความลงตัวเช่นผ่าน ( , ค่าเฉลี่ย) และ ( , ค่าเฉลี่ยค่าSD) หรือทางเลือกที่ทนทานต่อการใช้งาน01+

ป้อนคำอธิบายรูปภาพที่นี่


1
+1, ฉันตั้งใจจะกระวนกระวายใจข้อมูล แต่ฉันยังไม่สามารถเข้าถึงได้ ฉันยังคิดที่จะเพิ่มแปลงขั้นสูงเพิ่มเติมรวมถึงแปลงกล่องแบบควอไทล์พล็อตไวโอลินและแปลง qq แต่ท้ายที่สุดฉันก็ละทิ้งความคิดในการแปลงรายชื่อมากกว่าเดิม
gung - Reinstate Monica

@ gung ยุติธรรมเพียงพอ; น่าเสียดายหรือโชคดีที่เธรดสามารถเปลี่ยนวิธีการเปรียบเทียบการแจกแจงสองแบบโดยทั่วไปได้อย่างง่ายดาย สำหรับตัวอย่างข้อมูลอื่นฮิสโทแกรมอาจเป็นคู่แข่งที่ร้ายแรงเป็นต้น
Nick Cox

5

นอกจากเป้าหมายที่ดีในการนำเสนอผลลัพธ์แล้วยังมีข้อควรพิจารณาบางประการเกี่ยวกับกราฟิกที่ตรวจสอบสมมติฐานของความแปรปรวนเท่ากันสองตัวอย่าง -test เพื่อให้มีประสิทธิภาพที่ดีเยี่ยม นั่นจะเป็นฟังก์ชันผกผันปกติของฟังก์ชันการแจกแจงสะสมเชิงประจักษ์ทั้งสอง เพื่อให้เป็นไปตามสมมติฐานการทดสอบทั้งสองเส้นโค้งต้องเป็นเส้นตรงขนานt


ฉันได้เพิ่มความเป็นไปได้ต่าง ๆ ไว้ในคำตอบของฉันแล้ว
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.