มันมีค่าที่ชัดเจนเกี่ยวกับวัตถุประสงค์ของการวางแผนของคุณ โดยทั่วไปแล้วมีเป้าหมายสองแบบที่แตกต่างกัน: คุณสามารถทำแผนสำหรับตัวคุณเองเพื่อประเมินสมมติฐานที่คุณทำและเป็นแนวทางในกระบวนการวิเคราะห์ข้อมูลหรือคุณสามารถแปลงเพื่อสื่อสารผลลัพธ์ให้ผู้อื่นได้ สิ่งเหล่านี้ไม่เหมือนกัน ตัวอย่างเช่นผู้ชม / ผู้อ่านหลายคนเกี่ยวกับการวางแผน / การวิเคราะห์ของคุณอาจไม่มีความซับซ้อนทางสถิติและอาจไม่คุ้นเคยกับแนวคิดการพูดความแปรปรวนที่เท่ากันและบทบาทในการทดสอบ t คุณต้องการให้พล็อตของคุณถ่ายทอดข้อมูลสำคัญเกี่ยวกับข้อมูลของคุณแม้แต่กับผู้บริโภคอย่างพวกเขา พวกเขาเชื่อมั่นโดยปริยายว่าคุณทำสิ่งต่าง ๆ ได้อย่างถูกต้อง จากการตั้งค่าคำถามของคุณฉันรวบรวมคุณหลังจากประเภทหลัง
ตามความจริงแล้วพล็อตส่วนใหญ่ที่เป็นที่ยอมรับและเป็นที่ยอมรับสำหรับการสื่อสารผลลัพธ์ของ t-test 1ให้กับผู้อื่น (กันว่ามันเหมาะสมที่สุดหรือไม่) เป็นแผนภูมิแท่งที่มีแถบข้อผิดพลาดมาตรฐาน สิ่งนี้ตรงกับการทดสอบ t-t มาก ๆ โดยที่ t-test เปรียบเทียบสองวิธีโดยใช้ข้อผิดพลาดมาตรฐาน เมื่อคุณมีกลุ่มอิสระสองกลุ่มสิ่งนี้จะทำให้ได้รูปภาพที่เป็นธรรมชาติแม้สำหรับผู้ที่ไม่มีความซับซ้อนทางสถิติและผู้คน (ยินดีรับข้อมูล) สามารถ "เห็นได้ทันทีว่าพวกเขาอาจมาจากประชากรสองกลุ่ม" นี่เป็นตัวอย่างง่ายๆโดยใช้ข้อมูลของ @ Tim:
nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se = c(sd(nonsmokers)/sqrt(length(nonsmokers)),
sd(smokers)/sqrt(length(smokers)))
windows()
bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
box()
arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)
ที่กล่าวว่าผู้เชี่ยวชาญด้านการสร้างภาพข้อมูลมักจะดูหมิ่นแผนการเหล่านี้ พวกเขามักเยาะเย้ยว่า "แผนการระเบิด" (cf. , ทำไมแปลงของไดนาไมต์ถึงไม่ดี ) โดยเฉพาะอย่างยิ่งถ้าคุณมีเพียงไม่กี่ข้อมูลก็มักจะแนะนำว่าคุณก็จะแสดงข้อมูลของตัวเอง หากจุดทับซ้อนกันคุณสามารถกระวนกระวายใจในแนวนอน (เพิ่มเสียงรบกวนเล็กน้อย) เพื่อไม่ให้ทับซ้อนกันอีกต่อไป เนื่องจากการทดสอบ t เป็นพื้นฐานเกี่ยวกับค่าเฉลี่ยและข้อผิดพลาดมาตรฐานจึงเป็นการดีที่สุดที่จะวางค่าเฉลี่ยและข้อผิดพลาดมาตรฐานลงบนพล็อตดังกล่าว นี่คือรุ่นอื่น:
set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE,
xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)
หากคุณมีข้อมูลจำนวนมาก boxplots อาจเป็นทางเลือกที่ดีกว่าในการรับภาพรวมอย่างรวดเร็วของการแจกแจงและคุณสามารถวางค่าเฉลี่ยและ SE ที่นั่นได้เช่นกัน
data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see
พล็อตเรื่องง่าย ๆ ของข้อมูลและบ็อกซ์พล็อตนั้นเรียบง่ายพอที่คนส่วนใหญ่จะสามารถเข้าใจได้แม้ว่าพวกเขาจะไม่เข้าใจในเรื่องสถิติก็ตาม อย่างไรก็ตามโปรดจำไว้ว่าไม่มีสิ่งใดที่ทำให้ง่ายต่อการประเมินความถูกต้องของการใช้แบบทดสอบ t-test เพื่อเปรียบเทียบกลุ่มของคุณ เป้าหมายเหล่านั้นให้บริการที่ดีที่สุดโดยแปลงที่แตกต่างกัน
1. โปรดทราบว่าการสนทนานี้ถือว่าตัวอย่างอิสระ t-test พล็อตเหล่านี้สามารถใช้กับตัวอย่างที่ต้องพึ่งพาการทดสอบ t แต่อาจทำให้เข้าใจผิดในบริบทนั้น (เช่นการใช้แถบข้อผิดพลาดสำหรับวิธีการในการศึกษาในวิชาที่ไม่ถูกต้องหรือไม่ )