ข้อผิดพลาดมาตรฐานที่ใช้คืออะไร


9

ฉันใช้บทช่วยสอนที่ฉันพบและวางแผนค่าเฉลี่ยพร้อมกับข้อผิดพลาดมาตรฐานเพื่อแสดงข้อมูลของฉัน แต่ฉันมีปัญหาเกี่ยวกับผลลัพธ์ พล็อตของฉันดังที่แสดงด้านล่าง: ข้อผิดพลาดมาตรฐานบางอย่าง (แสดงเป็นแถบข้อผิดพลาด) แตกต่างกันมากและบางข้อก็ใกล้เคียงกับศูนย์มาก

ป้อนคำอธิบายรูปภาพที่นี่


2
ปัญหาด้านนี่คือการใช้บาร์มีแนวโน้มที่จะพิสูจน์ความสับสน แถบลงเป็นงานที่หนักหน่วงกว่าบาร์ขึ้น โดยพื้นฐานแล้วบาร์เริ่มต้นที่ 1e-3 นั้นเป็นกฎเกณฑ์ การแสดงจุดประมาณโดยสัญลักษณ์สัญลักษณ์และการเพิ่มแถบข้อผิดพลาดนั้นง่ายกว่าการแสดงแถบบวกแถบข้อผิดพลาด Google "วางแผนไดนาไมต์" ให้มากขึ้น
Nick Cox

ฉันไม่แน่ใจว่าคำถามคืออะไร จากคำตอบที่คุณทำเครื่องหมายถูกต้องและชื่ออาจเป็นเพียงการรู้ว่าข้อผิดพลาดมาตรฐานคืออะไร แต่จากสิ่งที่คุณมีที่นี่ดูเหมือนว่าคุณต้องการความช่วยเหลือในการอธิบายข้อมูล คุณช่วยอธิบายให้ชัดเจนในคำถามได้ไหม? นอกจากนี้หากคุณต้องการความช่วยเหลือในการอธิบายข้อมูลโปรดเชื่อมโยงเพิ่มเติมเกี่ยวกับข้อมูลไม่ใช่เพียงแค่ตัวเลข ค่า N ในแต่ละกลุ่มและค่าเฉลี่ยจะเป็นประโยชน์อย่างไร การแปลงใด ๆ ที่ทำจะเป็นประโยชน์เช่นกัน
จอห์น

คำตอบ:


10

แถบข้อผิดพลาดโดยทั่วไปคือการโน้มน้าวให้ผู้อ่านพล็อตว่าความแตกต่างที่เขา / เธอเห็นในพล็อตมีความสำคัญทางสถิติ ในการประมาณค่าคุณอาจจินตนาการว่าเกาส์รัสเซียขนาดเล็กซึ่งช่วงแสดงเป็นแถบข้อผิดพลาดนี้ - "การรวมด้วยภาพ" ของผลิตภัณฑ์ของสองเกาส์เช่นนี้มีโอกาสน้อยกว่าที่ค่าทั้งสองจะเท่ากันจริง ๆ±1σ

ในกรณีนี้เราจะเห็นได้ว่าทั้งความแตกต่างระหว่างแถบสีแดงกับสีม่วงและสีเทาและสีเขียวนั้นไม่สำคัญมากนัก


ข้อผิดพลาดมาตรฐานในกรณีนี้คืออะไร เป็นแถบข้อผิดพลาดพล็อต
berkay

มันเป็นแถบข้อผิดพลาดที่ไม่ดีถ้านั่นคือจุดประสงค์ การไม่ซ้อนกันของแท่งนั้นไม่เพียงพอสำหรับนัยสำคัญทางสถิติและจำนวนของการซ้อนทับที่จำเป็นต้องใช้จริงจะแตกต่างกันอย่างมีนัยสำคัญที่ 0.05 แตกต่างกันกับ N. และสิ่งที่ heck ไม่ "สำคัญเกินไป" หมายถึงอะไร เงื่อนไขส่วนเล็กน้อยที่คุณชี้ให้เห็นอาจล้มเหลวในการทดสอบ t
จอห์น

@John ตามที่ฉันเขียนแถบข้อผิดพลาดเป็นเงื่อนงำที่มองเห็นได้เพื่อช่วยทำการประเมินเฉพาะกิจในขณะที่ตรวจสอบพล็อต การทดสอบจริงต้องมีการทดสอบสมมติฐานดังนั้นจึงควรเกิดขึ้นในข้อความ

11

โดยทั่วไปแล้วข้อผิดพลาดมาตรฐานจะบอกคุณว่าคุณมีความไม่แน่นอนว่ามูลค่าที่แท้จริงของแถบด้านบนนั้นเป็นที่ที่แถบบอกว่าเป็นอย่างไร เมื่อมีหลายแท่งมันยังสามารถเปิดใช้งานการเปรียบเทียบระหว่างแท่งในแง่ของการทดสอบทางสถิติ อย่างไรก็ตามการตีความพวกเขาด้วยวิธีนี้จำเป็นต้องมีข้อสมมติฐานบางอย่างดังแสดงด้านล่าง หากคุณสนใจที่จะเปรียบเทียบบาร์เพื่อดูว่าความแตกต่างนั้นมีนัยสำคัญทางสถิติหรือไม่คุณควรทำการทดสอบกับข้อมูลและแสดงว่าการทดสอบใดมีความสำคัญเช่นนี้

การเปรียบเทียบนัยสำคัญ

นอกจากนี้ฉันขอแนะนำให้ใช้ช่วงความมั่นใจมากกว่าข้อผิดพลาดมาตรฐาน

บทความนี้คุ้มค่าต่อการอ่าน:

คัมมิงและนกกระจอก "การอนุมานด้วยตา: ช่วงความเชื่อมั่นและวิธีอ่านรูปภาพของข้อมูล" กำลังจิต ฉบับ 60, หมายเลข 2, 170–180

ข้อสรุปโดยรวมของพวกเขาคือ: "ค้นหาบาร์ที่เกี่ยวข้องโดยตรงกับผลกระทบที่น่าสนใจมีความอ่อนไหวต่อการออกแบบการทดลองและตีความช่วงเวลา"

สำหรับตัวอย่างอิสระใช้ช่วงความมั่นใจทับซ้อนครึ่งหนึ่งของ CIs หมายถึงความแตกต่างมีนัยสำคัญทางสถิติ

บาร์อิสระ

สำหรับตัวอย่างอิสระที่ใช้แถบข้อผิดพลาดมาตรฐานแทนกราฟต่อไปนี้จะแสดงให้คุณเห็นวิธีการนัยสำคัญทางสถิติ:

แถบ indep, SE


นี่ไม่ใช่คำตอบจริงๆ (แต่) คุณจะช่วยเพิ่มการอ้างอิงนี้ด้วยข้อมูลบางส่วนเกี่ยวกับวิธีช่วยตอบคำถามของ OP ไหม (btw ฉันไม่ใช่ผู้ลงคะแนน)
gung - Reinstate Monica

1
@gung ชีวิตจริงแทรกแซงดังนั้นฉันโพสต์คำตอบบางส่วน Updated
Ari B. Friedman

6

ดังที่ mbq กล่าวว่าแถบข้อผิดพลาดเป็นวิธีที่ทำให้ผู้อ่านของคุณรู้สึกว่าความแตกต่างระหว่างสองกลุ่มนั้นมีความสำคัญ - เช่นถ้าการเปลี่ยนแปลงภายในกลุ่มแต่ละกลุ่มของคุณมีขนาดเล็กพอที่จะเชื่อว่าความแตกต่างที่คุณพบสำหรับค่าเฉลี่ยระหว่างกลุ่มของคุณ

ทุกอย่างเท่ากันแถบข้อผิดพลาดที่ใหญ่กว่าหมายถึงความแตกต่างภายในกลุ่มมากขึ้น แต่ดูเหมือนแกน y ของพล็อตของคุณจะถูกแปลงเป็นบันทึกเพื่อให้กลุ่มที่ต่ำกว่าไม่ได้อยู่ในระดับเดียวกับที่สูงกว่า

คุณควรระวังผู้อ่านของคุณจำนวนมากจะไม่เข้าใจว่าแถบข้อผิดพลาดแสดงถึงอะไรแม้ว่าคุณจะอธิบายอย่างชัดเจนก็ตาม! บ่อยครั้งที่คุณสามารถบรรลุเป้าหมายเดียวกันได้ด้วยการพล็อตพล็อตแบบกระวนกระวายใจหรือบ็อกซ์ล็อต (หรือทั้งสองอย่างพร้อมกัน) เพื่อให้ได้เอฟเฟกต์เดียวกัน


เกี่ยวกับบทความที่คุณพูดถึงมันเป็นการสังเกตที่น่าสนใจ แต่มันก็ไม่แปลกใจสำหรับฉัน ฉันพบว่าส่วนสำคัญของแนวคิดทางสถิติและการปฏิบัติทั่วไปเป็นความสับสนและซับซ้อน (แม้ว่าฉันจะมีพื้นฐานที่แข็งแกร่งในวิชาคณิตศาสตร์และมีหลักสูตรจำนวนมากในสถิติทางคณิตศาสตร์) โดยส่วนตัวแล้วฉันรู้สึกว่าแนวคิดจำนวนมากจะง่ายต่อการเข้าใจมากขึ้นหากพวกเขาได้รับการสอนทางสายตาและใช้ตัวอย่างแทนที่จะเป็นคำอธิบายที่ยาวและซับซ้อน
posdef

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.