เหตุใดข้อความที่ตัดตอนมานี้บอกว่าการประมาณค่าเบี่ยงเบนมาตรฐานโดยปกติจะไม่เกี่ยวข้องกัน


14

ฉันอ่านเกี่ยวกับการคำนวณการประมาณค่าเบี่ยงเบนมาตรฐานและแหล่งข้อมูลที่ฉันอ่านระบุไว้

(... ) ยกเว้นในบางสถานการณ์ที่สำคัญงานมีความเกี่ยวข้องเพียงเล็กน้อยกับการใช้งานสถิติเนื่องจากความต้องการของมันถูกหลีกเลี่ยงโดยขั้นตอนมาตรฐานเช่นการใช้การทดสอบที่สำคัญและช่วงความเชื่อมั่นหรือโดยใช้การวิเคราะห์แบบเบย์

ฉันสงสัยว่าถ้าใครสามารถอธิบายเหตุผลของข้อความนี้ได้ตัวอย่างเช่นช่วงความมั่นใจไม่ได้ใช้ค่าเบี่ยงเบนมาตรฐานเป็นส่วนหนึ่งของการคำนวณหรือไม่ ดังนั้นช่วงความเชื่อมั่นจะไม่ได้รับผลกระทบจากค่าเบี่ยงเบนมาตรฐานแบบเอนเอียงหรือไม่?

แก้ไข:

ขอบคุณสำหรับคำตอบจนถึงตอนนี้ แต่ฉันไม่แน่ใจว่าฉันทำตามเหตุผลบางอย่างของพวกเขาดังนั้นฉันจะเพิ่มตัวอย่างง่าย ๆ ประเด็นก็คือว่าถ้าแหล่งข้อมูลนั้นถูกต้องแล้วก็มีบางอย่างผิดปกติจากการสรุปตัวอย่างและฉันอยากให้ใครสักคนชี้ให้เห็นว่าค่า p ไม่ได้ขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานอย่างไร

สมมติว่านักวิจัยต้องการทดสอบว่าคะแนนเฉลี่ยของนักเรียนระดับประถมห้าในการทดสอบในเมืองของเขาหรือเธอแตกต่างจากค่าเฉลี่ยของชาติที่ 76 ด้วยระดับนัยสำคัญ 0.05 หรือไม่ ผู้วิจัยสุ่มตัวอย่างนักเรียน 20 คน ค่าเฉลี่ยตัวอย่างเท่ากับ 80.85 ค่าเบี่ยงเบนมาตรฐานตัวอย่างเท่ากับ 8.87 ซึ่งหมายความว่า: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44 จากนั้นใช้ตาราง t เพื่อคำนวณว่าค่าความน่าจะเป็นแบบสองด้านที่เท่ากับ 2.44 กับ 19 df เท่ากับ 0.025 นี่ต่ำกว่าระดับนัยสำคัญ 0.05 เราจึงปฏิเสธสมมติฐานว่าง

ดังนั้นในตัวอย่างนี้ค่า p (และอาจเป็นข้อสรุปของคุณ) จะไม่เปลี่ยนแปลงขึ้นอยู่กับว่าคุณประเมินค่าเบี่ยงเบนมาตรฐานตัวอย่างของคุณหรือไม่


2
สิ่งนี้ดูแปลกสำหรับเหตุผลที่คุณให้ บางทีคุณอาจให้ย่อหน้ากับเรามาก่อนด้วยในกรณีที่มีบางอย่างที่เราขาดหายไป? สิ่งหนึ่งที่ทำให้ความลำเอียงไม่ใช่เรื่องใหญ่ก็คือมันค่อนข้างไม่สำคัญเพราะขนาดตัวอย่างใหญ่ขึ้นและอาจไม่สำคัญเมื่อเทียบกับปัญหาอื่น ๆ ทั้งหมดเช่นแบบจำลองข้อมูลผิดพลาดที่เรามีตามปกติ - แต่นี่ไม่ใช่เหตุผล ให้ในแหล่งของคุณ
ปีเตอร์เอลลิส

1
@PeterEllis นี่มาจากหน้าวิกิพีเดียในหัวข้อ "การประมาณค่าส่วนเบี่ยงเบนมาตรฐานที่ไม่เอนเอียง" ( en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation )
BYS2

คำตอบ:


17

ฉันเห็นด้วยกับ Glen_b ในเรื่องนี้ บางทีฉันอาจเพิ่มคำสองสามคำเพื่อให้ประเด็นชัดเจนยิ่งขึ้น หากข้อมูลมาจากการแจกแจงแบบปกติ (สถานการณ์ iid) ที่มีความแปรปรวนที่ไม่ทราบค่าสถิติ t คือปริมาณสำคัญที่ใช้ในการสร้างช่วงความมั่นใจและทำการทดสอบสมมติฐาน สิ่งเดียวที่สำคัญสำหรับการอนุมานนั้นคือการกระจายตัวของมันภายใต้สมมติฐานว่าง (สำหรับการกำหนดค่าวิกฤต) และภายใต้ทางเลือกอื่น (เพื่อกำหนดพลังงานและตัวอย่าง) นั่นคือการแจกแจง t กลางและ noncentral ตามลำดับ ตอนนี้เมื่อพิจารณาถึงปัญหาตัวอย่างหนึ่งการทดสอบ t ยังมีคุณสมบัติที่ดีที่สุดเป็นการทดสอบค่าเฉลี่ยของการแจกแจงแบบปกติ ตอนนี้ความแปรปรวนตัวอย่างเป็นตัวประมาณค่าความแปรปรวนประชากรแบบไม่เอนเอียง แต่สแควร์รูทเป็นตัวประมาณค่าความเบี่ยงเบนมาตรฐานของประชากรแบบ BIASED มันไม่ได้ ไม่ว่าตัวประมาณค่า BIASED นี้จะเข้าสู่ตัวหารปริมาณที่เป็นหัวใจ ตอนนี้มันมีบทบาทในการเป็นตัวประมาณที่สอดคล้องกัน นั่นคือสิ่งที่ทำให้การแจกแจง t เข้าใกล้มาตรฐานปกติขณะที่ขนาดตัวอย่างไปถึงอนันต์ แต่ถูกลำเอียงสำหรับการแก้ไขใด ๆไม่มีผลต่อคุณสมบัติที่ดีของการทดสอบn

ในความเห็นของฉันความเป็นกลางจะเน้นในชั้นเรียนสถิติเบื้องต้น ความแม่นยำและความสม่ำเสมอของตัวประมาณค่าเป็นคุณสมบัติจริงที่สมควรได้รับการเน้น

สำหรับปัญหาอื่น ๆ ที่ใช้วิธีการแบบพารามิเตอร์หรือแบบไม่อิงพารามิเตอร์การประมาณค่าเบี่ยงเบนมาตรฐานจะไม่แม้แต่ป้อนในสูตร


7
มันขึ้นอยู่กับการประมาณค่า แต่มีการประมาณค่าเพียงค่าเดียวที่ t กับอิสรภาพ 19 องศาใช้และการประมาณนั้นคือรากที่สองของการประมาณค่าปกติของความแปรปรวนตัวอย่าง ถ้าคุณใช้การประมาณค่าเบี่ยงเบนมาตรฐานอื่นคุณมีการแจกแจงการอ้างอิงที่แตกต่างกันสำหรับสถิติการทดสอบภายใต้สมมติฐานว่าง มันไม่ใช่เสื้อ
Michael R. Chernick

2
@ BYS2: โปรดทราบว่าในแง่ของช่วงเวลาที่สร้างในตัวอย่างที่คุณให้ไม่มีอะไรการเปลี่ยนแปลงๆ โดยการคูณค่าเบี่ยงเบนมาตรฐานตัวอย่างด้วยตัวคูณสเกล (เช่นเพื่อให้ไม่มีความเป็นกลาง) กระจายของสถิติทดสอบจะเปลี่ยน (เล็กน้อย) ในกรณีนี้ แต่ CI สร้างจะจบลงด้วยการตรงเดียวกัน! ทีนี้ถ้าคุณทำ "การแก้ไข" บางอย่างที่ขึ้นอยู่กับข้อมูลด้วยตัวเองมันจะให้ผลต่างออกไป (โดยทั่วไป) ดูความคิดเห็นของฉันภายใต้คำตอบของเกลน
พระคาร์ดินัล

4
@ BYS2: ในกรณีที่รุ่นปกติโดยใช้ -statistic มีการติดต่อที่ดีระหว่าง CIS และพี -value ดังนั้นค่าpจะไม่เปลี่ยนแปลงหากคุณ "rescale" ค่าเบี่ยงเบนมาตรฐานตัวอย่างโดยค่าคงที่ที่รู้จัก ตัวอย่างเช่น: Let ~ T B = ( ˉ X - μ ) / ( σ ) = T / Bสำหรับการแก้ไขB > 0 จากนั้นP ( ˜ T b > u ) = P (tppT~b=(X¯μ)/(bσ^)=T/bb>0และดังนั้นค่าวิกฤต ˜ t b , α = b t αคือมีการติดต่อแบบหนึ่งต่อหนึ่งระหว่างพวกเขา มันสมเหตุสมผลไหม
P(T~b>u)=P(T>bu)
t~b,α=btα
พระคาร์ดินัล

1
ไม่มีสิ่งที่พระคาร์ดินัลชี้ให้เห็นอย่างถูกต้องคือมันเป็นไปได้ที่จะคูณสถิติ t ด้วยค่าคงที่เพื่อใช้การประมาณค่าเบี่ยงเบนมาตรฐานที่แตกต่างกัน สถิติทดสอบไม่มีการแจกแจงแบบ t อีกต่อไป มันเป็นการกระจายตัวที่แตกต่างกันเล็กน้อยเนื่องจากค่าคงที่ ค่าเฉลี่ยการเปลี่ยนแปลงโดยปัจจัยของ b และส่วนเบี่ยงเบนมาตรฐาน เมื่อคุณคำนวณค่าวิกฤตสำหรับสถิติการทดสอบมันจะเปลี่ยนไปอย่างเหมาะสมตามที่เขาอธิบายข้างต้น
Michael R. Chernick

1
@ BYS2 ใช่ถูกต้อง
Michael R. Chernick

5

พิจารณาช่วงเวลาที่คำนวณโดยพิจารณาจากปริมาณที่เป็นหัวใจเช่นสถิติ t ค่าเฉลี่ยของตัวประมาณค่าเบี่ยงเบนมาตรฐานไม่ได้เข้ามาจริงๆ - ช่วงเวลานั้นขึ้นอยู่กับการกระจายตัวของสถิติ ดังนั้นคำพูดที่ถูกต้องเท่าที่จะไป


1
ใช่ แต่การกระจายตัวของสถิตินั้นไม่ขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานซึ่งเป็นที่รู้จักในกรณีส่วนใหญ่ดังนั้นคุณจำเป็นต้องใช้ตัวประมาณ
BYS2

4
(+1) เกลน ถึง @ BYS2: มีประเด็นสำคัญสองประการที่นี่ ก่อนอื่นถ้าเรามีปริมาณที่เป็นหัวใจอยู่ในมือมันเป็นวิธีที่สะดวกมากสำหรับการสร้างชุดความเชื่อมั่น แต่มันก็ไม่ได้มีอยู่จริง จุดรวมของปริมาณการพิจาณาเป็นว่าการกระจายขึ้นอยู่หมดจดในที่รู้จักกันในปริมาณ ประการที่สองปริมาณการพิจาณาเชื่อมโยงอย่างใกล้ชิดกับแบบจำลองพื้นฐาน หากข้อมูลเบี่ยงเบนไปจากแบบจำลองที่คาดเดาไว้การกระจายตัวของสถิติการทดสอบก็อาจทำได้เช่นกันและการจำแนกลักษณะของปริมาณที่เป็นหัวใจอาจไม่เกี่ยวข้องเท่ากัน :)
สำคัญ

4

การตีความเป็นการคาดเดาส่วนหนึ่งเสมอ แต่ฉันคิดว่าความหมายโดยนัยคือบ่อยครั้งที่คุณจะได้รับผลลัพธ์ที่คุณต้องการโดยไม่ต้องประเมินค่าเบี่ยงเบนมาตรฐานอย่างชัดเจน ในคำอื่น ๆ ฉันคิดว่าผู้เขียนอ้างถึงสถานการณ์ที่คุณจะไม่ใช้ค่าประมาณของค่าเบี่ยงเบนมาตรฐานแทนที่จะเป็นค่าประมาณแบบเอนเอียง

ตัวอย่างเช่นหากคุณสามารถสร้างการประมาณการกระจายตัวของสถิติทั้งหมดคุณสามารถคำนวณช่วงความเชื่อมั่นได้โดยไม่ต้องใช้ค่าเบี่ยงเบนมาตรฐาน ในความเป็นจริงสำหรับการแจกแจงแบบไม่ปกติจำนวนมากค่าเบี่ยงเบนมาตรฐานเอง (และค่าเฉลี่ย) นั้นไม่เพียงพอที่จะคำนวณค่าประมาณของช่วงความมั่นใจ ในกรณีอื่น ๆ เช่นการทดสอบเครื่องหมายคุณไม่จำเป็นต้องมีการประมาณค่าเบี่ยงเบนมาตรฐานเช่นกัน

(แน่นอนว่ามันไม่สำคัญเลยที่จะสร้างการประมาณแบบไม่เอนเอียงของการแจกแจงแบบเต็มและในสถิติแบบเบย์มันเป็นเรื่องธรรมดามากที่จะแนะนำอคติอย่างชัดเจนก่อนหน้านี้)


1
มันอาจเป็นเรื่องที่น่าสนใจที่จะขยายอย่างเต็มที่อีกเล็กน้อยเกี่ยวกับสิ่งที่คุณหมายถึงในย่อหน้าสุดท้าย ตัวอย่างเช่นถ้าฉันสามารถสุ่มตัวอย่างจากการกระจายตัวของสถิติที่อยู่ในมือแล้ว ct เชิงประจักษ์ให้วิธีที่ง่ายและง่ายมากสำหรับการสร้างการประมาณฟังก์ชั่นการกระจายที่เป็นกลาง :)
สำคัญ

1
maxiXimaxiXiXi

1
XiimaxiXi

2
นี่เป็นเรื่องจริงและใกล้เคียงกับจุดที่ฉันพยายามดึงออกมา ประโยคแรกของย่อหน้าสุดท้ายหมายถึงการสร้างการประมาณที่ไม่เอนเอียงของฟังก์ชันเชิงสถิติที่ไม่เชิงเส้นจากตัวอย่างสุ่มเพียงตัวอย่างเดียว นี่ค่อนข้างแตกต่างจากการสร้างการประมาณแบบไม่เอนเอียงของการแจกแจงแบบเต็มจากตัวอย่างแบบสุ่มของฟังก์ชัน :-)
พระคาร์ดินัล
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.