ด้วยขนาดตัวอย่างที่ใหญ่พอการทดสอบจะแสดงผลลัพธ์ที่สำคัญเสมอเว้นแต่ขนาดของผลจริงจะเป็นศูนย์ ทำไม?


21

ฉันอยากรู้เกี่ยวกับการอ้างสิทธิ์ในบทความของ Wikipedia เกี่ยวกับขนาดของเอฟเฟกต์ โดยเฉพาะ:

[... ] การเปรียบเทียบทางสถิติที่ไม่เป็นโมฆะมักจะแสดงผลลัพธ์ที่มีนัยสำคัญทางสถิติเว้นแต่ขนาดผลกระทบของประชากรจะเป็นศูนย์

ฉันไม่แน่ใจว่าสิ่งนี้หมายถึง / นัยให้อาร์กิวเมนต์เพื่อสำรอง ฉันเดาหลังจากทั้งหมดผลคือสถิติคือค่าที่คำนวณจากตัวอย่างที่มีการแจกแจงของตัวเอง นี่หมายความว่าเอฟเฟ็กต์ไม่เคยเกิดจากการเปลี่ยนแปลงแบบสุ่ม (ซึ่งเป็นสิ่งที่ฉันเข้าใจว่ามันไม่สำคัญ) ถ้าอย่างนั้นเราเพียงแค่พิจารณาว่าผลกระทบนั้นแข็งแกร่งเพียงพอหรือไม่ - มีค่าสัมบูรณ์สูง

ฉันกำลังพิจารณาถึงผลกระทบที่ฉันคุ้นเคยมากที่สุด: สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน r ดูเหมือนจะขัดแย้งกับเรื่องนี้ ทำไมใด ๆถึงมีนัยสำคัญทางสถิติ? ถ้ามีขนาดเล็กเส้นถดถอยของเราคือ r y = a x + b = r ( s yRR

Y=ax+=R(sYsx)=εx+

สำหรับ small ใกล้เคียงกับ 0 การทดสอบ F น่าจะมีช่วงความมั่นใจที่มี 0 สำหรับความชัน นี่ไม่ใช่ตัวอย่างจริงหรือε


10
คำแนะนำ: ข้อก่อนส่วนที่คุณยกมาเป็นสิ่งจำเป็น " ด้วยขนาดของกลุ่มตัวอย่างที่มีขนาดใหญ่พอการเปรียบเทียบทางสถิติที่ไม่เป็นโมฆะจะแสดงผลลัพธ์ที่มีนัยสำคัญทางสถิติเว้นแต่ว่าขนาดผลกระทบของประชากรจะมีค่าเท่ากับศูนย์ ... "
ประสาทวิทยา

@Kodiologist: แต่อีกครั้งตัวอย่างของฉันนี่จะหมายความว่าถ้าขนาดตัวอย่างใหญ่ขึ้น r ก็จะใหญ่ขึ้นด้วยหรืออย่างน้อยนิพจน์จะใหญ่ขึ้นถ้าขนาดตัวอย่างใหญ่ขึ้นหรือไม่ ฉันไม่เห็นมัน r(sy/sx)
แกรี่

5
หากสิ่งนี้ไม่เป็นจริงมันจะเป็นข้อบกพร่องในวิธีการทางสถิติ หากแน่นอนขนาดตัวอย่างบางส่วนมีขนาดใหญ่พอที่จะตรวจจับความแตกต่าง μ>μ0
John Coleman

คำตอบ:


26

เป็นตัวอย่างง่ายๆสมมติว่าฉันกำลังประเมินความสูงของคุณโดยใช้จัมโบ้จัมโบ้สถิติ

คุณบอกกับคนอื่นเสมอว่าคุณมีความสูง 177 ซม. (ประมาณ 5 ฟุต 10 นิ้ว)

ถ้าฉันทดสอบสมมติฐานนี้ (ความสูงของคุณเท่ากับ 177 ซม., ) และฉันสามารถลดข้อผิดพลาดในการวัดของฉันได้มากพอฉันก็พิสูจน์ได้ว่าคุณไม่ได้อยู่ในความจริง 177 ซม. ในที่สุดถ้าฉันประเมินความสูงของคุณเป็นตำแหน่งทศนิยมที่เพียงพอคุณจะเบี่ยงเบนจากความสูงที่ระบุไว้ที่ 177.00000000 ซม. บางทีคุณอยู่ที่ 177.02 ซม. ฉันต้องลดข้อผิดพลาดให้น้อยกว่า. 02 เพื่อหาว่าคุณไม่ได้เป็น 177 ซม.ชั่วโมง=177

ฉันจะลดข้อผิดพลาดในสถิติได้อย่างไร รับตัวอย่างที่ใหญ่กว่า หากคุณได้รับตัวอย่างที่มากพอข้อผิดพลาดจะเล็กมากจนคุณสามารถตรวจจับการเบี่ยงเบนน้อยที่สุดจากสมมติฐานว่าง


2
นี่เป็นคำอธิบายที่ชัดเจนและรัดกุม มันอาจจะมีประโยชน์มากกว่าสำหรับการทำความเข้าใจว่าทำไมสิ่งนี้ถึงเกิดขึ้นได้มากกว่าคำตอบทางคณิตศาสตร์ ทำได้ดี.
ไม่มีใครใน

1
อธิบายอย่างชัดเจน แต่ฉันคิดว่ามันเป็นสิ่งสำคัญเช่นกันที่จะต้องพิจารณาว่ามีหลายกรณีที่มูลค่าที่ระบุไว้นั้นแน่นอนอย่างแท้จริง ตัวอย่างเช่นการแยกสิ่งประหลาดที่เกิดขึ้นในทฤษฎีสตริง ฯลฯ การวัดจำนวนมิติเชิงพื้นที่ของจักรวาลของเรา (ซึ่งสามารถทำได้) กำลังจะให้ 3 และไม่ว่าคุณจะทำการวัดนั้นแม่นยำแค่ไหน ไม่เคยพบความเบี่ยงเบนอย่างมีนัยสำคัญทางสถิติอย่างสม่ำเสมอจาก 3 แน่นอนว่าถ้าคุณทดสอบต่อไปเรื่อย ๆ คุณจะได้รับความเบี่ยงเบนบางอย่างเนื่องจากความแปรปรวน แต่นั่นเป็นปัญหาที่แตกต่างออกไป
David Z

อาจเป็นคำถามที่ไร้เดียงสา แต่ถ้าฉันอ้างว่าฉันคือ 177 ซม. แนวคิดของตัวเลขนัยสำคัญไม่ได้หมายความว่าฉันแค่พูดว่าฉันอยู่ระหว่าง 176.5 และ 177.5? คำตอบดูเหมือนจะให้แนวคิดทางทฤษฎีที่ดีจริง แต่มันไม่ได้ขึ้นอยู่กับหลักฐานเท็จ? ฉันพลาดอะไรไป
JimLohse

ในกรณีนี้ความสูงที่ระบุไว้ของ 177 นั้นคล้ายคลึงกับสมมติฐานว่างในสถิติ ในการทดสอบสมมติฐานแบบดั้งเดิมเพื่อความเท่าเทียมกันคุณต้องแสดงความเท่าเทียมกัน (เช่น ) ประเด็นก็คือไม่ว่าคุณจะระบุความสูงของคุณเป็นอย่างไรฉันสามารถพิสูจน์ได้โดยการลดข้อผิดพลาดเว้นแต่ว่าสมมติฐานว่างเปล่านั้นเป็นจริงอย่างแน่นอน ฉันใช้ความสูงเป็นตัวอย่างที่เข้าใจง่าย แต่แนวคิดนี้เหมือนกันในพื้นที่อื่น ๆ (สาร x ไม่ก่อให้เกิดมะเร็งเหรียญนี้ยุติธรรม ฯลฯ )μ=177
Underminer

13

@Kodiologist ชี้ให้เห็นว่านี่เป็นสิ่งที่เกิดขึ้นจริงสำหรับตัวอย่างขนาดใหญ่ สำหรับกลุ่มตัวอย่างขนาดเล็กไม่มีเหตุผลว่าทำไมคุณไม่สามารถมีผลบวกปลอมหรือลบเท็จได้

ฉันคิดว่าการทดสอบทำให้กรณีของซีมโทติคชัดเจนที่สุด สมมติว่าเรามีX 1 , ... , X n IID ~ N ( μ , 1 )และเราต้องการที่จะทดสอบH 0 : μ = 0 VS H : μ 0 สถิติทดสอบของเราคือ Z n = ˉ X n - 0ZX1,...,Xn~IIDยังไม่มีข้อความ(μ,1)H0:μ=0HA:μ0

Zn=X¯n-01/n=nX¯n.

ดังนั้นZn=X¯n~ยังไม่มีข้อความ(μ,1n)) เรามีความสนใจในP(|Zn|อัลฟ่า) P(|Zn|α)=P(Zn-α)+P(Znα)=1+Φ(-α-μZn=nX¯n~ยังไม่มีข้อความ(μn,1)P(|Zn|α)

P(|Zn|α)=P(Zn-α)+P(Znα)
ให้YN(0,1)เป็นตัวแปรอ้างอิงของเรา ภายใต้H0μ=0ดังนั้นเราจึงมีP(|Zn|α)=1-P(-αYα)เพื่อให้เราสามารถเลือกαควบคุมอัตราความผิดพลาดประเภทของเราเป็นที่ต้องการ แต่ภายใต้Hμ
=1+Φ(-α-μn)-Φ(α-μn).
Y~ยังไม่มีข้อความ(0,1)H0 μ=0P(|Zn|α)=1-P(-αYα)αHA ดังนั้น P(|Zn|อัลฟ่า)1+Φ(±)-Φ(±)=1 เพื่อให้มีความน่าจะเป็น 1 เราจะปฏิเสธH0ถ้าμ0(คน±คือในกรณีของμ<0แต่อินฟินิตี้ทั้งสองมีสัญญาณเหมือนกัน)μn0
P(|Zn|α)1+Φ(±)-Φ(±)=1
H0μ0±μ<0

μ 0μ01nHA1n

H0:ρ=ρ0HA:ρρ01


1
μ<0Zn-

1
μ=0X¯p0n

1
@DeltaIV ใช่ไหมถ้าอัตราการลู่เข้าแตกต่างกันหนึ่งจะต้องมีขนาดที่แตกต่างกันเพื่อให้ได้การแจกแจงแบบไม่มีค่า Nondegenerate แต่สำหรับตัวอย่างปัจจุบัน root-n เป็นอัตราที่เหมาะสม
Christoph Hanck

1
nX¯0

7

เนื้อหาที่พวกเขาพูดนั้นผิดถ้าไม่มีเหตุผลอื่นนอกจากการใช้ "สิ่งนี้เกิดขึ้นเสมอ "

ฉันไม่รู้ว่านี่เป็นจุดเริ่มต้นของความสับสนที่คุณมีหรือไม่ แต่ฉันจะโพสต์เพราะฉันคิดว่าหลายคนทำและจะสับสนโดย:

Xnn>n0X

Limnราคา(X)=1

สิ่งที่พวกเขาพูดอย่างแท้จริงแปลต่อไปนี้:

nn0

สิ่งที่พวกเขาพยายามจะพูดคือต่อไปนี้:

สำหรับระดับความสำคัญใด ๆ เมื่อขนาดของตัวอย่างเพิ่มขึ้นความน่าจะเป็นที่การทดสอบแบบไม่เป็นโมฆะให้ผลลัพธ์ที่มีนัยสำคัญใกล้เคียงกับ 1 หากขนาดผลจริงไม่เป็นศูนย์

มีความแตกต่างที่สำคัญที่นี่:

  • ไม่มีการรับประกัน คุณมีแนวโน้มที่จะได้รับผลลัพธ์ที่สำคัญโดยมีกลุ่มตัวอย่างที่ใหญ่กว่าเท่านั้น ตอนนี้พวกเขาสามารถหลบส่วนหนึ่งของความผิดได้ที่นี่เพราะจนถึงตอนนี้มันก็แค่เรื่องคำศัพท์ ในบริบทของความน่าจะเป็นก็เป็นที่เข้าใจกันว่าคำสั่ง"ถ้า n คือขนาดใหญ่เพียงพอแล้ว X" สามารถถูกตีความว่าหมายถึง"X จะมากขึ้นและมีแนวโน้มที่จะเป็นจริงเป็น n เติบโตใหญ่"
    อย่างไรก็ตามการตีความนี้ออกไปนอกหน้าต่างของฉันทันทีที่พวกเขาพูดว่า "เสมอ" เกิดขึ้น คำศัพท์ที่เหมาะสมที่นี่จะได้รับการพูดแบบนี้เกิดขึ้น " มีโอกาสสูง " 1


  • n>n0

แต่เมื่อคุณเข้าใจวรรณกรรมคุณจะได้สิ่งที่พวกเขากำลังพยายามจะพูด

(หมายเหตุด้านข้าง: โดยบังเอิญนี่เป็นหนึ่งในปัญหาคงที่หลายคนมีกับ Wikipedia บ่อยครั้งที่คุณสามารถเข้าใจสิ่งที่พวกเขากำลังพูดถ้าคุณรู้เนื้อหาอยู่แล้วดังนั้นจึงเป็นเพียงการอ้างอิงหรือเป็นเครื่องเตือนความจำ ไม่ใช่สื่อการเรียนรู้ด้วยตนเอง)

1สำหรับคนเดินถนนเพื่อน (สวัสดี!) ใช่คำนี้มีความหมายที่เฉพาะเจาะจงมากกว่าคำที่ฉันเชื่อมโยง ระยะทางเทคนิค loosest เราอาจต้องการที่นี่คือ"asymptotically เกือบแน่นอน" ดูที่นี่


αα

@ เฮนรี่: โอ้ยิงคุณพูดถูก! ฉันเขียนมันเร็วฉันไม่หยุดคิด ขอบคุณตัน! ฉันแก้ไขมันแล้ว :)
Mehrdad

3

ตัวอย่างที่ฉันชอบคือจำนวนนิ้วตามเพศ คนส่วนใหญ่มี 10 นิ้ว บางคนสูญเสียนิ้วเนื่องจากอุบัติเหตุ บางคนมีนิ้วพิเศษ

ฉันไม่รู้ว่าผู้ชายมีนิ้วมากกว่าผู้หญิงหรือเปล่า (โดยเฉลี่ย) หลักฐานที่มีอยู่ทั้งหมดแสดงให้เห็นว่าชายและหญิงทั้งสองมี 10 นิ้ว

อย่างไรก็ตามฉันมั่นใจอย่างยิ่งว่าถ้าฉันได้ทำการสำรวจสำมะโนประชากรของผู้ชายและผู้หญิงทุกคนแล้วฉันจะได้เรียนรู้ว่าเพศหนึ่งมีนิ้วมือมากกว่าโดยเฉลี่ย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.