เหตุใดจึงเป็นปัญหาคอร์ติสในเชิงบวกสูงสำหรับการทดสอบสมมติฐาน?


14

ฉันได้ยินมาแล้ว (ขออภัยไม่สามารถให้ลิงก์ไปยังข้อความสิ่งที่ฉันได้รับการบอกเล่า) ว่าการมีส่วนร่วมในเชิงบวกที่สูงอาจเป็นปัญหาสำหรับการทดสอบสมมติฐานที่ถูกต้องและช่วงความมั่นใจ (ดังนั้นจึงมีปัญหากับการอนุมานเชิงสถิติ) นี่เป็นเรื่องจริงและถ้าเป็นเช่นนั้นทำไม ความเชื่อมั่นในเชิงบวกที่สูงของเศษซากจะไม่บ่งบอกว่าส่วนใหญ่ที่เหลืออยู่ใกล้กับค่าเฉลี่ยที่เหลืออยู่ของ 0 และดังนั้นจึงมีจำนวนที่เหลือน้อยกว่ามากอยู่? (หากคุณมีคำตอบโปรดลองตอบคำถามทางคณิตศาสตร์ที่ไม่ค่อยมีใครรู้เพราะฉันไม่ค่อยชอบคณิตศาสตร์มากนัก)


4
ฉันคาดเดาว่าคุณกำลังมุ่งเน้นไปที่รุ่นที่มีเงื่อนไขในอุดมคติของข้อผิดพลาดปกติ (เสียน) (ในบริบทอื่น ๆ อีกมากมายคาดว่าจะมีความเป็นไปได้สูงที่จะเกิดความไม่เป็นระเบียบ) ความโด่งที่สูงนั้นน่าจะหมายถึงการกระจายตัวที่เทลด์มากกว่าปกติดังนั้นบางส่วนที่สูงมาก (+ หรือ -) แม้ว่าจะมีจำนวนมากใกล้ศูนย์นั่นเป็นเพียงข่าวดีและเป็นข่าวร้ายที่เป็นไปได้ที่ต้องการความสนใจ แต่ในทางกลับกันนั่นอาจหมายถึงอะไรก็ได้หลายอย่าง พล็อตที่เหลือเมื่อเทียบกับการติดตั้งมักจะมีข้อมูลมากขึ้น
Nick Cox

อันที่จริงฉันกำลังมุ่งเน้นไปที่แบบจำลองที่มีสมมติฐานปกติ
DDK

คำตอบ:


15

ได้ยิน [... ] ว่าค่าบวกเชิงลบที่สูงอาจเป็นปัญหาสำหรับการทดสอบสมมติฐานที่แม่นยำและช่วงความเชื่อมั่น (และดังนั้นจึงมีปัญหากับการอนุมานเชิงสถิติ) นี่เป็นเรื่องจริงและถ้าเป็นเช่นนั้นทำไม

สำหรับการทดสอบสมมติฐานบางประเภทมันเป็นเรื่องจริง

ความเชื่อมั่นในเชิงบวกที่สูงของเศษซากจะไม่บ่งบอกว่าส่วนใหญ่ที่เหลืออยู่ใกล้กับค่าเฉลี่ยที่เหลืออยู่ของ 0 และดังนั้นจึงมีจำนวนที่เหลือน้อยกว่ามากอยู่?

เลขที่

ดูเหมือนว่าคุณกำลังพูดถึงแนวคิดของความแปรปรวนกับเคิร์ตซีส หากความแปรปรวนมีขนาดเล็กลงก็มีแนวโน้มที่จะมีจำนวนที่เหลือน้อยกว่าและมีจำนวนที่เหลือน้อยกว่ามากที่จะมารวมกัน ลองจินตนาการว่าเรามีค่าเบี่ยงเบนมาตรฐานคงที่ในขณะที่เราเปลี่ยน kurtosis (ดังนั้นเรากำลังพูดถึงการเปลี่ยนแปลงของ kurtosis มากกว่าการเปลี่ยนแปลง)

เปรียบเทียบความแปรปรวนที่แตกต่างกัน (แต่ความหนาเหมือนกัน):

ป้อนคำอธิบายรูปภาพที่นี่

ที่มี kurtosis แตกต่างกัน แต่ความแปรปรวนเดียวกัน:

ป้อนคำอธิบายรูปภาพที่นี่

(ภาพจากโพสต์นี้ )

Kurtosis ที่สูงขึ้นมีแนวโน้มที่จะมีของเหลือมากขึ้นแม้ว่าคุณจะมีค่าคงที่ความแปรปรวน

[ในบางกรณีความเข้มข้นของสารตกค้างขนาดเล็กอาจทำให้เกิดปัญหามากกว่าเศษส่วนเพิ่มเติมของส่วนที่เหลือที่ใหญ่ที่สุด - ขึ้นอยู่กับสิ่งที่คุณกำลังมองหา]

เอาล่ะลองมาดูตัวอย่างกัน พิจารณาการทดสอบทีหนึ่งตัวอย่างและขนาดตัวอย่าง 10

หากเราปฏิเสธสมมุติฐานว่างเมื่อค่าสัมบูรณ์ของสถิติ t มีค่ามากกว่า 2.262 ดังนั้นเมื่อการสังเกตนั้นเป็นอิสระจากการแจกแจงแบบปกติเหมือนกันและค่าเฉลี่ยของสมมติฐานคือค่าเฉลี่ยประชากรจริงเราจะปฏิเสธค่าว่าง สมมติฐาน 5% ของเวลา

พิจารณาการแจกแจงแบบพิเศษที่มีความโด่งมากกว่าปกติ: 75% ของประชากรของเรามีค่ามาจากการแจกแจงแบบปกติและอีก 25% ที่เหลือมีค่ามาจากการแจกแจงแบบปกติที่มีค่าเบี่ยงเบนมาตรฐาน 50 เท่า

ถ้าฉันคำนวณอย่างถูกต้องสิ่งนี้จะสอดคล้องกับ kurtosis 12 (เกิน kurtosis 9) การกระจายที่เกิดขึ้นนั้นแหลมกว่าปกติมากและมีหางที่หนัก ความหนาแน่นถูกเปรียบเทียบกับความหนาแน่นปกติด้านล่าง - คุณสามารถเห็นจุดสูงสุดที่สูงกว่าได้ แต่คุณไม่เห็นหางที่หนักกว่าในภาพด้านซ้ายดังนั้นฉันจึงวางแผนลอการิทึมของความหนาแน่นซึ่งแผ่ส่วนล่างของ ภาพและบีบอัดด้านบนทำให้ง่ายขึ้นที่จะเห็นทั้งยอดและก้อย

ป้อนคำอธิบายรูปภาพที่นี่

n=10

(นอกจากนี้คุณยังจะเห็นผลกระทบที่สำคัญในการครอบคลุมช่วงความเชื่อมั่นด้วย)

โปรดทราบว่าการกระจายที่แตกต่างกันที่มีความรุนแรงเช่นเดียวกับที่จะมีผลกระทบที่แตกต่างกันในระดับความสำคัญ


เหตุใดอัตราการปฏิเสธจึงลดลง นั่นเป็นเพราะหางที่มีน้ำหนักมากนำไปสู่ค่าผิดปกติที่ใหญ่ขึ้นเล็กน้อยซึ่งมีผลกระทบใหญ่กว่าค่าเบี่ยงเบนมาตรฐานเล็กน้อยกว่าค่าเฉลี่ย สิ่งนี้ส่งผลกระทบต่อค่าสถิติเนื่องจากมันนำไปสู่ค่า t เพิ่มเติมระหว่าง -1 และ 1 ในกระบวนการลดสัดส่วนของค่าในภูมิภาคที่สำคัญ

H0

ให้ผมแสดง. นี่คือตัวอย่างขนาด 10:

 1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 4.23

H0:μ=2

ตอนนี้ทำให้ค่าที่ใหญ่ที่สุด 50:

      1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 50

เห็นได้ชัดว่าเราดึงค่าเฉลี่ยขึ้นมาดังนั้นมันควรบ่งบอกถึงความแตกต่างที่มากกว่าเดิมใช่ไหม? ก็ไม่เป็นไร เสื้อสถิติไปลง ตอนนี้คือ 1.106 และค่า p มีขนาดค่อนข้างใหญ่ (ใกล้ถึง 30%) เกิดอะไรขึ้น? เราดึงค่าเฉลี่ยขึ้นไป (7.257) แต่ค่าเบี่ยงเบนมาตรฐานพุ่งขึ้นมากกว่า 15

ค่าเบี่ยงเบนมาตรฐานจะมีความอ่อนไหวต่อค่าผิดปกติมากกว่าเล็กน้อยเมื่อคุณใส่ค่าผิดปกติคุณมีแนวโน้มที่จะผลักสถิติหนึ่งตัวอย่างไปทาง 1 หรือ -1

หากมีโอกาสเกิดค่าผิดปกติหลายครั้งเกิดขึ้นได้ในบางครั้งเท่านั้นพวกเขาสามารถอยู่ฝั่งตรงข้ามได้ (ในกรณีนี้ค่าเบี่ยงเบนมาตรฐานยิ่งสูงขึ้นมากในขณะที่ผลกระทบต่อค่าเฉลี่ยลดลงเมื่อเปรียบเทียบกับค่าที่หนึ่ง) มีแนวโน้มที่จะขยับเข้าใกล้ 0

สิ่งที่คล้ายกันเกิดขึ้นกับการทดสอบทั่วไปอื่น ๆ ที่ถือว่าเป็นเรื่องปกติ - ความโด่งที่สูงขึ้นมีแนวโน้มที่จะเกี่ยวข้องกับหางที่หนักกว่าซึ่งหมายถึงค่าผิดปกติมากขึ้นซึ่งหมายความว่าค่าเบี่ยงเบนมาตรฐานจะสูงขึ้นเมื่อเทียบกับค่าเฉลี่ย เพื่อรับ "ล้นมือ" จากผลกระทบของค่าผิดปกติในการทดสอบ นั่นคือพลังงานต่ำ


1
ว้าวขอบคุณมากสำหรับคำตอบที่ชัดเจนและซับซ้อน เวลาของคุณได้รับการชื่นชมมาก!
DDK

นอกจากนี้ยังเป็นที่น่าสังเกตว่าในขณะที่การกระจายตัวอย่างขนาดใหญ่ของค่าเฉลี่ยตัวอย่างไม่ได้ขึ้นอยู่กับ kurtosis (ด้วยเหตุนี้ระดับนัยสำคัญที่แท้จริงของการทดสอบปกติ - สมมติว่าสำหรับค่าเฉลี่ยลู่เข้าสู่ระดับปกติโดยทั่วไปคือ. 05, n-> อนันต์สำหรับขอบเขต kurtosis ทั้งหมด) ไม่เหมือนกันสำหรับการทดสอบความแปรปรวน การกระจายตัวตัวอย่างขนาดใหญ่ของความแปรปรวนโดยประมาณนั้นขึ้นอยู่กับ kurtosis ดังนั้นระดับนัยสำคัญที่แท้จริงของการทดสอบแบบคลาสสิกปกติที่สมมติขึ้นสำหรับความแปรปรวนไม่ได้มาบรรจบกันในระดับที่ระบุว่า n -> อินฟินิตี้เมื่อ kurtosis แตกต่างจากศูนย์
Peter Westfall

ยิ่งไปกว่านั้น kurtosis ที่สูงขึ้นไม่ได้บ่งบอกถึงทางคณิตศาสตร์ว่ามี "การเบี่ยงเบนเล็กน้อยจากค่าเฉลี่ย" สิ่งเดียวที่มันบอกคุณได้อย่างแน่นอนคือมีหางมากขึ้น
Peter Westfall

คุณไม่สามารถได้ค่าเบี่ยงเบนที่มากขึ้นและคงค่าความแปรปรวนไว้เว้นแต่ว่าคุณจะทำการเบี่ยงเบนเล็กน้อย หากคุณไม่คงค่าความแปรปรวนคงที่ความเบี่ยงเบนของคุณเพิ่มขึ้นเล็กน้อยเมื่อเทียบกับระดับใหม่ ใช่แล้วเมื่อพูดถึงการมองที่ kurtosis คณิตศาสตร์จะบอกคุณว่าการพกพาที่มีขนาดใหญ่นั้นจะเล็กกว่ามาก
Glen_b -Reinstate Monica

ZXκ=E(Z4)κ1=E(Z2)κZVar(Z)=1Xμ±kσkXXZ

4

Kurtosis วัดค่าผิดปกติ ค่าผิดปกติเป็นปัญหาสำหรับการอนุมานมาตรฐาน (เช่นการทดสอบ t- ช่วงเวลา t) ซึ่งเป็นไปตามการแจกแจงแบบปกติ นั่นคือจุดสิ้นสุดของเรื่องราว! และมันก็เป็นเรื่องง่าย ๆ

เหตุผลที่เรื่องนี้ไม่ได้รับการชื่นชมเป็นอย่างดีเป็นเพราะตำนานโบราณที่มาตรการความเค็มของ "ความแหลม" ยังคงมีอยู่

นี่คือคำอธิบายง่ายๆที่แสดงให้เห็นว่าเหตุใด Kurtosis จึงใช้มาตรการคนนอก

พิจารณาชุดข้อมูลต่อไปนี้

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1

Kurtosis เป็นค่าที่คาดหวังของ (z-values) ^ 4 นี่คือ (ค่า z) ^ 4:

6.51, 0.30, 5.33, 0.45, 0.00, 0.30, 6.51, 0.00, 0.45, 0.30, 0.00, 6.51, 0.00, 0.00, 0.30, 0.00, 27.90, 0.00, 0.30, 0.45

ค่าเฉลี่ยคือ 2.78 และนั่นเป็นค่าประมาณของความเสียหาย (ลบ 3 ถ้าคุณต้องการ kurtosis มากเกินไป)

ตอนนี้แทนที่ค่าข้อมูลล่าสุดด้วย 999 ดังนั้นมันจึงกลายเป็นค่าที่เกิน:

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

ตอนนี้นี่คือ (ค่า z) ^ 4:

0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00,0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98

ค่าเฉลี่ยคือ 18.05 และนั่นเป็นค่าประมาณของความเสียหาย (ลบ 3 ถ้าคุณต้องการ kurtosis มากเกินไป)

เห็นได้ชัดว่ามีเฉพาะเรื่องค่าใช้จ่ายเท่านั้น ไม่มีอะไรเกี่ยวกับ "จุดสูงสุด" หรือข้อมูลที่อยู่ใกล้ประเด็นกลาง

หากคุณทำการวิเคราะห์ทางสถิติแบบมาตรฐานด้วยชุดข้อมูลที่สองคุณควรคาดหวังว่าจะเกิดปัญหา kurtosis ขนาดใหญ่เตือนคุณถึงปัญหา

นี่คือกระดาษที่บรรจง:

Westfall, PH (2014) Kurtosis แบบแหลม, 1905 - 2014. RIP นักสถิติชาวอเมริกัน, 68, 191–195


ทำไมไม่ใช้แค่การทดสอบแบบไม่มีพารามิเตอร์? สำหรับปัญหาประเภทนี้พวกเขามีแนวโน้มที่จะดีกว่า
Carl

1
เห็นด้วยนั่นคือถนนที่เป็นไปได้ถ้าคุณชอบการทดสอบซึ่งเป็นที่น่าสนใจอย่างรวดเร็วในรูปแบบคลาสสิก แต่นั่นไม่ใช่ความกังวลของฉัน ฉันสนใจแบบจำลองความน่าจะเป็นมากกว่า แอปพลิเคชันเดียว: บางทีคุณอาจสนใจค่าเฉลี่ยเช่นในกรณีที่ตัวแปรตามคือดอลลาร์ที่ได้รับค่าเฉลี่ยของกระบวนการนั้นน่าสนใจกว่าค่ามัธยฐานของกระบวนการ ดังนั้นข้อมูลอะไรที่บอกคุณเกี่ยวกับกระบวนการหมายความว่าเมื่อข้อมูลมีค่าผิดปกติ? มันเป็นปัญหาที่ยาก แต่สิ่งที่สำคัญและช่วงเวลาที่มีความเกี่ยวข้องกับคำตอบนั้น ไม่ใช่การทดสอบที่ไม่ใช่
Peter Westfall

สำหรับการแจกแจงของ Cauchy ค่าเฉลี่ยที่ถูกตัดสามารถวัดค่าตำแหน่งได้ดีกว่าค่ามัธยฐานและค่าเฉลี่ยทั่วไปจะไม่ใช่หน่วยวัดตำแหน่ง สิ่งที่จะใช้เป็นตัวชี้วัดของสถานที่ขึ้นอยู่กับการกระจายคือ ตัวอย่างที่ kurtosis จะไม่เป็นประโยชน์ในฐานะที่เป็นตัวบ่งชี้คือการกระจายที่สม่ำเสมอซึ่งค่าสุดขีดเฉลี่ยคือการวัดที่ตั้งที่ดีกว่าทั้งค่ามัธยฐานและค่าเฉลี่ย
Carl

ไม่ใช่ประเด็น หากคุณสนใจผลรวมทั้งหมดเช่นดอลลาร์ค่าเฉลี่ยทั่วไปคือหน่วยวัดที่ตั้งที่คุณต้องการ
Peter Westfall

หากคุณมีตัวแปรกระจายของ Cauchy คุณสามารถสร้างรายได้เป็นดอลลาร์ทั้งหมด แต่ค่าเฉลี่ยจะไม่เป็นการวัดที่มีประโยชน์โดยเฉพาะอย่างยิ่งซึ่งหมายความว่า "ค่าที่คาดหวัง" ไม่มีความคาดหวังที่สมเหตุสมผล
Carl

-3

Kurtosis ยังบ่งบอกถึงหางอสมมาตร ในการทดสอบสมมติฐานสองด้านหางหนึ่งจะเป็นหางยาวและอีกหนึ่งจะเป็นหางสั้น หนึ่งก้อยอาจเป็น> อัลฟา แต่ <เบต้า หางหนึ่งจะผ่าน p-value แต่อื่น ๆ จะไม่

โดยทั่วไปการอนุมานเชิงสถิติถือว่าเป็นมาตรฐานปกติ เมื่อไม่ปกติคุณอาจได้รับการอนุมานจากกลไกการอนุมานที่ซับซ้อนกว่า คุณอาจจะสามารถให้เราอนุมาน Poisson แต่ด้วยการกระจายที่ไม่ปกติคุณไม่สามารถใช้การอนุมานที่เป็นไปตามบรรทัดฐาน

ความเบ้และความรุนแรงเป็นตัวชี้วัดของความไม่ปกติ เราเรียนรู้ที่จะใช้วิธีการและใช้การแจกแจงแบบปกติก่อนที่เราจะรู้ว่าเราต้องทดสอบความเป็นปกติ ปกติต้องการจุดข้อมูล 36 จุดหรือมากกว่าจากแต่ละมิติ คุณสามารถประมาณได้ที่จุดข้อมูล 20 จุด แต่คุณจะยังมีความเบ้และความรุนแรง เมื่อการกระจายเข้าสู่ภาวะปกติความเบ้และการกระจายหายไป

หนึ่งในคำอธิบายที่กำหนด kurtosis เป็นยอดแหลม อื่นไม่ได้ นี่คือการต่อสู้ที่ไม่มั่นคงในเวลานี้ Kurtosis เป็นช่วงเวลาที่สี่พื้นที่ ฉันกำลังอยู่ในจุดที่ไม่แหลมของปัญหา

แนวคิดอื่นที่อยู่ข้างนอกนั่นคือด้วยความเอียงค่ามัธยฐานโน้มตัวไปยังโหมดที่สร้างรูปสามเหลี่ยม สนุก.


1
ไม่ชัดเจนว่าจะเพิ่มสิ่งใดที่มีประโยชน์และแตกต่างไปจากคำตอบที่ยอดเยี่ยมอยู่แล้ว มันเพิ่มข้อความที่ทำให้งงหลายอย่างเช่น "ปกติต้องการจุดข้อมูล 36 จุดหรือมากกว่า" (ดังนั้น 35 ไม่ตกลง - อะไรคือพื้นฐานสำหรับการอ้างสิทธิ์นี้ "ความเบ้เป็นจุดสูงสุด" ฉันไม่คิดว่าใครจะอ้างเรื่องนี้ "การอนุมานเชิงสถิติถือว่า มาตรฐานปกติ ": ไม่โดยทั่วไป Kurtosis คือช่วงเวลาที่สี่พื้นที่: no; kurtosis ตามที่กำหนดไว้ที่นี่เป็นอัตราส่วนไม่มีมิติโดยขึ้นอยู่กับช่วงเวลาที่สี่และวินาทีเกี่ยวกับค่าเฉลี่ย
Nick Cox

ช่วงเวลาที่สี่คืออินทิกรัลดังนั้นมันจึงเป็นพื้นที่ การที่พื้นที่นั้นถูกแปลงเป็นความแหลมหรือความโค้งมนจะหายไปกับฉันได้อย่างไร
David W. Locke

คำอธิบายทั่วไปของ kurtosis คือความแหลม แต่มันผิดในมุมมองของฉัน ฉันจะแก้ไขคำตอบดั้งเดิมของฉันเพื่อเปลี่ยนความเบ้เนื่องจากความแหลมที่จะพูดว่า kurtosis คือ ... ขอบคุณ
David W. Locke

หางไม่สมมาตร ฉันไม่เคยเห็นอะไรเกี่ยวกับการอนุมานทางสถิติที่พิจารณาหางแบบอสมมาตร ความเสี่ยง Kurtosis เกิดขึ้นเนื่องจากก้อยจะเคลื่อนที่เมื่อมีการรวบรวมจุดข้อมูลมากขึ้น ความเบ้และความรุนแรงนั้นไม่มีข้อมูลเพียงพอที่จะทำให้ได้มาตรฐานตามปกติ
David W. Locke

1
ไม่เช่นนั้นมีทฤษฎีและแอปพลิเคชั่นจำนวนมากสำหรับการแจกแจงแบบแกมมา, ไวบูลและการแจกแจงอื่น ๆ อีกมากมายที่ไม่ธรรมดา
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.