ทำไมการทดสอบ F ถึงมีความละเอียดอ่อนมากสำหรับการสันนิษฐานของภาวะปกติ?


16

ทำไมเป็นF -test สำหรับความแตกต่างในความแปรปรวนเพื่อให้มีความไวต่อสมมติฐานของการกระจายปกติแม้สำหรับขนาดใหญ่N ?

ฉันพยายามค้นหาเว็บและเยี่ยมชมห้องสมุด แต่ก็ไม่มีคำตอบที่ดีเลย มันบอกว่าการทดสอบมีความละเอียดอ่อนมากสำหรับการละเมิดสมมติฐานสำหรับการแจกแจงแบบปกติ แต่ฉันไม่เข้าใจว่าทำไม ใครบ้างมีคำตอบที่ดีสำหรับเรื่องนี้?


6
ซึ่ง -testFคุณมีความสนใจมีอะไรบ้าง?
S. Kolassa - Reinstate Monica

F-test สำหรับการวัดความแตกต่างในความแปรปรวน
Magnus Johannesen

คำตอบ:


35

ฉันคิดว่าคุณหมายถึงการทดสอบ F สำหรับอัตราส่วนของความแปรปรวนเมื่อทดสอบคู่ของความแปรปรวนตัวอย่างเพื่อความเท่าเทียม

หากตัวอย่างของคุณถูกดึงมาจากการแจกแจงปกติความแปรปรวนตัวอย่างจะมีการแจกแจงไคสแควร์สเกล

ลองนึกภาพว่าแทนที่จะเป็นข้อมูลที่มาจากการแจกแจงแบบปกติคุณมีการแจกแจงที่หนักกว่าปกติ จากนั้นคุณจะได้ค่าผลต่างขนาดใหญ่มากเมื่อเทียบกับการแจกแจงไคสแควร์ที่ปรับขนาดแล้วและความน่าจะเป็นของความแปรปรวนตัวอย่างที่ออกไปทางด้านขวาสุดนั้นตอบสนองต่อหางของการแจกแจงที่ดึงข้อมูล = (จะมีความแปรปรวนขนาดเล็กมากเกินไปเช่นกัน แต่เอฟเฟกต์จะเด่นชัดน้อยลง)

ทีนี้ถ้าทั้งสองตัวอย่างถูกดึงออกมาจากการแจกแจงเทลด์ที่หนักหางที่ใหญ่กว่าบนตัวเศษจะสร้างค่า F ที่มากเกินไปและหางที่ใหญ่กว่าบนตัวส่วนจะสร้างค่า F ที่น้อยเกินไป (และในทางกลับกันสำหรับหางซ้าย)

ทั้งผลกระทบเหล่านี้จะมีแนวโน้มที่จะนำไปสู่การปฏิเสธในการทดสอบสองเทลด์แม้ว่ากลุ่มตัวอย่างทั้งสองมีความแปรปรวนเดียวกัน ซึ่งหมายความว่าเมื่อการแจกแจงที่แท้จริงนั้นหนักกว่าปกติระดับความสำคัญที่แท้จริงมักจะสูงกว่าที่เราต้องการ

ในทางกลับกันการวาดตัวอย่างจากการแจกแจงแบบเทลเบาทำให้เกิดการแจกแจงความแปรปรวนตัวอย่างที่สั้นเกินไปค่าความแปรปรวนแบบหางมีแนวโน้มที่จะ "ปานกลาง" มากกว่าที่คุณได้รับจากข้อมูลจากการแจกแจงแบบปกติ อีกครั้งผลกระทบที่แข็งแกร่งในหางบนไกลกว่าหางล่าง

ทีนี้ถ้าทั้งสองตัวอย่างถูกดึงมาจากการแจกแจงแบบเทลด์ที่เบากว่าผลลัพธ์นี้จะมีค่า F เกินกว่าค่ามัธยฐานและน้อยเกินไปในทั้งสองหาง (ระดับนัยสำคัญที่แท้จริงจะต่ำกว่าที่ต้องการ)

เอฟเฟกต์เหล่านี้ดูเหมือนจะไม่ลดลงมากนักเมื่อขนาดตัวอย่างใหญ่ขึ้น ในบางกรณีดูเหมือนว่าจะแย่ลง

ตามภาพประกอบภาพประกอบบางส่วนนี่คือผลต่างตัวอย่าง 10,000 รายการ (สำหรับn=10 ) สำหรับปกติt5และการแจกแจงแบบสม่ำเสมอปรับสัดส่วนให้มีค่าเฉลี่ยเท่ากับχ92 :

enter image description here

มันค่อนข้างยากที่จะเห็นหางที่ไกลเนื่องจากมันค่อนข้างเล็กเมื่อเทียบกับยอดเขา (และสำหรับt5การสังเกตในหางขยายออกไปในทางที่ยุติธรรมที่ผ่านมาซึ่งเราได้วางแผนไว้) แต่เราสามารถเห็นบางสิ่งที่มีผลต่อ การกระจายความแปรปรวน บางทีมันอาจจะเป็นคำแนะนำที่ดีกว่าในการแปลงสิ่งเหล่านี้โดยผกผันของ Chi-square cdf

enter image description here

ซึ่งในกรณีปกติดูเหมือนกัน (เท่าที่ควร) ในกรณี t- มียอดเขาใหญ่ในหางบน (และยอดเขาเล็ก ๆ ในหางล่าง) และในกรณีเครื่องแบบเหมือนเนินเขา แต่กว้าง จุดสูงสุดประมาณ 0.6 ถึง 0.8 และสุดขั้วมีความน่าจะเป็นต่ำกว่าที่ควรจะเป็นหากเราสุ่มตัวอย่างจากการแจกแจงแบบปกติ

สิ่งเหล่านี้จะสร้างผลกระทบต่อการกระจายตัวของอัตราส่วนของความแปรปรวนที่ฉันอธิบายไว้ก่อนหน้านี้ อีกครั้งเพื่อปรับปรุงความสามารถของเราที่จะเห็นผลกระทบต่อก้อย (ซึ่งยากที่จะมองเห็น) ฉันได้เปลี่ยนจากการผกผันของ cdf (ในกรณีนี้สำหรับการกระจายF9,9 ):

enter image description here

ในการทดสอบแบบสองด้านเราดูที่ส่วนท้ายทั้งสองของการแจกแจงแบบ F ก้อยทั้งสองนั้นจะแสดงมากเกินไปเมื่อวาดจากt5และทั้งคู่จะถูกแทนใต้เมื่อวาดจากเครื่องแบบ

จะมีอีกหลายกรณีที่ต้องตรวจสอบเพื่อศึกษาเต็มรูปแบบ แต่อย่างน้อยก็ให้ความรู้สึกถึงชนิดและทิศทางของผลกระทบรวมถึงวิธีการที่มันเกิดขึ้น


1
การสาธิตที่ดีจริงๆ
shadowtalker

3

เช่นเดียวกับGlen_bแสดงให้เห็นอย่างยอดเยี่ยมในแบบจำลองของเขาการทดสอบ F สำหรับอัตราส่วนความแปรปรวนนั้นอ่อนไหวต่อการกระจายตัว เหตุผลของเรื่องนี้ก็คือความแปรปรวนของความแปรปรวนตัวอย่างขึ้นอยู่กับพารามิเตอร์ kurtosis และความโด่งดังของการกระจายนั้นมีผลอย่างมากต่อการกระจายตัวของอัตราส่วนของความแปรปรวนตัวอย่าง

SN2Sn2n<N

SN2Sn2Approxn1N1+NnN1F(DFC,DFn),

where the degrees-of-freedom (which depend on the underlying kurtosis κ) are:

DFn=2nκ(n3)/(n1)DFC=2(Nn)2+(κ3)(12/N+1/Nn).

In the special case of a mesokurtic distribution (e.g., the normal distribution) you have κ=3, which gives the standard degrees-of-freedom DFn=n1 and DFC=Nn.

Although the distribution of the variance-ratio is sensitive to the underlying kurtosis, it is not actually very sensitive to normality per se. If you use a mesokurtic distribution with a different shape to the normal, you will find that the standard F-distribution approximation performs quite well. In practice the underlying kurtosis is unknown, so implementation of the above formula requires substitution of an estimator κ^. With such a substitution the approximation should perform reasonably well.


Note that this paper defines the population variance using Bessel's correction (for reasons stated in the paper, pp. 282-283). So the denominator of the population variance is N1 in this analysis, not N. (This is actually a more helpful way to do things, since the population variance is then an unbiased estimator of the superopopulation variance parameter.)


+1 This is a very interesting post. Certainly with mesokurtic distributions it's harder to get the variance-ratio distribution to be as far away from the F as is possible with a full-range of distributional choice but it's not so hard to identify cases (at the sample size in my answer, 10 and 10) where the actual type I error rate is more than a little away from a nominal 0.05 rate. The first 3 cases that I tried (distributions with population kurtosis =3 -- all of them symmetric as well) had type I rejection rates of 0.0379, 0.0745 and 0.0785. ... ctd
Glen_b -Reinstate Monica

ctd... I have little doubt that more extreme cases could be identified with a little thinking about how to make the approximation worse. I imagine that it (that the significance level would not be much affected) might hold better in larger samples, though.
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.