ฉันคิดว่าคุณหมายถึงการทดสอบ F สำหรับอัตราส่วนของความแปรปรวนเมื่อทดสอบคู่ของความแปรปรวนตัวอย่างเพื่อความเท่าเทียม
หากตัวอย่างของคุณถูกดึงมาจากการแจกแจงปกติความแปรปรวนตัวอย่างจะมีการแจกแจงไคสแควร์สเกล
ลองนึกภาพว่าแทนที่จะเป็นข้อมูลที่มาจากการแจกแจงแบบปกติคุณมีการแจกแจงที่หนักกว่าปกติ จากนั้นคุณจะได้ค่าผลต่างขนาดใหญ่มากเมื่อเทียบกับการแจกแจงไคสแควร์ที่ปรับขนาดแล้วและความน่าจะเป็นของความแปรปรวนตัวอย่างที่ออกไปทางด้านขวาสุดนั้นตอบสนองต่อหางของการแจกแจงที่ดึงข้อมูล = (จะมีความแปรปรวนขนาดเล็กมากเกินไปเช่นกัน แต่เอฟเฟกต์จะเด่นชัดน้อยลง)
ทีนี้ถ้าทั้งสองตัวอย่างถูกดึงออกมาจากการแจกแจงเทลด์ที่หนักหางที่ใหญ่กว่าบนตัวเศษจะสร้างค่า F ที่มากเกินไปและหางที่ใหญ่กว่าบนตัวส่วนจะสร้างค่า F ที่น้อยเกินไป (และในทางกลับกันสำหรับหางซ้าย)
ทั้งผลกระทบเหล่านี้จะมีแนวโน้มที่จะนำไปสู่การปฏิเสธในการทดสอบสองเทลด์แม้ว่ากลุ่มตัวอย่างทั้งสองมีความแปรปรวนเดียวกัน ซึ่งหมายความว่าเมื่อการแจกแจงที่แท้จริงนั้นหนักกว่าปกติระดับความสำคัญที่แท้จริงมักจะสูงกว่าที่เราต้องการ
ในทางกลับกันการวาดตัวอย่างจากการแจกแจงแบบเทลเบาทำให้เกิดการแจกแจงความแปรปรวนตัวอย่างที่สั้นเกินไปค่าความแปรปรวนแบบหางมีแนวโน้มที่จะ "ปานกลาง" มากกว่าที่คุณได้รับจากข้อมูลจากการแจกแจงแบบปกติ อีกครั้งผลกระทบที่แข็งแกร่งในหางบนไกลกว่าหางล่าง
ทีนี้ถ้าทั้งสองตัวอย่างถูกดึงมาจากการแจกแจงแบบเทลด์ที่เบากว่าผลลัพธ์นี้จะมีค่า F เกินกว่าค่ามัธยฐานและน้อยเกินไปในทั้งสองหาง (ระดับนัยสำคัญที่แท้จริงจะต่ำกว่าที่ต้องการ)
เอฟเฟกต์เหล่านี้ดูเหมือนจะไม่ลดลงมากนักเมื่อขนาดตัวอย่างใหญ่ขึ้น ในบางกรณีดูเหมือนว่าจะแย่ลง
ตามภาพประกอบภาพประกอบบางส่วนนี่คือผลต่างตัวอย่าง 10,000 รายการ (สำหรับn=10 ) สำหรับปกติt5และการแจกแจงแบบสม่ำเสมอปรับสัดส่วนให้มีค่าเฉลี่ยเท่ากับχ29 :
มันค่อนข้างยากที่จะเห็นหางที่ไกลเนื่องจากมันค่อนข้างเล็กเมื่อเทียบกับยอดเขา (และสำหรับt5การสังเกตในหางขยายออกไปในทางที่ยุติธรรมที่ผ่านมาซึ่งเราได้วางแผนไว้) แต่เราสามารถเห็นบางสิ่งที่มีผลต่อ การกระจายความแปรปรวน บางทีมันอาจจะเป็นคำแนะนำที่ดีกว่าในการแปลงสิ่งเหล่านี้โดยผกผันของ Chi-square cdf
ซึ่งในกรณีปกติดูเหมือนกัน (เท่าที่ควร) ในกรณี t- มียอดเขาใหญ่ในหางบน (และยอดเขาเล็ก ๆ ในหางล่าง) และในกรณีเครื่องแบบเหมือนเนินเขา แต่กว้าง จุดสูงสุดประมาณ 0.6 ถึง 0.8 และสุดขั้วมีความน่าจะเป็นต่ำกว่าที่ควรจะเป็นหากเราสุ่มตัวอย่างจากการแจกแจงแบบปกติ
สิ่งเหล่านี้จะสร้างผลกระทบต่อการกระจายตัวของอัตราส่วนของความแปรปรวนที่ฉันอธิบายไว้ก่อนหน้านี้ อีกครั้งเพื่อปรับปรุงความสามารถของเราที่จะเห็นผลกระทบต่อก้อย (ซึ่งยากที่จะมองเห็น) ฉันได้เปลี่ยนจากการผกผันของ cdf (ในกรณีนี้สำหรับการกระจายF9,9 ):
ในการทดสอบแบบสองด้านเราดูที่ส่วนท้ายทั้งสองของการแจกแจงแบบ F ก้อยทั้งสองนั้นจะแสดงมากเกินไปเมื่อวาดจากt5และทั้งคู่จะถูกแทนใต้เมื่อวาดจากเครื่องแบบ
จะมีอีกหลายกรณีที่ต้องตรวจสอบเพื่อศึกษาเต็มรูปแบบ แต่อย่างน้อยก็ให้ความรู้สึกถึงชนิดและทิศทางของผลกระทบรวมถึงวิธีการที่มันเกิดขึ้น