คำตอบนี้อยู่ในสองส่วนหลัก: ประการแรกใช้การแก้ไขเชิงเส้นและที่สองใช้การแปลงเพื่อการแก้ไขที่แม่นยำยิ่งขึ้น วิธีที่กล่าวถึงที่นี่เหมาะสำหรับการคำนวณด้วยมือเมื่อคุณมีตารางที่ จำกัด แต่ถ้าคุณกำลังใช้รูทีนคอมพิวเตอร์เพื่อสร้างค่า p จะมีวิธีที่ดีกว่ามาก (หากน่าเบื่อเมื่อทำด้วยมือ) ที่ควรใช้แทน
หากคุณรู้ว่าค่าวิกฤต 10% (หนึ่ง tailed) สำหรับการทดสอบ z คือ 1.28 และค่าวิกฤต 20% เท่ากับ 0.84 การเดาคร่าวๆที่ค่าวิกฤต 15% จะเป็นครึ่งทางระหว่าง - (1.28 + 0.84) / 2 = 1.06 (ค่าจริงคือ 1.0364) และค่า 12.5% สามารถเดาได้ครึ่งทางระหว่างค่านั้นกับค่า 10% (1.28 + 1.06) / 2 = 1.17 (ค่าจริง 1.15+) นี่คือสิ่งที่การแก้ไขเชิงเส้นทำ แต่แทนที่จะเป็น 'ครึ่งทางระหว่าง' มันจะดูเศษส่วนของวิธีระหว่างค่าสองค่า
การแก้ไขเชิงเส้นแบบไม่รวมตัวแปร
ลองดูที่กรณีของการแก้ไขเชิงเส้นอย่างง่าย
ดังนั้นเราจึงมีฟังก์ชั่น (พูดถึงx ) ที่เราคิดว่าใกล้เคียงกับค่าที่เราพยายามประมาณและเรามีค่าของฟังก์ชันทั้งสองด้านของค่าที่เราต้องการตัวอย่างเช่น:
x81620y9.3y1615.6
ทั้งสองค่าที่มี 's เรารู้ว่ามีอยู่ 12 (20-8) ออกจากกัน มาดูกันว่าค่า (ค่าที่เราต้องการค่าโดยประมาณสำหรับ) แบ่งความแตกต่างของ 12 ขึ้นในอัตราส่วน 8: 4 (16-8 และ 20-16) อย่างไร นั่นคือมันคือ 2/3 ของระยะทางจากค่าแรกถึงสุดท้าย หากความสัมพันธ์เป็นเส้นตรงช่วงของค่า y ที่สอดคล้องกันจะอยู่ในอัตราส่วนเดียวกันy x y xxYxYx
ดังนั้นควรจะเป็นเรื่องเดียวกันกับที่{} 16-8Y16- 9.315.6 - 9.316 - 820 - 8
นั่นคือY16- 9.315.6 - 9.3≈ 16 - 820 - 8
จัดเรียง:
Y16≈ 9.3 + ( 15.6 - 9.3 ) 16 - 820 - 8= 13.5
ตัวอย่างที่มีตารางสถิติ: ถ้าเรามีตาราง t ที่มีค่าวิกฤตต่อไปนี้เป็น 12 df:
( 2 หาง)α0.010.020.050.10เสื้อ3.052.682.181.78
เราต้องการค่าวิกฤตของ t ด้วย 12 df และอัลฟาสองหางที่ 0.025 นั่นคือเราประมาณระหว่าง 0.02 ถึง 0.05 แถวของตารางนั้น:
α0.020.0250.05เสื้อ2.68?2.18
ค่าที่ " " คือค่าที่เราต้องการใช้การแก้ไขเชิงเส้นเพื่อประมาณ (โดยฉันหมายถึงจุดของผกผันของการแจกแจง )t 0.025 t 0.025 1 - 0.025 / 2 t 12?เสื้อ0.025เสื้อ0.0251 - 0.025 / 2เสื้อ12
เมื่อก่อนหารช่วงจากถึงในอัตราส่วนถึง (เช่น ) และ value ที่ไม่รู้จักควรแบ่งช่วงถึงในอัตราส่วนเดียวกัน เท่ากับเกิดขึ้น th ของทางตามแนว -range ดังนั้นค่า -val ที่ไม่รู้จักควรเกิดขึ้นที่ ตามทางของ -range0.02 0.05 ( 0.025 - 0.02 ) 0.025 ( 0.025 - 0.02 ) / ( 0.05 - 0.02 ) = 1 / 6 x ที1 / 6 ตัน0.0250.020.05( 0.025 - 0.02 )1 : 5 t t 2.68 2.18( 0.05 - 0.025 )1 : 5เสื้อเสื้อ2.682.180.025( 0.025 - 0.02 ) / ( 0.05 - 0.02 ) = 1 / 6xเสื้อ1 / 6เสื้อ
นั่นคือหรือเทียบเท่าเสื้อ0.025- 2.682.18 - 2.68≈ 0.025 - 0.020.05 - 0.02
เสื้อ0.025≈ 2.68 + ( 2.18 - 2.68 ) 0.025 - 0.020.05 - 0.02= 2.68 - 0.5 16≈ 2.60
คำตอบที่แท้จริงคือ ... ซึ่งไม่ใกล้เคียงอย่างยิ่งเพราะฟังก์ชั่นที่เราประมาณไม่ใกล้เคียงกับเชิงเส้นในช่วงนั้นมาก (ใกล้กว่ามันคือ)α = 0.52.56α = 0.5
การประมาณที่ดีขึ้นผ่านการแปลง
เราสามารถแทนที่การแก้ไขเชิงเส้นด้วยรูปแบบการทำงานอื่น ๆ ; ผลเราเปลี่ยนเป็นขนาดที่การแก้ไขเชิงเส้นทำงานได้ดีขึ้น ในกรณีนี้ในส่วนท้ายค่าวิกฤตที่ทำเป็นตารางจำนวนมากจะเกือบเป็นเส้นตรงของระดับนัยสำคัญ หลังจากเราจด s เราก็ใช้การประมาณเชิงเส้นเหมือนเดิม ลองดูจากตัวอย่างด้านบน:เข้าสู่ระบบเข้าสู่ระบบเข้าสู่ระบบ
α0.020.0250.05เข้าสู่ระบบ( α )- 3.912- 3.689- 2.996เสื้อ2.68เสื้อ0.0252.18
ตอนนี้
เสื้อ0.025- 2.682.18 - 2.68≈=เข้าสู่ระบบ( 0.025 ) - บันทึก( 0.02 )เข้าสู่ระบบ( 0.05 ) - บันทึก( 0.02 )- 3.689 - - 3.912- 2.996 - - 3.912
หรือเทียบเท่า
เสื้อ0.025≈=2.68 + ( 2.18 - 2.68 ) - 3.689 - - 3.912- 2.996 - - 3.9122.68 - 0.5 ⋅ 0.243 ≈ 2.56
ซึ่งถูกต้องตามจำนวนตัวเลขที่ยกมา นี่เป็นเพราะ - เมื่อเราเปลี่ยนลอการิทึม x - ความสัมพันธ์เกือบเป็นเส้นตรง:
ที่จริงแล้วเส้นโค้ง (สีเทา) ที่มองเห็นนั้นอยู่ด้านบนของเส้นตรง (สีฟ้า)
ในบางกรณีlogitของระดับนัยสำคัญ ( ) อาจทำงานได้ดีในช่วงกว้าง แต่โดยทั่วไปไม่จำเป็น (เรามักจะสนใจเฉพาะค่าวิกฤตที่ถูกต้องเมื่อมีขนาดเล็กพอที่ทำงานได้ค่อนข้างดี)logit ( α ) = บันทึก( α1 - α) = บันทึก( 1)1 - α- 1 )αเข้าสู่ระบบ
การแก้ไขข้ามองศาอิสระที่แตกต่างกัน
เสื้อตาราง , chi-square และยังมีองศาอิสระซึ่งไม่มีการจัดตารางค่าdf ( -) ทุกค่า ค่าวิกฤตส่วนใหญ่ไม่ได้แสดงอย่างถูกต้องโดยการสอดแทรกเชิงเส้นใน df อันที่จริงมักจะเป็นมากขึ้นเกือบกรณีที่ค่าในตารางที่มีเส้นตรงซึ่งกันและกันของ DF ที่1Fν†1 / ν
(ในตารางเก่าคุณมักจะเห็นคำแนะนำให้ทำงานกับ - ค่าคงที่ของตัวเศษไม่แตกต่างกัน แต่สะดวกกว่าในเครื่องคิดเลขล่วงหน้าเพราะ 120 มีปัจจัยหลายอย่างดังนั้นมักจะเป็นจำนวนเต็มทำให้การคำนวณง่ายขึ้นเล็กน้อย)120 / ν120 / ν
นี่คือวิธีการดำเนินการแก้ไขผกผันกับค่าที่สำคัญ 5% ของระหว่างและ120นั่นคือเพียงปลายทางมีส่วนร่วมในการแก้ไขใน1ตัวอย่างเช่นในการคำนวณค่าวิกฤตสำหรับเรารับ (และโปรดสังเกตว่าที่นี่หมายถึงค่าผกผันของ cdf):F4 , νν= 601201 / νν= 80F
F4 , 80 , .95≈ F4 , 60 , .95+ 1 / 80 - 1 / 601 / 120 - 1 / 60⋅ ( F4 , 120 , .95- ฉ4 , 60 , .95)
(เปรียบเทียบกับไดอะแกรมที่นี่ )
†ส่วนใหญ่ แต่ไม่เสมอไป นี่คือตัวอย่างที่การประมาณค่าเชิงเส้นใน df ดีขึ้นและคำอธิบายวิธีบอกจากตารางว่าการประมาณเชิงเส้นจะแม่นยำ
นี่คือส่วนหนึ่งของตารางไค - สแควร์
Probability less than the critical value
df 0.90 0.95 0.975 0.99 0.999
______ __________________________________________________
40 51.805 55.758 59.342 63.691 73.402
50 63.167 67.505 71.420 76.154 86.661
60 74.397 79.082 83.298 88.379 99.607
70 85.527 90.531 95.023 100.425 112.317
ลองนึกภาพเราต้องการค้นหาค่าวิกฤติ 5% (95 เปอร์เซ็นต์) สำหรับ 57 องศาอิสระ
มองอย่างใกล้ชิดเราจะเห็นว่าค่าวิกฤต 5% ในตารางเกือบจะเป็นเส้นตรงที่นี่:
(เส้นสีเขียวรวมค่า 50 และ 60 df คุณสามารถเห็นมันสัมผัสจุดสำหรับ 40 และ 70)
ดังนั้นการแก้ไขเชิงเส้นจะทำได้ดีมาก แต่แน่นอนว่าเราไม่มีเวลาวาดกราฟ วิธีการตัดสินใจว่าจะใช้การแก้ไขเชิงเส้นเมื่อใดและจะลองทำอะไรที่ซับซ้อนมากกว่านี้
เช่นเดียวกับค่าที่ด้านใดด้านหนึ่งของค่าที่เราค้นหาให้ใช้ค่าที่ใกล้ที่สุดถัดไป (70 ในกรณีนี้) หากค่า tabulated กลาง (ค่าสำหรับ df = 60) อยู่ใกล้กับเส้นตรงระหว่างค่าสิ้นสุด (50 และ 70) การแก้ไขเชิงเส้นจะเหมาะสม ในกรณีนี้ค่าต่าง ๆ จึงมีความง่ายมาก: คือใกล้กับ ?x 60 , 0.95( x50 , 0.95+ x70 , 0.95) / 2x60 , 0.95
เราพบว่าซึ่งเมื่อเทียบกับค่าจริงของ 60 df, 79.082 เราจะเห็นว่ามีความแม่นยำเกือบสามตัวเลขเต็มซึ่งมักจะค่อนข้างดีสำหรับการแก้ไขดังนั้นในกรณีนี้ คุณจะติดกับการแก้ไขเชิงเส้น; ด้วยขั้นตอนที่ละเอียดกว่าสำหรับค่าที่เราต้องการตอนนี้เราคาดว่าจะมีความแม่นยำของตัวเลข 3 อย่างมีประสิทธิภาพ( 67.505 + 90.531 ) / 2 = 79.018
ดังนั้นเราจึงได้รับ:หรือx - 67.50579.082 - 67.505≈ 57 - 50 60 - 50
x ≈ 67.505 + ( 79.082 - 67.505 ) ⋅ 57 - 50 60 - 50 ≈ 75.6175.61
ค่าจริงคือ 75.62375 ดังนั้นเราจึงมีความแม่นยำ 3 รูปและมีเพียง 1 ในสี่เท่านั้น
การแก้ไขที่แม่นยำยิ่งขึ้นอาจจะยังคงมีอยู่โดยใช้วิธีการของความแตกต่างอัน จำกัด (โดยเฉพาะอย่างยิ่งผ่านความแตกต่างที่ถูกแบ่งแยก) แต่นี่อาจเป็น overkill สำหรับปัญหาการทดสอบสมมติฐาน
หากองศาอิสระของคุณผ่านจุดสิ้นสุดของตารางคำถามนี้จะกล่าวถึงปัญหานั้น