ฉันจะค้นหาค่าที่ไม่ได้ระบุใน (ตารางสอดแทรก) ในตารางสถิติได้อย่างไร


19

บ่อยครั้งที่ผู้คนใช้โปรแกรมเพื่อรับค่า p แต่บางครั้งด้วยเหตุผลใดก็ตามอาจจำเป็นต้องได้รับคุณค่าที่สำคัญจากชุดของตาราง

ให้ตารางสถิติที่มีระดับนัยสำคัญที่ จำกัด และจำนวนองศาอิสระที่ จำกัด ฉันจะรับค่าวิกฤตที่ระดับความสำคัญอื่น ๆ หรือองศาอิสระได้อย่างไร (เช่นกับตาราง , chi-square หรือ ) ?FtF

นั่นคือฉันจะค้นหาค่า "ในระหว่าง" ค่าในตารางได้อย่างไร

คำตอบ:


26

คำตอบนี้อยู่ในสองส่วนหลัก: ประการแรกใช้การแก้ไขเชิงเส้นและที่สองใช้การแปลงเพื่อการแก้ไขที่แม่นยำยิ่งขึ้น วิธีที่กล่าวถึงที่นี่เหมาะสำหรับการคำนวณด้วยมือเมื่อคุณมีตารางที่ จำกัด แต่ถ้าคุณกำลังใช้รูทีนคอมพิวเตอร์เพื่อสร้างค่า p จะมีวิธีที่ดีกว่ามาก (หากน่าเบื่อเมื่อทำด้วยมือ) ที่ควรใช้แทน

หากคุณรู้ว่าค่าวิกฤต 10% (หนึ่ง tailed) สำหรับการทดสอบ z คือ 1.28 และค่าวิกฤต 20% เท่ากับ 0.84 การเดาคร่าวๆที่ค่าวิกฤต 15% จะเป็นครึ่งทางระหว่าง - (1.28 + 0.84) / 2 = 1.06 (ค่าจริงคือ 1.0364) และค่า 12.5% ​​สามารถเดาได้ครึ่งทางระหว่างค่านั้นกับค่า 10% (1.28 + 1.06) / 2 = 1.17 (ค่าจริง 1.15+) นี่คือสิ่งที่การแก้ไขเชิงเส้นทำ แต่แทนที่จะเป็น 'ครึ่งทางระหว่าง' มันจะดูเศษส่วนของวิธีระหว่างค่าสองค่า

การแก้ไขเชิงเส้นแบบไม่รวมตัวแปร

ลองดูที่กรณีของการแก้ไขเชิงเส้นอย่างง่าย

ดังนั้นเราจึงมีฟังก์ชั่น (พูดถึงx ) ที่เราคิดว่าใกล้เคียงกับค่าที่เราพยายามประมาณและเรามีค่าของฟังก์ชันทั้งสองด้านของค่าที่เราต้องการตัวอย่างเช่น:

xy89.316y162015.6

ทั้งสองค่าที่มี 's เรารู้ว่ามีอยู่ 12 (20-8) ออกจากกัน มาดูกันว่าค่า (ค่าที่เราต้องการค่าโดยประมาณสำหรับ) แบ่งความแตกต่างของ 12 ขึ้นในอัตราส่วน 8: 4 (16-8 และ 20-16) อย่างไร นั่นคือมันคือ 2/3 ของระยะทางจากค่าแรกถึงสุดท้าย หากความสัมพันธ์เป็นเส้นตรงช่วงของค่า y ที่สอดคล้องกันจะอยู่ในอัตราส่วนเดียวกันy x y xxyxyx

การแก้ไขเชิงเส้น

ดังนั้นควรจะเป็นเรื่องเดียวกันกับที่{} 16-8y169.315.69.3168208

นั่นคือy169.315.69.3168208

จัดเรียง:

y169.3+(15.69.3)168208=13.5

ตัวอย่างที่มีตารางสถิติ: ถ้าเรามีตาราง t ที่มีค่าวิกฤตต่อไปนี้เป็น 12 df:

(2-tail)αt0.013.050.022.680.052.180.101.78

เราต้องการค่าวิกฤตของ t ด้วย 12 df และอัลฟาสองหางที่ 0.025 นั่นคือเราประมาณระหว่าง 0.02 ถึง 0.05 แถวของตารางนั้น:

αt0.022.680.025?0.052.18

ค่าที่ " " คือค่าที่เราต้องการใช้การแก้ไขเชิงเส้นเพื่อประมาณ (โดยฉันหมายถึงจุดของผกผันของการแจกแจง )t 0.025 t 0.025 1 - 0.025 / 2 t 12?t0.025t0.02510.025/2t12

เมื่อก่อนหารช่วงจากถึงในอัตราส่วนถึง (เช่น ) และ value ที่ไม่รู้จักควรแบ่งช่วงถึงในอัตราส่วนเดียวกัน เท่ากับเกิดขึ้น th ของทางตามแนว -range ดังนั้นค่า -val ที่ไม่รู้จักควรเกิดขึ้นที่ ตามทางของ -range0.02 0.05 ( 0.025 - 0.02 ) 0.025 ( 0.025 - 0.02 ) / ( 0.05 - 0.02 ) = 1 / 6 x ที1 / 6 ตัน0.0250.020.05(0.0250.02)1 : 5 t t 2.68 2.18(0.050.025)1:5tt2.682.180.025(0.0250.02)/(0.050.02)=1/6xt1/6t

นั่นคือหรือเทียบเท่าt0.0252.682.182.680.0250.020.050.02

t0.0252.68+(2.182.68)0.0250.020.050.02=2.680.5162.60

คำตอบที่แท้จริงคือ ... ซึ่งไม่ใกล้เคียงอย่างยิ่งเพราะฟังก์ชั่นที่เราประมาณไม่ใกล้เคียงกับเชิงเส้นในช่วงนั้นมาก (ใกล้กว่ามันคือ)α = 0.52.56α=0.5

การประมาณค่าเชิงเส้นของค่าวิกฤตในตารางที

การประมาณที่ดีขึ้นผ่านการแปลง

เราสามารถแทนที่การแก้ไขเชิงเส้นด้วยรูปแบบการทำงานอื่น ๆ ; ผลเราเปลี่ยนเป็นขนาดที่การแก้ไขเชิงเส้นทำงานได้ดีขึ้น ในกรณีนี้ในส่วนท้ายค่าวิกฤตที่ทำเป็นตารางจำนวนมากจะเกือบเป็นเส้นตรงของระดับนัยสำคัญ หลังจากเราจด s เราก็ใช้การประมาณเชิงเส้นเหมือนเดิม ลองดูจากตัวอย่างด้านบน:เข้าสู่ระบบloglog

αlog(α)t0.023.9122.680.0253.689t0.0250.052.9962.18

ตอนนี้

t0.0252.682.182.68log(0.025)log(0.02)log(0.05)log(0.02)=3.6893.9122.9963.912

หรือเทียบเท่า

t0.0252.68+(2.182.68)3.6893.9122.9963.912=2.680.50.2432.56

ซึ่งถูกต้องตามจำนวนตัวเลขที่ยกมา นี่เป็นเพราะ - เมื่อเราเปลี่ยนลอการิทึม x - ความสัมพันธ์เกือบเป็นเส้นตรง:

การแก้ไขเชิงเส้นในล็อกอัลฟ่า
ที่จริงแล้วเส้นโค้ง (สีเทา) ที่มองเห็นนั้นอยู่ด้านบนของเส้นตรง (สีฟ้า)

ในบางกรณีlogitของระดับนัยสำคัญ ( ) อาจทำงานได้ดีในช่วงกว้าง แต่โดยทั่วไปไม่จำเป็น (เรามักจะสนใจเฉพาะค่าวิกฤตที่ถูกต้องเมื่อมีขนาดเล็กพอที่ทำงานได้ค่อนข้างดี)logit(α)=log(α1α)=log(11α1)αlog

การแก้ไขข้ามองศาอิสระที่แตกต่างกัน

tตาราง , chi-square และยังมีองศาอิสระซึ่งไม่มีการจัดตารางค่าdf ( -) ทุกค่า ค่าวิกฤตส่วนใหญ่ไม่ได้แสดงอย่างถูกต้องโดยการสอดแทรกเชิงเส้นใน df อันที่จริงมักจะเป็นมากขึ้นเกือบกรณีที่ค่าในตารางที่มีเส้นตรงซึ่งกันและกันของ DF ที่1Fν1/ν

(ในตารางเก่าคุณมักจะเห็นคำแนะนำให้ทำงานกับ - ค่าคงที่ของตัวเศษไม่แตกต่างกัน แต่สะดวกกว่าในเครื่องคิดเลขล่วงหน้าเพราะ 120 มีปัจจัยหลายอย่างดังนั้นมักจะเป็นจำนวนเต็มทำให้การคำนวณง่ายขึ้นเล็กน้อย)120/ν120/ν

นี่คือวิธีการดำเนินการแก้ไขผกผันกับค่าที่สำคัญ 5% ของระหว่างและ120นั่นคือเพียงปลายทางมีส่วนร่วมในการแก้ไขใน1ตัวอย่างเช่นในการคำนวณค่าวิกฤตสำหรับเรารับ (และโปรดสังเกตว่าที่นี่หมายถึงค่าผกผันของ cdf):F4,νν=601201/νν=80F

F4,80,.95F4,60,.95+1/801/601/1201/60(F4,120,.95F4,60,.95)

ผกผัน interp ใน df

(เปรียบเทียบกับไดอะแกรมที่นี่ )


ส่วนใหญ่ แต่ไม่เสมอไป นี่คือตัวอย่างที่การประมาณค่าเชิงเส้นใน df ดีขึ้นและคำอธิบายวิธีบอกจากตารางว่าการประมาณเชิงเส้นจะแม่นยำ

นี่คือส่วนหนึ่งของตารางไค - สแควร์

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

ลองนึกภาพเราต้องการค้นหาค่าวิกฤติ 5% (95 เปอร์เซ็นต์) สำหรับ 57 องศาอิสระ

มองอย่างใกล้ชิดเราจะเห็นว่าค่าวิกฤต 5% ในตารางเกือบจะเป็นเส้นตรงที่นี่:

ป้อนคำอธิบายรูปภาพที่นี่

(เส้นสีเขียวรวมค่า 50 และ 60 df คุณสามารถเห็นมันสัมผัสจุดสำหรับ 40 และ 70)

ดังนั้นการแก้ไขเชิงเส้นจะทำได้ดีมาก แต่แน่นอนว่าเราไม่มีเวลาวาดกราฟ วิธีการตัดสินใจว่าจะใช้การแก้ไขเชิงเส้นเมื่อใดและจะลองทำอะไรที่ซับซ้อนมากกว่านี้

เช่นเดียวกับค่าที่ด้านใดด้านหนึ่งของค่าที่เราค้นหาให้ใช้ค่าที่ใกล้ที่สุดถัดไป (70 ในกรณีนี้) หากค่า tabulated กลาง (ค่าสำหรับ df = 60) อยู่ใกล้กับเส้นตรงระหว่างค่าสิ้นสุด (50 และ 70) การแก้ไขเชิงเส้นจะเหมาะสม ในกรณีนี้ค่าต่าง ๆ จึงมีความง่ายมาก: คือใกล้กับ ?x 60 , 0.95(x50,0.95+x70,0.95)/2x60,0.95

เราพบว่าซึ่งเมื่อเทียบกับค่าจริงของ 60 df, 79.082 เราจะเห็นว่ามีความแม่นยำเกือบสามตัวเลขเต็มซึ่งมักจะค่อนข้างดีสำหรับการแก้ไขดังนั้นในกรณีนี้ คุณจะติดกับการแก้ไขเชิงเส้น; ด้วยขั้นตอนที่ละเอียดกว่าสำหรับค่าที่เราต้องการตอนนี้เราคาดว่าจะมีความแม่นยำของตัวเลข 3 อย่างมีประสิทธิภาพ(67.505+90.531)/2=79.018

ดังนั้นเราจึงได้รับ:หรือx67.50579.08267.50557506050

x67.505+(79.08267.505)5750605075.6175.61

ค่าจริงคือ 75.62375 ดังนั้นเราจึงมีความแม่นยำ 3 รูปและมีเพียง 1 ในสี่เท่านั้น

การแก้ไขที่แม่นยำยิ่งขึ้นอาจจะยังคงมีอยู่โดยใช้วิธีการของความแตกต่างอัน จำกัด (โดยเฉพาะอย่างยิ่งผ่านความแตกต่างที่ถูกแบ่งแยก) แต่นี่อาจเป็น overkill สำหรับปัญหาการทดสอบสมมติฐาน

หากองศาอิสระของคุณผ่านจุดสิ้นสุดของตารางคำถามนี้จะกล่าวถึงปัญหานั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.