กระดาษ 1900 ของ Pearson ไม่มีลิขสิทธิ์ดังนั้นเราจึงสามารถอ่านออนไลน์ได้
คุณควรเริ่มด้วยการสังเกตว่าบทความนี้เกี่ยวกับความดีของการทดสอบแบบพอดีไม่ใช่การทดสอบความเป็นอิสระหรือความเป็นเนื้อเดียวกัน
เขาดำเนินการโดยทำงานร่วมกับตัวแปรหลายตัวแปรและไคสแควร์เกิดขึ้นจากผลรวมของความแปรปรวนมาตรฐานแบบมาตรฐานที่ยกกำลังสอง
คุณสามารถเห็นได้จากการอภิปรายใน p160-161 เขาพูดคุยอย่างชัดเจนถึงการใช้การทดสอบกับข้อมูลกระจายหลายมิติ (ฉันไม่คิดว่าเขาใช้คำนั้นทุกที่) เห็นได้ชัดว่าเขาเข้าใจถึงความปกติของตัวแปรหลายตัวแปรของ multinomial (แน่นอนว่าเขารู้ว่าระยะขอบนั้นเป็นปกติโดยประมาณ - นั่นเป็นผลลัพธ์ที่เก่ามาก - และรู้ถึงวิธีการความแปรปรวนและความแปรปรวนร่วมเนื่องจากมันระบุไว้ในกระดาษ); ฉันเดาว่าส่วนใหญ่ของสิ่งนั้นเป็นหมวกเก่าแล้วในปี 1900 (โปรดทราบว่าการแจกแจงแบบไคสแควร์นั้นย้อนกลับไปทำงานโดยเฮลเมอร์ในช่วงกลางทศวรรษ 1870)
จากนั้นที่ด้านล่างของ p163 เขาได้สถิติไค - สแควร์เป็น "การวัดความดีของความพอดี" (สถิติของตัวเองปรากฏในตัวแทนของการประมาณปกติหลายตัวแปร)
จากนั้นเขาก็จะหารือเกี่ยวกับวิธีการประเมินค่า p-value * จากนั้นเขาให้พื้นที่หางส่วนบนของχ 2 12อย่างถูกต้องχ212เกิน 43.87 เป็น 0.000016 อย่างถูกต้อง [คุณควรจำไว้ว่าเขาไม่เข้าใจวิธีปรับองศาอิสระสำหรับการประมาณค่าพารามิเตอร์ในขั้นตอนนั้นดังนั้นตัวอย่างในเอกสารของเขาจึงใช้ df สูงเกินไป]
* (โปรดทราบว่าไม่มีกระบวนทัศน์การทดสอบทั้งแบบฟิชเชอร์แมนและเนย์แมน - เพียร์สัน) แต่เราเห็นชัดเจนว่าเขาใช้แนวคิดของค่า p-value อยู่แล้ว)
คุณจะได้ทราบว่าเขาทำข้อตกลงไม่ได้เขียนไว้อย่างชัดเจนเช่นฉัน แต่เขาเขียนm 1 , m 2ฯลฯ สำหรับจำนวนที่คาดไว้และสำหรับปริมาณที่สังเกตได้เขาใช้m ′ 1เป็นต้น จากนั้นเขากำหนดe = m - m ′ (ครึ่งล่าง p160) และคำนวณe 2 / mสำหรับแต่ละเซลล์ (ดู eq. (xv) p163 และคอลัมน์สุดท้ายของตารางที่ด้านล่างของ p167) ... ปริมาณที่เท่ากัน แต่ในสัญกรณ์ที่แตกต่างกัน(Oi−Ei)2/Eim1m2m′1e=m−m′e2/m
วิธีการทำความเข้าใจแบบทดสอบไค - สแควร์ในปัจจุบันส่วนใหญ่ยังไม่เกิดขึ้น แต่ในทางกลับกันมีอยู่บ้างเล็กน้อย (อย่างน้อยถ้าคุณรู้ว่าจะมองหาอะไร) เกิดขึ้นมากมายในช่วงปี 1920 (เป็นต้นไป) ที่เปลี่ยนวิธีที่เราดูสิ่งเหล่านี้
สำหรับสาเหตุที่เราหารด้วยในกรณี multinomial มันเกิดขึ้นแม้ว่าความแปรปรวนของแต่ละองค์ประกอบใน multinomial จะน้อยกว่าE iเมื่อเราคำนึงถึงความแปรปรวนร่วมมันก็เท่ากับหารด้วยE iEiEiEiทำ สำหรับการทำให้เข้าใจง่ายดี
เพิ่มในการแก้ไข:
บทความในปี 1983 โดย Plackett ได้ให้บริบททางประวัติศาสตร์ที่ดีและมีบางสิ่งที่จะนำไปสู่บทความ ฉันขอแนะนำให้ดูมัน ดูเหมือนว่าจะออนไลน์ฟรีผ่าน JStor (ถ้าคุณลงชื่อเข้าใช้) ดังนั้นคุณไม่จำเป็นต้องเข้าถึงผ่านสถาบันเพื่ออ่าน
Plackett, RL (1983),
"Karl Pearson และการทดสอบ Chi-Squared,"
International Statistics Review ,
Vol. 51, ลำดับที่ 1 (เม.ย. ), หน้า 59-72