ฉันกำลังดูแผ่น excel ที่อ้างว่าคำนวณแต่ฉันไม่รู้จักวิธีนี้และฉันสงสัยว่าฉันทำอะไรหายไปหรือเปล่า
นี่คือข้อมูลที่วิเคราะห์:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
และนี่คือผลรวมของแต่ละกลุ่มเพื่อคำนวณไคสแควร์:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
ดังนั้นสำหรับแต่ละกลุ่มคือ:
2.822793
2.822793
1.759359
4.136448
และไคจิสแควร์ทั้งหมดคือ: 11.54139
.
อย่างไรก็ตามทุกตัวอย่างที่ฉันเห็นการคำนวณนั้นแตกต่างอย่างสิ้นเชิงจากสิ่งนี้ ฉันจะทำสำหรับแต่ละกลุ่ม:
chiSq = (Observed-Expected)^2 / Expected
11.3538
และดังนั้นสำหรับตัวอย่างข้างต้นผมจะได้รับรวมค่าไคสแควร์ของ
คำถามของฉันคือ - ทำไมพวกเขาถึงคำนวณ excelด้วยวิธีนี้ นี่เป็นวิธีที่ได้รับการยอมรับหรือไม่
UPDATE
เหตุผลที่ฉันต้องการรู้สิ่งนี้คือฉันพยายามทำซ้ำผลลัพธ์เหล่านี้ในภาษา R ฉันใช้ฟังก์ชัน chisq.test และไม่ออกมาด้วยหมายเลขเดียวกับแผ่นงาน Excel ดังนั้นหากใครรู้วิธีการทำวิธีนี้ใน R มันจะมีประโยชน์มาก!
อัพเดท 2
หากใครสนใจนี่คือวิธีที่ฉันคำนวณใน R:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))