G-test เทียบกับการทดสอบ Chi-squared ของ Pearson


10

ฉันกำลังทดสอบความเป็นอิสระในตารางฉุกเฉินฉันไม่รู้ว่าการทดสอบ G-testหรือการทดสอบไคสแควร์ของ Pearson นั้นดีกว่าหรือไม่ ขนาดตัวอย่างเป็นร้อย แต่มีจำนวนเซลล์ต่ำนับ ตามที่ระบุไว้ในหน้า Wikipediaการประมาณค่าการกระจายไคสแควร์นั้นดีกว่าสำหรับการทดสอบ G-test กว่าสำหรับการทดสอบไคสแควร์ของ Pearson แต่ฉันใช้การจำลอง Monte Carlo เพื่อคำนวณค่า p ดังนั้นจึงมีความแตกต่างระหว่างการทดสอบทั้งสองนี้หรือไม่?ยังไม่มีข้อความ×M


1
ดูอันซ์เพียร์สัน VS ความดีของพอดี
Scortchi - Reinstate Monica

คำตอบ:


8

asymptotically เดียวกัน พวกเขาเป็นเพียงวิธีที่แตกต่างกันในการรับความคิดเดียวกัน โดยเฉพาะอย่างยิ่งการทดสอบไคสแควร์ของเพียร์สันคือการทดสอบคะแนนในขณะที่การทดสอบจีเป็นการทดสอบอัตราส่วนความน่าจะเป็น เพื่อให้เข้าใจแนวคิดเหล่านั้นได้ดีขึ้นมันอาจช่วยให้คุณอ่านคำตอบของฉันที่นี่: เหตุใดค่า p ของฉันจึงแตกต่างกันระหว่างผลลัพธ์การถดถอยโลจิสติกการทดสอบไคสแควร์และช่วงความมั่นใจสำหรับ OR เพื่อตอบคำถามตรงของคุณถ้าคุณคำนวณค่า p ด้วยการจำลองแบบมอนติคาร์โลมันไม่สำคัญ คุณสามารถใช้วิธีใดก็ได้ที่สะดวกกว่าสำหรับคุณ โปรดทราบว่าไม่มีปัญหากับการนับเซลล์ต่ำคาดว่าจะต่ำ (อาจ) เท่านั้นจำนวนเซลล์ เป็นไปได้ที่จะมีจำนวนเซลล์ต่ำและคาดว่าจะมีจำนวนนับดี นอกจากนี้การนับจริงต่ำหรือการคาดหวังต่ำนั้นไม่สำคัญเมื่อค่า p ถูกกำหนดโดยการจำลอง

(สำหรับสิ่งที่คุ้มค่าฉันอาจจะใช้ Chi-squared ของ Pearson เพราะ R มีฟังก์ชั่นที่สะดวกสำหรับสิ่งที่มีตัวเลือกในการจำลองค่า p)


ฟังก์ชั่นใน R คืออะไร?
llewmills

chisq.test@llewmills,
gung - Reinstate Monica

1

ดูที่ Rfast https://cran.r-project.org/web/packages/Rfast/index.html คำสั่งที่เกี่ยวข้องคือ g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) การคำนวณนั้นเร็วมาก และโดยทั่วไปแล้วชอบการทดสอบ G ^ 2 เนื่องจาก Chi-square เป็นค่าประมาณ


-1

การทดสอบ Chi-square และ G-test มักให้ผลลัพธ์ที่คล้ายกัน แต่สิ่งที่สำคัญที่สุดที่นี่คือคุณต้องเลือกหนึ่งในสองของการทดสอบและติดกับมันไม่เพียง แต่สำหรับการทดสอบที่คุณกล่าวถึง แต่สำหรับการทดสอบในอนาคตในระหว่างการวิจัยของคุณ จะแนะนำให้เลือกเพราะถ้าคุณพยายามที่จะใช้การทดสอบทั้งสองอย่างสลับกันได้มีโอกาสมากที่คุณจะเพิ่มโอกาสในการได้รับผลบวกปลอม


2
อะไรคือเหตุผลที่การอ้างว่าโอกาสของการบวกที่ผิดพลาดเพิ่มขึ้น? (เว้นเสียแต่ว่าคุณตั้งใจจะแนะนำการทดสอบโดยเลือกจากการนับจริง - แต่มันหมายถึงการนับการเลือกระหว่างพวกเขานั่นคือปัญหาแทนที่จะเป็นความคิดในการแลกเปลี่ยนทดสอบต่อ se)
Glen_b

2
@Glen_b โอกาสที่จะได้รับ False Positive มีแนวโน้มเพิ่มขึ้นถ้าเราเลือกค่า p ของการทดสอบที่เป็นที่นิยมมากกว่าในสมมติฐานของเรา (ในกรณีที่เราลองทดสอบทั้งคู่)
little_monster
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.