ไคสแควร์กำลังทำการทดสอบด้านเดียวเสมอหรือไม่?


48

บทความที่ตีพิมพ์ ( pdf ) มี 2 ประโยคเหล่านี้:

นอกจากนี้การรายงานที่ผิดอาจเกิดจากการใช้กฎที่ไม่ถูกต้องหรือขาดความรู้ในการทดสอบทางสถิติ ตัวอย่างเช่นยอดรวม df ใน ANOVA อาจถูกใช้เป็นข้อผิดพลาด df ในการรายงานการทดสอบหรือผู้วิจัยอาจแบ่งค่า p ที่รายงานของการหรือสองเพื่อให้ได้ค่าด้านเดียวในขณะที่ค่าของการหรือเป็นการทดสอบด้านเดียวแล้วχ 2 F p p χ 2 FFχ2Fppχ2F

ทำไมพวกเขาถึงพูดอย่างนั้น? การทดสอบไคสแควร์เป็นการทดสอบสองด้าน (ฉันได้ถามผู้เขียนคนหนึ่ง แต่ไม่มีการตอบสนอง)

ฉันกำลังมองอะไร


ดูแบบฝึกหัด 4.14 ของฉบับเศรษฐมิติของ Davidson & Mackinnon 'เศรษฐมิติและวิธีการ' 2004 เพื่อเป็นตัวอย่าง (พิเศษ) เมื่อใช้ Chi-squared สำหรับการทดสอบแบบสองด้าน แก้ไข: คำอธิบายที่ดีที่นี่: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
สูงสุด

คำตอบ:


50

การทดสอบแบบไคสแควร์เป็นการทดสอบแบบด้านเดียวเสมอ นี่เป็นวิธีที่หลวมที่จะคิดเกี่ยวกับมัน: การทดสอบไคสแควร์นั้นเป็นการทดสอบความดีที่พอดี บางครั้งมันก็ถูกเรียกอย่างชัดเจนว่าเป็นเช่นนี้ แต่ถึงแม้มันจะไม่ใช่มันก็ยังคงอยู่ในความดีของความพอดี ตัวอย่างเช่นการทดสอบความเป็นอิสระของไค - สแควร์ในตารางความถี่ 2 x 2 คือ (เรียงจาก) การทดสอบความดีพอดีของแถวแรก (คอลัมน์) ถึงการแจกแจงที่ระบุโดยแถวที่สอง (คอลัมน์) และในทางกลับกัน พร้อมกัน ดังนั้นเมื่อค่าไคสแควร์ที่รับรู้ได้ออกไปทางด้านขวาของการกระจายตัวมันก็บ่งบอกถึงความพอดีและถ้ามันอยู่ไกลพอเมื่อเทียบกับเกณฑ์ที่กำหนดไว้ล่วงหน้าเราอาจสรุปได้ว่ามันแย่จน เราไม่เชื่อว่าข้อมูลนั้นมาจากการกระจายการอ้างอิง

ถ้าเราใช้การทดสอบไคสแควร์เป็นการทดสอบสองด้านเราก็จะเป็นกังวลหากสถิติอยู่ไกลเกินไปทางด้านซ้ายของการแจกแจงไคสแควร์ นี้จะหมายความว่าเรามีความกังวลใจพอดีอาจจะดีเกินไป นี่ไม่ใช่สิ่งที่เราเป็นห่วงโดยทั่วไป (ในฐานะที่เป็นบันทึกด้านประวัติศาสตร์สิ่งนี้เกี่ยวข้องกับการทะเลาะวิวาทว่าเมนเดลทำให้เสียข้อมูลของเขาหรือไม่ความคิดคือข้อมูลของเขาดีเกินกว่าจะเป็นจริงดูที่นี่สำหรับข้อมูลเพิ่มเติมหากคุณสงสัย)


9
+1 สำหรับการกล่าวถึงการใช้สองด้านกับการทดลองของถั่ว Mendel: มันน่าจดจำและเป็นหัวใจของคำถาม
whuber

2
+1 สำหรับคำถามที่ดีและคำตอบที่ยอดเยี่ยม @Joel W: ผมขอสามารถแนะนำวิดีโอข่าน Academys ในทดสอบχ2
แม็กซ์กอร์ดอน

9
บทสรุปของฉันคือว่าเป็นการทดสอบสองด้านที่เรามักจะสนใจเพียงหนึ่งหางของการแจกแจงซึ่งบ่งชี้ถึงความไม่ลงรอยกันมากกว่าไม่เห็นด้วยน้อยกว่าที่คาดไว้โดยบังเอิญ χ2
Frank Harrell

5
สนับสนุนมุมมองแบบ 2 ด้าน: "ความน่าจะเป็นแบบสองด้านที่เกิน +/- z สำหรับการแจกแจงแบบปกติมาตรฐานเท่ากับความน่าจะเป็นแบบหางขวาด้านบน z-squared สำหรับการแจกแจงแบบไคสแควร์ที่มี df = 1 ตัวอย่างเช่น ความน่าจะเป็นมาตรฐานแบบปกติที่ต่ำกว่า. 05 ที่ต่ำกว่า -1.96 และสูงกว่า 1.96 เท่ากับความน่าจะเป็นแบบไค - สแควร์ด้านขวา (1.96) กำลังสอง = 3.84 เมื่อ df = 1 " Agresti, 2007 (2nd ed.) หน้า 11
Joel W.

5
ถูกตัอง. การยกระดับคะแนน z จะทำให้เกิดตัวแปรไคสแควร์ ตัวอย่างเช่น az ของ 2 (หรือ, -2!) เมื่อกำลังสองเท่ากับ 4 ซึ่งเป็นค่าไคสแควร์ที่สอดคล้องกัน ค่า p สองด้านที่เชื่อมโยงกับค่า z คือ 2 เท่ากับ 0.4550026 และค่า p เดียวที่เกี่ยวข้องกับค่าไคสแควร์ของ 4 (df = 1) คือ. 04550026 การทดสอบ z แบบสองด้านสอดคล้องกับการทดสอบไคสแควร์แบบหนึ่งด้าน การดูที่หางซ้ายของการแจกแจงแบบไคสแควร์นั้นสอดคล้องกับการค้นหาคะแนน z ที่ใกล้กับ z = 0 มากกว่าที่คุณคาดหวังโดยบังเอิญ
gung - Reinstate Monica

12

ไคสแควร์กำลังทำการทดสอบด้านเดียวเสมอหรือไม่?

นั่นขึ้นอยู่กับสองสิ่ง:

  1. มีการทดสอบสมมติฐานอะไรบ้าง หากคุณกำลังทดสอบความแปรปรวนของข้อมูลปกติเทียบกับค่าที่ระบุคุณสามารถจัดการกับส่วนท้ายหรือส่วนล่างของไคสแควร์ (แบบด้านเดียว) หรือส่วนท้ายของการแจกแจงทั้งสอง เราต้องจำไว้ว่าสถิติประเภทไม่ใช่การทดสอบไคสแควร์ในเมืองเท่านั้น!(OE)2E

  2. ไม่ว่าจะเป็นคนที่มีการพูดคุยเกี่ยวกับสมมติฐานทางเลือกการเป็นหนึ่งหรือสองด้าน (เพราะบางคนใช้ 'สองด้าน' เพื่ออ้างถึงเป็นทางเลือกที่สองด้านโดยไม่คำนึงถึงสิ่งที่เกิดขึ้นกับการกระจายการสุ่มตัวอย่างจากสถิติ . นี้บางครั้งอาจเป็น ตัวอย่างเช่นหากเรากำลังดูการทดสอบสัดส่วนตัวอย่างสองคนอาจจะเป็นโมฆะเขียนว่าทั้งสองสัดส่วนเท่ากันและในอีกทางเลือกหนึ่งเขียนว่าπ1π2แล้วพูดว่ามันเป็น 'สองหาง' แต่ทดสอบโดยใช้ไคสแควร์แทนที่จะทดสอบ z และดูที่หางด้านบนของการกระจายตัวของสถิติทดสอบ (ดังนั้นมันจึงมีสองหางในแง่ของ การกระจายตัวของความแตกต่างในสัดส่วนตัวอย่าง แต่สิ่งหนึ่งที่เกี่ยวข้องในแง่ของการกระจายตัวของสถิติไคสแควร์ที่ได้จากนั้น - ในแบบเดียวกับที่คุณทำสถิติทดสอบคุณ ดูหางหนึ่งในการกระจายของ )|T||T|

ซึ่งต้องบอกว่าเราต้องระมัดระวังอย่างมากเกี่ยวกับสิ่งที่เราหมายถึงการใช้ 'การทดสอบไคสแควร์' และแม่นยำเกี่ยวกับสิ่งที่เราหมายถึงเมื่อเราพูดว่า 'one-tailed' vs 'two-tailed'

ในบางสถานการณ์ (สองที่ฉันกล่าวถึงอาจมีมากกว่า) มันอาจเหมาะสมอย่างยิ่งที่จะเรียกมันว่าสองด้านหรืออาจสมเหตุสมผลที่จะเรียกมันว่าสองด้านหากคุณยอมรับการใช้คำศัพท์บางคำ

มันอาจจะเป็นคำสั่งที่สมเหตุสมผลที่จะบอกว่ามันเป็นแบบทางด้านเดียวเท่านั้นหากคุณ จำกัด การสนทนากับการทดสอบไคสแควร์บางประเภท



ขอบคุณมากที่พูดถึงการทดสอบความแปรปรวน นั่นคือการทดสอบที่น่าสนใจและเป็นเหตุผลว่าทำไมฉันถึงลงเอยที่หน้านี้ ^^
Tobbey

5

การทดสอบไคสแควร์ของสมมติฐานที่ความแปรปรวนคือสามารถเป็นได้ทั้งหนึ่งหรือสองหางในลักษณะเดียวกับที่ t-testของสมมติฐานที่ว่าค่าเฉลี่ยคือสามารถเป็นหนึ่งหรือสองหาง(n1)s2/σ2σ2(mμ)n/sμ


1

คำตอบของ @ gung นั้นถูกต้องและเป็นวิธีที่ควรอ่านอย่างไรก็ตามความสับสนอาจเกิดขึ้นจากการอ่านอื่น:χ2

มันจะง่ายต่อการตีความ aเป็น 'สองด้าน' ในแง่ที่ว่าสถิติการทดสอบโดยทั่วไปประกอบด้วยผลรวมของความแตกต่างยกกำลังสองจากทั้งสองด้านของการกระจายเดิมχ2

อ่านนี้จะให้เกิดความสับสนวิธีการทดสอบทางสถิติถูกสร้างขึ้นที่หางของสถิติการทดสอบจะถูกมองไปที่


คุณช่วยอธิบายรายละเอียดเกี่ยวกับ "ด้านข้างของการกระจายแบบดั้งเดิม" ได้ไหม มันไม่เห็นชัดเจนเลยว่า "การกระจายดั้งเดิม" หมายถึงอะไรและเกี่ยวข้องกับสถิติไคสแควร์ที่คำนวณจากข้อมูลอย่างไร
whuber

ยกตัวอย่างเช่นผลรวมของปกติอิสระยืดเป็น 2 บรรทัดฐานคือการกระจาย 'ดั้งเดิม' สถิติประกอบด้วยข้อมูลจากทั้งสองหางของการกระจายปกติพื้นฐาน nχ2χ2
คาดเดา

ตกลง แต่ฉันก็ยังไม่สามารถเข้าใจได้ว่าคุณตัดกันอะไรด้วย คุณสามารถให้ตัวอย่างของสถิติการทดสอบแบบสองด้านที่สามารถนำมาใช้ใน ANOVA และแสดงให้เห็นว่ามันเชื่อมต่อกับหางของการแจกแจงบ้างไหม?
whuber

ฉันไม่ได้เปรียบเทียบกับอะไรเลย ผมชี้ให้เห็นเหตุผลว่าทำไมคนอาจได้รับสับสนเกี่ยวกับด้านเดียวศัพท์แสง / สองด้านในบริบทของ 2 ตรงไปตรงมาสำหรับผู้เชี่ยวชาญที่จะเห็นว่าการทดสอบตัวเองมักจะเป็นการทดสอบด้านเดียวในสถิติที่คำนวณได้ คนอื่น ๆ อาจมีข้อมูลบางอย่างและคิดเกี่ยวกับการเบี่ยงเบนจากค่าเฉลี่ยในทั้งสองทิศทางซึ่งมักจะถูกนำไปรวมเป็นสถิติพวกเขาจะเคยได้ยินสิ่งต่าง ๆ ตามแนวของ 'การคิดการเบี่ยงเบนจากค่าเฉลี่ยทั้งสองทิศทาง = การทดสอบสองด้าน' ดังนั้นความเข้าใจผิด χ2χ2χ2
คาดเดา

ฉันขอความแตกต่างเพียงเพื่อช่วยให้เข้าใจสิ่งที่คุณพยายามอธิบาย ฉันยังไม่สามารถระบุได้ว่าเป็นอะไร
whuber

0

ฉันยังมีปัญหาบางอย่างที่จะมาจับกับคำถามนี้เช่นกัน แต่หลังจากการทดลองบางอย่างดูเหมือนว่าปัญหาของฉันเป็นเพียงแค่ในวิธีการตั้งชื่อการทดสอบ

ใน SPSS เป็นตัวอย่างตาราง 2x2 สามารถเพิ่มการทดสอบ chisquare ได้ มีสองคอลัมน์สำหรับค่า p, หนึ่งสำหรับ "Pearson Chi-Sqare", "Continuity Correction" ฯลฯ และคอลัมน์อีกคู่สำหรับการทดสอบที่แน่นอนของ Fisher ที่มีหนึ่งคอลัมน์สำหรับการทดสอบ 2 ด้านและอีกอันสำหรับ การทดสอบ 1 ด้าน

ครั้งแรกที่ฉันคิดว่าด้านที่ 1 และ 2 แสดงถึงการทดสอบ chisquare รุ่นที่ 1 หรือ 2 ซึ่งดูเหมือนจะแปลก มันกลับกลายเป็นว่าสิ่งนี้หมายถึงการกำหนดพื้นฐานของสมมติฐานทางเลือกในการทดสอบของความแตกต่างระหว่างสัดส่วนเช่นการทดสอบซี ดังนั้นการทดสอบสัดส่วนแบบสองด้านที่สมเหตุสมผลมักเกิดขึ้นได้ใน SPSS กับการทดสอบ chisquare ซึ่งการวัด chisquare เปรียบเทียบกับค่าในส่วนท้าย (1 ด้าน) ของการแจกแจง เดาว่านี่เป็นสิ่งที่คนอื่น ๆ ตอบคำถามเดิมได้ชี้ไปแล้ว แต่ฉันใช้เวลาสักพักกว่าจะรู้ตัว

อย่างไรก็ตามรูปแบบเดียวกันนี้ใช้ใน openepi.com และระบบอื่น ๆ ด้วยเช่นกัน



0

χ2 การทดสอบความแปรปรวนสามารถเป็นหนึ่งหรือสองด้าน: สถิติการทดสอบคือและสมมติฐานว่างคือ: s (ตัวอย่างเบี่ยงเบน) = (ค่าอ้างอิง) สมมติฐานทางเลือกที่อาจจะ (ก) (ข) (ค)\ การคำนวณด้วยค่า p เกี่ยวข้องกับความไม่สมดุลของการแจกแจง σs>σs<σsσ(n1)s2σ2σs>σs<σsσ


1
ยินดีต้อนรับสู่ CV! ฉันคิดว่าคำตอบของ Ray Koopmanครอบคลุมประเด็นนี้ไปแล้ว
Silverfish

-1

การและ F เป็นการทดสอบด้านเดียวเพราะเราไม่เคยมีค่าลบของและ F สำหรับผลรวมของความแตกต่างของการสังเกตและการคาดการณ์กำลังสองหารด้วยการคาดหวัง (สัดส่วน ) ดังนั้นไคสแควร์จึงเป็นจำนวนบวกเสมอหรืออาจใกล้กับศูนย์ทางด้านขวาเมื่อไม่มีความแตกต่าง ดังนั้นการทดสอบนี้จึงเป็นการทดสอบด้านเดียวที่ถูกต้องเสมอ คำอธิบายสำหรับการทดสอบ F คล้ายกันχ 2 χ 2χ2χ2χ2

สำหรับการทดสอบ F เราเปรียบเทียบระหว่างความแปรปรวนของกลุ่มกับผลรวมของความแปรปรวนของกลุ่ม (หมายถึงข้อผิดพลาดแบบสแควร์กับถ้าระหว่างและภายในผลรวมของกำลังสองเท่ากับเราได้ค่า F 1SSwdfw

เนื่องจากมันคืออัตราส่วนของผลรวมของกำลังสองดังนั้นค่าจึงไม่กลายเป็นจำนวนลบ ดังนั้นเราไม่ได้ทำการทดสอบด้านซ้ายและการทดสอบ F นั้นเป็นการทดสอบด้านเดียวที่ถูกต้องเสมอ ตรวจสอบตัวเลขของและการแจกแจงแบบ F ซึ่งเป็นค่าบวกเสมอสำหรับการทดสอบทั้งสองคุณกำลังดูว่าสถิติที่คำนวณนั้นอยู่ทางด้านขวาของค่าวิกฤตหรือไม่ χ2

การแจกแจงแบบ Chi-square และ F


1
สถิติการทดสอบไม่จำเป็นต้องใช้ค่าลบเพื่อให้เราพิจารณาทั้งสองก้อย พิจารณาการทดสอบ F สำหรับอัตราส่วนของสองค่าความแปรปรวนตัวอย่างเช่น
Glen_b

การทดสอบ F เป็นการทดสอบด้านเดียว Glen_b
Daniel

3
การทดสอบ F เพื่อความเท่าเทียมกันของความแปรปรวนซึ่งมีสถิติที่อัตราส่วนของการประมาณค่าความแปรปรวนสองค่านั้นไม่ได้เป็นด้านเดียว มันมีค่าประมาณซึ่งวางความแปรปรวนตัวอย่างสองตัวที่ใหญ่กว่าบนตัวเศษ แต่มันจะถูกต้องก็ต่อเมื่อ df เหมือนกัน แต่ถ้าคุณไม่ชอบมันก็มีตัวอย่างอีกจำนวนหนึ่ง สถิติสำหรับการทดสอบผลรวมอันดับไม่สามารถเป็นลบได้ แต่การทดสอบนั้นมีสองแบบฉันสามารถจัดหาตัวอย่างอื่น ๆ ได้ถ้าต้องการ
Glen_b

@Ferdi แต่น่าเสียดายที่มีบางอย่างผิดปกติอย่างชัดเจนกับตัวอย่างที่นั่น - มันบอกว่ามันเป็นสองด้าน แต่ก็บอกเป็นนัยว่ามันแค่ปฏิเสธค่าสถิติ หากน้อยกว่าเราแทบจะไม่เคยสังเกตค่าอัตราส่วนที่มีขนาดใหญ่ดังนั้นสถิติจะมีแนวโน้มที่จะปฏิเสธเมื่อทำให้ด้านเดียว σ 2 2 σ 2 1 > σ 2 2σ12σ22σ12>σ22
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.