การทดสอบความเป็นอิสระเทียบกับการทดสอบความเป็นเนื้อเดียวกัน


10

ฉันกำลังสอนหลักสูตรสถิติขั้นพื้นฐานและวันนี้ฉันจะครอบคลุมการทดสอบความเป็นอิสระของไคสแควร์สำหรับสองประเภทและการทดสอบความเป็นเนื้อเดียวกัน สถานการณ์ทั้งสองนี้แตกต่างกันตามแนวคิด แต่สามารถใช้สถิติการทดสอบและการกระจายแบบเดียวกันได้ ในการทดสอบความเป็นเนื้อเดียวกันผลรวมส่วนล่างสำหรับหนึ่งในหมวดหมู่จะถือว่าเป็นส่วนหนึ่งของการออกแบบ - เป็นตัวแทนของจำนวนวิชาที่เลือกสำหรับแต่ละกลุ่มการทดลอง แต่เนื่องจากการทดสอบไคสแควร์หมุนรอบการปรับสภาพบนยอดรวมทั้งหมดจึงไม่มีผลทางคณิตศาสตร์ที่จะแยกความแตกต่างระหว่างการทดสอบความเป็นเนื้อเดียวกันและการทดสอบความเป็นอิสระด้วยข้อมูลเด็ดขาดอย่างน้อยก็ไม่มีเมื่อใช้การทดสอบนี้

คำถามของฉันมีดังต่อไปนี้: มีโรงเรียนแห่งใดที่มีความคิดทางสถิติหรือวิธีการทางสถิติที่จะให้ผลการวิเคราะห์ที่แตกต่างกันขึ้นอยู่กับว่าเรากำลังทดสอบความเป็นอิสระ (โดยที่ margin ทั้งหมดเป็นตัวแปรสุ่ม) หรือทดสอบความเป็นเนื้อเดียวกัน กำหนดโดยการออกแบบ)?

ในกรณีที่ต่อเนื่องบอกว่าเราสังเกตในเรื่องเดียวกันและทดสอบความเป็นอิสระหรือสังเกตในประชากรที่แตกต่างกันและทดสอบว่าพวกเขามาจากการกระจายตัวเดียวกันวิธีการที่แตกต่างกัน การวิเคราะห์ vs t-test) เกิดอะไรขึ้นถ้าข้อมูลหมวดหมู่มาจากตัวแปรที่ต่อเนื่องแบบแยกส่วน การทดสอบความเป็นอิสระและความเป็นเนื้อเดียวกันควรแยกไม่ออกหรือไม่?(X,Y)(X1,X2)


2
คุณสามารถให้แหล่งข้อมูลที่แยก "การทดสอบความเป็นเนื้อเดียวกัน" และ "การทดสอบความเป็นอิสระ" ได้หรือไม่? ฉันเคยคิดว่ามันเหมือนกัน (และWikipediaด้วย) มันถูกเรียกอีกอย่างว่าการทดสอบไคสแควร์ของการเชื่อมโยงสำหรับตารางความต่อเนื่อง 2 ทางหรือการทดสอบเปรียบเทียบไคสแควร์ตัวอย่างอิสระ K มันควรจะไม่สับสนกับหนึ่งตัวอย่างการทดสอบไคสแควร์ยังเป็นที่รู้จักไคสแควร์การทดสอบของข้อตกลง ในนั้นเราทดสอบความถี่ที่สังเกตได้กับค่าที่เราคาดไว้ทางทฤษฎีที่เราให้
ttnphns

2
@ttnphns ดูเหมือนว่าจะเป็นโรคประจำถิ่น ฉันใช้ "คาดหวังที่ไม่คาดคิด" โดย Raluca Balan และ Gilles Lamothe ปีที่แล้วฉันสอนจากสถิติธุรกิจโดย Sharpe, De Veaux และคณะ ตำราทั้งสองทำอาหารค่อนข้างแตกต่าง ในทั้งสองกรณีเรามีตารางฉุกเฉินสองทาง ไม่จำเป็นต้องพูดตำราเรียนไม่คิดว่ามันคุ้มค่าที่จะสอนขนาดผลกระทบสำหรับตารางฉุกเฉิน: อีกกรณีหนึ่งที่ชัยชนะเหนือความจริงที่มีประโยชน์มากกว่าในหลักสูตรสถิติขั้นพื้นฐาน
Placidia

2
ความแตกต่างควรปรากฏขึ้นหากคุณพยายามรับช่วงความมั่นใจสำหรับขนาดเอฟเฟกต์
Ray Koopman

2
นั่นฟังดูน่าสนใจ คุณคิดที่จะเพิ่มรายละเอียดและทำให้เป็นคำตอบหรือไม่?
Placidia

4
มันขึ้นอยู่กับว่าคุณต้องการทรมานนักเรียนด้วยความแตกต่างของระยะขอบแบบมีเงื่อนไข / ไม่มีเงื่อนไข ถ้าไม่ใช่คุณอาจแค่มุ่งเน้นไปที่การอธิบายว่า "ความเป็นอิสระของตัวแปรเด็ดขาดสองตัว" นั้นเทียบเท่ากับ "ความสม่ำเสมอของการแจกแจงแบบมีเงื่อนไข" แล้วจึงนำเสนอχ2-ทดสอบ. (ฉันมักจะนำเสนอมันพร้อมกับข้อ จำกัด ความเชื่อมั่นที่ลดลงสำหรับ Cramer ที่แท้จริงVที่วัดความแข็งแกร่งของการเชื่อมโยง)
Michael M

คำตอบ:


4

คุณต้องถามตัวเองว่า "ฉันจะเขียนสมมติฐานว่างได้อย่างไร" พิจารณา2×k ตารางฉุกเฉินของพฤติกรรมบางอย่าง (y / n) จำนวนหนึ่ง kกลุ่ม ถือว่ากลุ่มที่ 1 เป็นผู้อ้างอิงคุณมีk-1 อัตราต่อรอง (θผม,ผม=1,2,...,k-1) ที่อธิบายความสัมพันธ์ระหว่างความถี่และกลุ่ม

ภายใต้ความเป็นอิสระเช่นเดียวกับความเป็นเนื้อเดียวกันคุณคิดว่าอัตราต่อรองทั้งหมดคือ 1 นั่นคือความเป็นไปได้ที่จะตอบสนอง "ใช่" ต่อสภาพนั้นมีโอกาสเท่ากันโดยไม่คำนึงถึงการมอบหมายกลุ่ม หากสมมติฐานเหล่านั้นล้มเหลวอย่างน้อยหนึ่งกลุ่มจะแตกต่างกัน

H0(เป็นเนื้อเดียวกัน):Σผม=1k-1|θผม|=0

H0(ความเป็นอิสระ):Σผม=1k-1|θผม|=0

และการทดสอบนี้สามารถดำเนินการได้ด้วยการทดสอบ Pearson Chi-square โดยใช้ความถี่ที่สังเกต / คาดหวังซึ่งเป็นการทดสอบคะแนนสำหรับแบบจำลองการถดถอยโลจิสติกที่ปรับสำหรับ k-1ตัวแปรตัวบ่งชี้สำหรับการเป็นสมาชิกกลุ่ม ดังนั้นโครงสร้างเราอาจบอกว่าการทดสอบเหล่านี้เหมือนกัน

อย่างไรก็ตามความแตกต่างเกิดขึ้นเมื่อเราพิจารณาลักษณะของปัจจัยการจัดกลุ่ม ในแง่นี้การประยุกต์ใช้ตามบริบทของการทดสอบหรือค่อนข้างชื่อเป็นสิ่งสำคัญ กลุ่มอาจเป็นสาเหตุโดยตรงของผลลัพธ์เช่นการมีหรือไม่มียีนหรือรูปแบบอัลลีลของลักษณะในกรณีนี้เมื่อเราปฏิเสธโมฆะเราสรุปได้ว่าผลลัพธ์ขึ้นอยู่กับปัจจัยการจัดกลุ่มในคำถาม

ในทางกลับกันเมื่อเราทดสอบความเป็นเนื้อเดียวกันเราจะยกระดับตัวเองจากการตั้งสมมติฐานเชิงสาเหตุ ดังนั้นเมื่อ "กลุ่ม" เป็นสิ่งก่อสร้างที่มีความซับซ้อนเช่นการแข่งขัน (ซึ่งเป็นสาเหตุและเกิดจากพันธุกรรมพฤติกรรมและปัจจัยทางเศรษฐกิจและสังคม) เราสามารถสรุปได้เช่น . ถ้ามีคนโต้เช่นการโต้แย้งโดยพูดว่า "ดีว่าเพราะชนกลุ่มน้อยให้บรรลุการศึกษาที่ต่ำกว่ารายได้ที่ต่ำกว่าและได้รับการจ้างงานน้อย" คุณอาจจะพูดว่า "ผมไม่ได้เรียกร้องว่าการแข่งขันของพวกเขาก่อให้เกิดสิ่งเหล่านี้เพียงแค่ว่าถ้าคุณดูในการแข่งขันคุณสามารถคาดการณ์สภาพความเป็นอยู่ของพวกเขาได้ "

ด้วยวิธีดังกล่าวการทดสอบการพึ่งพาอาศัยกันเป็นกรณีพิเศษของการทดสอบความเป็นเนื้อเดียวกันซึ่งผลที่เป็นไปได้ของปัจจัยที่ซ่อนอยู่นั้นน่าสนใจและควรได้รับการจัดการในการวิเคราะห์แบบแบ่งชั้น การใช้การปรับหลายตัวแปรในแบบจำลองการถดถอยโลจิสติกแบบอะนาล็อกทำให้ได้สิ่งนั้นและเราอาจพูดได้ว่าเรากำลังทำการทดสอบการพึ่งพาอาศัยกัน แต่ไม่จำเป็นต้องเป็นเนื้อเดียวกัน


3

มีความแตกต่างที่ชัดเจนระหว่างสองปัญหานี้หากคุณจำลองในแบบเบย์ ในกระดาษบางกรณีกรณีแรก (ความสม่ำเสมอ) เรียกว่าการสุ่มตัวอย่างด้วย "หนึ่งขอบคงที่" และกรณีที่สอง (ความเป็นอิสระ) เป็น "ตารางรวมคงที่" ลองดูที่Casella และคณะ (JASA 2009)
ฉันกำลังทำงานในหัวข้อนี้ แต่บทความของฉัน - ซึ่งอธิบายความแตกต่างนี้ - ยังไม่ออก :)


2
มีความแตกต่างที่ชัดเจนจากมุมมองของผู้ใช้บ่อยเช่นกัน - มันเป็นเรื่องที่ไม่มีความหมายและไม่ได้มีความขัดแย้ง & บ่อยครั้งที่ข้อโต้แย้งถูกสร้างขึ้นเพื่อ จำกัด ขอบเขตหนึ่งหรือทั้งสองในกรณีใด ๆ
Scortchi - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.