การทดสอบทั้งสองโดยนัยเป็นแบบจำลองความสัมพันธ์การตอบสนองอายุ แต่พวกเขาทำในรูปแบบที่แตกต่างกัน ตัวเลือกใดให้เลือกขึ้นอยู่กับว่าคุณเลือกโมเดลความสัมพันธ์นั้นอย่างไร ทางเลือกของคุณควรขึ้นอยู่กับทฤษฎีพื้นฐานถ้ามี ชนิดของข้อมูลที่คุณต้องการดึงออกมาจากผลลัพธ์ และวิธีการเลือกตัวอย่าง คำตอบนี้กล่าวถึงสามด้านตามลำดับ
ฉันจะอธิบายการทดสอบ t และการถดถอยโลจิสติกโดยใช้ภาษาที่สมมติว่าคุณกำลังศึกษาประชากรที่กำหนดไว้อย่างดีของผู้คนและต้องการทำการอนุมานจากกลุ่มตัวอย่างไปยังประชากรกลุ่มนี้
เพื่อสนับสนุนการอนุมานทางสถิติใด ๆ เราต้องถือว่าตัวอย่างนั้นสุ่ม
t-testถือว่าผู้คนในกลุ่มตัวอย่างที่ตอบว่า "ไม่" เป็นกลุ่มตัวอย่างแบบง่าย ๆ ของกลุ่มที่ไม่ตอบแบบสอบถามทั้งหมดในกลุ่มประชากรและกลุ่มคนในกลุ่มตัวอย่างที่ตอบว่า "ใช่" นั้นเป็นกลุ่มตัวอย่างกลุ่มที่ตอบกลับแบบสุ่มทั้งหมดใน ประชากร.
t-test สร้างข้อสมมติฐานทางเทคนิคเพิ่มเติมเกี่ยวกับการแจกแจงของอายุในแต่ละกลุ่มในประชากร มีการทดสอบแบบทดสอบหลายรุ่นเพื่อรองรับความเป็นไปได้ที่จะเกิดขึ้น
การถดถอยแบบลอจิสติกถือว่าคนทุกวัยที่ได้รับนั้นเป็นกลุ่มตัวอย่างแบบง่าย ๆ ของคนในวัยนั้นในประชากร กลุ่มอายุที่แยกต่างหากอาจแสดงอัตราตอบกลับที่แตกต่างกันว่า "ใช่" อัตราเหล่านี้เมื่อแสดงเป็นอัตราต่อรอง (แทนที่จะเป็นสัดส่วนตรง) จะถือว่าสัมพันธ์เชิงเส้นตรงกับอายุ (หรือด้วยฟังก์ชันที่กำหนดอายุ)
การถดถอยแบบโลจิสติกส์สามารถขยายได้อย่างง่ายดายเพื่อรองรับความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างอายุและการตอบสนอง ส่วนขยายดังกล่าวสามารถใช้ในการประเมินความน่าเชื่อถือของสมมติฐานเชิงเส้นเริ่มต้น มันสามารถใช้กับชุดข้อมูลขนาดใหญ่ซึ่งมีรายละเอียดเพียงพอที่จะแสดงแบบไม่เป็นเชิงเส้น แต่ไม่น่าจะใช้กับชุดข้อมูลขนาดเล็กได้มากนัก กฎทั่วไปของหัวแม่มือ - แบบจำลองการถดถอยควรมีการสังเกตเป็นจำนวนสิบเท่าของพารามิเตอร์ - ชี้ให้เห็นว่าจำเป็นต้องมีการสังเกตมากกว่า 20 ครั้งเพื่อตรวจสอบความไม่เชิงเส้น (ซึ่งต้องการพารามิเตอร์ที่สามนอกเหนือจากการสกัดกั้นและความชันของฟังก์ชันเชิงเส้น )
t-test ตรวจพบว่าอายุเฉลี่ยแตกต่างกันระหว่างผู้ตอบที่ไม่ใช่และใช่ในประชากร การถดถอยแบบลอจิสติกประมาณว่าอัตราการตอบสนองแปรผันตามอายุอย่างไร ดังนั้นจึงมีความยืดหยุ่นและสามารถให้ข้อมูลรายละเอียดมากกว่าการทดสอบ t ในทางตรงกันข้ามมันมีแนวโน้มที่จะมีพลังน้อยกว่า t-test สำหรับจุดประสงค์พื้นฐานของการตรวจจับความแตกต่างระหว่างอายุเฉลี่ยในกลุ่ม
เป็นไปได้ที่คู่การทดสอบจะแสดงชุดค่าผสมที่มีนัยสำคัญและไม่มีนัยสำคัญทั้งสี่ชุด สองสิ่งนี้เป็นปัญหา:
การทดสอบ t ไม่มีนัยสำคัญ แต่การถดถอยโลจิสติกคือ เมื่อสมมติฐานของการทดสอบทั้งสองมีความน่าเชื่อถือผลลัพธ์ดังกล่าวเป็นไปไม่ได้ในทางปฏิบัติเพราะการทดสอบ t ไม่ได้พยายามที่จะตรวจสอบความสัมพันธ์ที่เฉพาะเจาะจงดังที่ระบุไว้โดยการถดถอยโลจิสติก อย่างไรก็ตามเมื่อความสัมพันธ์นั้นไม่เชิงเส้นเพียงพอที่จะทำให้วิชาที่เก่าแก่ที่สุดและอายุน้อยที่สุดที่จะแบ่งปันความคิดเห็นหนึ่งและวิชาวัยกลางคนอื่นจากนั้นการขยายของการถดถอยโลจิสติกไปสู่ความสัมพันธ์ที่ไม่เชิงเส้นสามารถตรวจจับและ .
การทดสอบ t มีความสำคัญ แต่การถดถอยโลจิสติกไม่ได้เป็นอย่างที่เป็นในคำถาม สิ่งนี้มักจะเกิดขึ้นโดยเฉพาะเมื่อมีกลุ่มผู้ตอบที่อายุน้อยกว่ากลุ่มผู้ตอบที่มีอายุมากกว่าและไม่กี่คน สิ่งนี้อาจสร้างความแตกต่างอย่างมากระหว่างอัตราการตอบกลับของผู้ตอบแบบไม่ตอบและใช่ มันถูกตรวจพบได้อย่างง่ายดายโดยการทดสอบ t อย่างไรก็ตามการถดถอยโลจิสติกจะมีข้อมูลรายละเอียดค่อนข้างน้อยเกี่ยวกับวิธีการที่อัตราการตอบสนองเปลี่ยนแปลงไปตามอายุหรืออื่น ๆ ซึ่งจะมีข้อมูลที่ไม่สามารถสรุปได้: กรณีของ "การแยกแบบสมบูรณ์" ซึ่งผู้สูงอายุทุกคนตอบสนองทางเดียว แต่ในกรณีนั้นการทดสอบทั้งสองมักจะมีค่า p ต่ำมาก
โปรดทราบว่าการออกแบบการทดลองสามารถทำให้สมมติฐานการทดสอบบางอย่างใช้ไม่ได้ ตัวอย่างเช่นหากคุณเลือกคนตามอายุของพวกเขาในการออกแบบแบ่งชั้นแล้วสมมติฐานของ t-test (ที่แต่ละกลุ่มสะท้อนให้เห็นถึงกลุ่มตัวอย่างแบบสุ่มง่าย ๆ อายุ) จะกลายเป็นที่น่าสงสัย การออกแบบนี้จะแนะนำให้ใช้การถดถอยโลจิสติก หากคุณมีสองกลุ่มผู้ตอบแบบไม่ตอบโต้และผู้ตอบแบบตอบรับหนึ่งรายและเลือกแบบสุ่มจากผู้ที่ยืนยันอายุของพวกเขาจากนั้นสมมติฐานการสุ่มตัวอย่างของการถดถอยแบบโลจิสติกส์นั้นน่าสงสัยในขณะที่การทดสอบแบบทดสอบ การออกแบบนั้นจะแนะนำให้ใช้รูปแบบของการทดสอบ t
(การออกแบบที่สองอาจดูโง่ที่นี่ แต่ในกรณีที่ "อายุ" ถูกแทนที่ด้วยลักษณะบางอย่างที่ยากราคาแพงหรือใช้เวลานานในการวัดมันน่าดึงดูด)