การถดถอยโลจิสติกหรือการทดสอบ T?


17

กลุ่มบุคคลตอบคำถามหนึ่งข้อ คำตอบอาจเป็น "ใช่" หรือ "ไม่" ผู้วิจัยต้องการทราบว่าอายุนั้นเกี่ยวข้องกับประเภทของคำตอบหรือไม่

ความสัมพันธ์ถูกประเมินโดยทำการถดถอยโลจิสติกโดยอายุเป็นตัวแปรอธิบายและประเภทของคำตอบ (ใช่ไม่ใช่) เป็นตัวแปรตาม มันถูกแยกจากกันโดยการคำนวณอายุเฉลี่ยของกลุ่มที่ตอบว่า "ใช่" และ "ไม่" ตามลำดับและทำการทดสอบTเพื่อเปรียบเทียบค่าเฉลี่ย

การทดสอบทั้งสองดำเนินการตามคำแนะนำของบุคคลที่แตกต่างกันและไม่มีการทดสอบใดที่แน่นอนว่าเป็นวิธีที่เหมาะสม ในมุมมองของคำถามการวิจัยซึ่งจะเป็นการทดสอบที่ดีกว่า

สำหรับการทดสอบสมมติฐานค่า p ไม่มีนัยสำคัญ (การถดถอย) และนัยสำคัญ (การทดสอบ T) ตัวอย่างน้อยกว่า 20 ราย


2
ฉันไม่แน่ใจว่าสิ่งนี้จะเป็นคำถามที่แท้จริงของคุณ คุณได้ทำการวิเคราะห์ทั้งสองอย่างที่คุณต้องการแล้ว ฉันเดาว่าสิ่งที่คุณต้องการรู้จริง ๆ คือบางสิ่งเกี่ยวกับการเปรียบเทียบหรือความสัมพันธ์ระหว่างการทดสอบเหล่านั้นตัวอย่างเช่นดีกว่า โปรดแก้ไขคำถามของคุณเพื่อแก้ไข
John

การทดสอบทั้งสองดำเนินการตามคำแนะนำของบุคคลต่าง ๆ และไม่มีใครแน่ใจว่านี่เป็นวิธีที่ถูกต้องหรือไม่ ในมุมมองของคำถามการวิจัย (คืออายุที่เกี่ยวข้องกับประเภทของการตอบสนองหรือไม่) ซึ่งจะเป็นการทดสอบที่ดีกว่าการถดถอยโลจิสติกของประเภทของการตอบสนองกับอายุหรือทดสอบ T เปรียบเทียบอายุเฉลี่ยบุคคลที่ตอบว่า "ใช่" กับค่าเฉลี่ย อายุของบุคคลที่ตอบว่า "ไม่"
เกวน

คำตอบ:


19

การทดสอบทั้งสองโดยนัยเป็นแบบจำลองความสัมพันธ์การตอบสนองอายุ แต่พวกเขาทำในรูปแบบที่แตกต่างกัน ตัวเลือกใดให้เลือกขึ้นอยู่กับว่าคุณเลือกโมเดลความสัมพันธ์นั้นอย่างไร ทางเลือกของคุณควรขึ้นอยู่กับทฤษฎีพื้นฐานถ้ามี ชนิดของข้อมูลที่คุณต้องการดึงออกมาจากผลลัพธ์ และวิธีการเลือกตัวอย่าง คำตอบนี้กล่าวถึงสามด้านตามลำดับ


ฉันจะอธิบายการทดสอบ t และการถดถอยโลจิสติกโดยใช้ภาษาที่สมมติว่าคุณกำลังศึกษาประชากรที่กำหนดไว้อย่างดีของผู้คนและต้องการทำการอนุมานจากกลุ่มตัวอย่างไปยังประชากรกลุ่มนี้

เพื่อสนับสนุนการอนุมานทางสถิติใด ๆ เราต้องถือว่าตัวอย่างนั้นสุ่ม

  • t-testถือว่าผู้คนในกลุ่มตัวอย่างที่ตอบว่า "ไม่" เป็นกลุ่มตัวอย่างแบบง่าย ๆ ของกลุ่มที่ไม่ตอบแบบสอบถามทั้งหมดในกลุ่มประชากรและกลุ่มคนในกลุ่มตัวอย่างที่ตอบว่า "ใช่" นั้นเป็นกลุ่มตัวอย่างกลุ่มที่ตอบกลับแบบสุ่มทั้งหมดใน ประชากร.

    t-test สร้างข้อสมมติฐานทางเทคนิคเพิ่มเติมเกี่ยวกับการแจกแจงของอายุในแต่ละกลุ่มในประชากร มีการทดสอบแบบทดสอบหลายรุ่นเพื่อรองรับความเป็นไปได้ที่จะเกิดขึ้น

  • การถดถอยแบบลอจิสติกถือว่าคนทุกวัยที่ได้รับนั้นเป็นกลุ่มตัวอย่างแบบง่าย ๆ ของคนในวัยนั้นในประชากร กลุ่มอายุที่แยกต่างหากอาจแสดงอัตราตอบกลับที่แตกต่างกันว่า "ใช่" อัตราเหล่านี้เมื่อแสดงเป็นอัตราต่อรอง (แทนที่จะเป็นสัดส่วนตรง) จะถือว่าสัมพันธ์เชิงเส้นตรงกับอายุ (หรือด้วยฟังก์ชันที่กำหนดอายุ)

    การถดถอยแบบโลจิสติกส์สามารถขยายได้อย่างง่ายดายเพื่อรองรับความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างอายุและการตอบสนอง ส่วนขยายดังกล่าวสามารถใช้ในการประเมินความน่าเชื่อถือของสมมติฐานเชิงเส้นเริ่มต้น มันสามารถใช้กับชุดข้อมูลขนาดใหญ่ซึ่งมีรายละเอียดเพียงพอที่จะแสดงแบบไม่เป็นเชิงเส้น แต่ไม่น่าจะใช้กับชุดข้อมูลขนาดเล็กได้มากนัก กฎทั่วไปของหัวแม่มือ - แบบจำลองการถดถอยควรมีการสังเกตเป็นจำนวนสิบเท่าของพารามิเตอร์ - ชี้ให้เห็นว่าจำเป็นต้องมีการสังเกตมากกว่า 20 ครั้งเพื่อตรวจสอบความไม่เชิงเส้น (ซึ่งต้องการพารามิเตอร์ที่สามนอกเหนือจากการสกัดกั้นและความชันของฟังก์ชันเชิงเส้น )

t-test ตรวจพบว่าอายุเฉลี่ยแตกต่างกันระหว่างผู้ตอบที่ไม่ใช่และใช่ในประชากร การถดถอยแบบลอจิสติกประมาณว่าอัตราการตอบสนองแปรผันตามอายุอย่างไร ดังนั้นจึงมีความยืดหยุ่นและสามารถให้ข้อมูลรายละเอียดมากกว่าการทดสอบ t ในทางตรงกันข้ามมันมีแนวโน้มที่จะมีพลังน้อยกว่า t-test สำหรับจุดประสงค์พื้นฐานของการตรวจจับความแตกต่างระหว่างอายุเฉลี่ยในกลุ่ม

เป็นไปได้ที่คู่การทดสอบจะแสดงชุดค่าผสมที่มีนัยสำคัญและไม่มีนัยสำคัญทั้งสี่ชุด สองสิ่งนี้เป็นปัญหา:

  • การทดสอบ t ไม่มีนัยสำคัญ แต่การถดถอยโลจิสติกคือ เมื่อสมมติฐานของการทดสอบทั้งสองมีความน่าเชื่อถือผลลัพธ์ดังกล่าวเป็นไปไม่ได้ในทางปฏิบัติเพราะการทดสอบ t ไม่ได้พยายามที่จะตรวจสอบความสัมพันธ์ที่เฉพาะเจาะจงดังที่ระบุไว้โดยการถดถอยโลจิสติก อย่างไรก็ตามเมื่อความสัมพันธ์นั้นไม่เชิงเส้นเพียงพอที่จะทำให้วิชาที่เก่าแก่ที่สุดและอายุน้อยที่สุดที่จะแบ่งปันความคิดเห็นหนึ่งและวิชาวัยกลางคนอื่นจากนั้นการขยายของการถดถอยโลจิสติกไปสู่ความสัมพันธ์ที่ไม่เชิงเส้นสามารถตรวจจับและ .

  • การทดสอบ t มีความสำคัญ แต่การถดถอยโลจิสติกไม่ได้เป็นอย่างที่เป็นในคำถาม สิ่งนี้มักจะเกิดขึ้นโดยเฉพาะเมื่อมีกลุ่มผู้ตอบที่อายุน้อยกว่ากลุ่มผู้ตอบที่มีอายุมากกว่าและไม่กี่คน สิ่งนี้อาจสร้างความแตกต่างอย่างมากระหว่างอัตราการตอบกลับของผู้ตอบแบบไม่ตอบและใช่ มันถูกตรวจพบได้อย่างง่ายดายโดยการทดสอบ t อย่างไรก็ตามการถดถอยโลจิสติกจะมีข้อมูลรายละเอียดค่อนข้างน้อยเกี่ยวกับวิธีการที่อัตราการตอบสนองเปลี่ยนแปลงไปตามอายุหรืออื่น ๆ ซึ่งจะมีข้อมูลที่ไม่สามารถสรุปได้: กรณีของ "การแยกแบบสมบูรณ์" ซึ่งผู้สูงอายุทุกคนตอบสนองทางเดียว แต่ในกรณีนั้นการทดสอบทั้งสองมักจะมีค่า p ต่ำมาก

โปรดทราบว่าการออกแบบการทดลองสามารถทำให้สมมติฐานการทดสอบบางอย่างใช้ไม่ได้ ตัวอย่างเช่นหากคุณเลือกคนตามอายุของพวกเขาในการออกแบบแบ่งชั้นแล้วสมมติฐานของ t-test (ที่แต่ละกลุ่มสะท้อนให้เห็นถึงกลุ่มตัวอย่างแบบสุ่มง่าย ๆ อายุ) จะกลายเป็นที่น่าสงสัย การออกแบบนี้จะแนะนำให้ใช้การถดถอยโลจิสติก หากคุณมีสองกลุ่มผู้ตอบแบบไม่ตอบโต้และผู้ตอบแบบตอบรับหนึ่งรายและเลือกแบบสุ่มจากผู้ที่ยืนยันอายุของพวกเขาจากนั้นสมมติฐานการสุ่มตัวอย่างของการถดถอยแบบโลจิสติกส์นั้นน่าสงสัยในขณะที่การทดสอบแบบทดสอบ การออกแบบนั้นจะแนะนำให้ใช้รูปแบบของการทดสอบ t

(การออกแบบที่สองอาจดูโง่ที่นี่ แต่ในกรณีที่ "อายุ" ถูกแทนที่ด้วยลักษณะบางอย่างที่ยากราคาแพงหรือใช้เวลานานในการวัดมันน่าดึงดูด)


ความกังวลที่ไม่ใช่เชิงเส้นและการแยกส่วนใหญ่จะไม่ได้รับการบรรเทาโดยใช้เส้นโค้งบนตัวแปรอายุหรือไม่? ในเรื่องนั้นขอโทษ แต่ฉันไม่สามารถเห็นได้ว่าทำไมการออกแบบ "รวม" จะทำให้ผลการวิจัยของการถดถอยโลจิสติก แน่นอนว่าสมมติฐานของกลุ่มตัวอย่างแบบสุ่มหายไป แต่เราสนใจหรือไม่ที่เราเลือกแบบนี้ คุณมีอคติในการเลือกหรือไม่? (การออกแบบที่คุณอธิบายดูเหมือนจะเป็นกรณีศึกษาการควบคุมให้ฉัน แต่ฉันอาจผิด ... ) (+1 ชัด)
us11r11852 พูดว่า Reinstate Monic

@ usεr11852ขอบคุณสำหรับความคิดเห็นที่รอบคอบ ฉันได้เขียนข้อความใหม่เพื่ออธิบายประเด็นที่คุณนำเสนอ แม้ว่าการแบ่งอายุสามารถรับมือกับความไม่เชิงเส้นในการถดถอยโลจิสติก แต่ก็สามารถเพิ่มความเป็นไปได้ของการแยกอย่างสมบูรณ์ ฉันไม่แน่ใจว่าคุณหมายถึงอะไรด้วย "การออกแบบแบบรวม" แต่ฉันจะสงสัยในความพยายามที่จะตีความค่า p ของการถดถอยโลจิสติกซึ่งรูปแบบความน่าจะเป็นไม่สามารถพิสูจน์ได้ (ซึ่งเป็นสิ่งที่สุ่มตัวอย่าง
whuber

ขอบคุณสำหรับสิ่งเหล่านี้ ใช่ฉันซาบซึ้งถึงจุดที่คุณแยกจากกันอย่างสมบูรณ์ (เอฟเฟกต์ Hauck-Donner) ฉันไม่ได้พิจารณาพวกเขา ตกลงฉันเห็นสิ่งที่คุณหมายถึงตอนนี้ที่เกี่ยวกับสองกลุ่มในขณะนี้ ในกรณีนี้เราจะมีแนวคิดการศึกษาแบบสังเกตการณ์ที่ตกลงกันไว้ (เราสังเกต / กำหนดสองกลุ่ม) ดังนั้นเราควรหาวิธีควบคุม (คะแนนความชอบ ฯลฯ )
usεr11852พูดว่า Reinstate Monic

5

เสื้อXY

X|Y=ผม~ยังไม่มีข้อความ(μผม,σ2).
Y~Bernoulli(พี)YX=x
P(Y=1|X=x)=X|Y=1(x)P(Y=1)Σผม=01X|Y=ผม(x)P(Y=ผม)=พีอี-12σ2(x-μ1)2พีอี-12σ2(x-μ1)2+(1-พี)อี-12σ2(x-μ0)2=11+1-พีพีอี-12σ2(x-μ0)2+12σ2(x-μ1)2=logit-1(β0+β1x)
β0=LNพี1-พี-12σ2(μ12-μ02)β1=1σ2(μ1-μ0).

ดังนั้นในแง่นี้ทั้งสองแบบมีเงื่อนไขเข้ากันได้


3

แบบทดสอบที่ดีกว่าคือแบบทดสอบที่ตอบคำถามของคุณได้ดีกว่า ใบหน้าของทั้งคู่ก็ไม่ดีขึ้น ความแตกต่างที่นี่เทียบเท่ากับที่พบเมื่อทำการถดถอย y กับ x และ x บน y และสาเหตุของผลลัพธ์ที่ต่างกันนั้นคล้ายคลึงกัน ความแปรปรวนที่ถูกประเมินขึ้นอยู่กับว่าตัวแปรใดที่กำลังถูกใช้เป็นตัวแปรตอบกลับในโมเดล

คำถามการวิจัยของคุณคลุมเครือมาก บางทีถ้าคุณพิจารณาทิศทางของเวรกรรมคุณสามารถสรุปได้ว่าคุณต้องการใช้การวิเคราะห์แบบใด อายุทำให้ผู้คนตอบกลับว่า "ใช่" หรือกำลังตอบกลับว่า "ใช่" ทำให้คนแก่ขึ้นหรือไม่ เป็นไปได้มากกว่าที่อดีตซึ่งในกรณีนี้ความแปรปรวนของความน่าจะเป็นของ "ใช่" คือสิ่งที่คุณต้องการสร้างแบบจำลองดังนั้นการถดถอยโลจิสติกจึงเป็นตัวเลือกที่ดีที่สุด

ที่กล่าวว่าคุณควรตรวจสอบสมมติฐานของการทดสอบ สามารถพบได้ทั่วไปที่วิกิพีเดียหรือในหนังสือเรียน อาจเป็นไปได้ว่าคุณมีเหตุผลที่ดีที่จะไม่ทำการถดถอยโลจิสติกและเมื่อเกิดเหตุการณ์เช่นนี้คุณอาจต้องถามคำถามอื่น


1
คุณหมายถึง "ไม่ทำการถดถอยโลจิสติก" หรือไม่?
mark999
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.