วิธีการทดสอบว่ากลุ่มย่อยหมายถึงแตกต่างจากกลุ่มโดยรวมที่มีกลุ่มย่อยหรือไม่


9

ฉันจะทดสอบได้อย่างไรว่าค่าเฉลี่ย (เช่นความดันโลหิต) ของกลุ่มย่อย (เช่นผู้ที่เสียชีวิต) แตกต่างจากกลุ่มทั้งหมด (เช่นทุกคนที่เป็นโรครวมถึงผู้ที่เสียชีวิต)?

เห็นได้ชัดว่ากลุ่มแรกเป็นกลุ่มย่อยของกลุ่มที่สอง

ฉันควรใช้การทดสอบสมมติฐานแบบใด


คุณกำลังทดสอบความแตกต่างของวิธีการ?
แมโคร

คำตอบ:


9

ไมเคิลตั้งข้อสังเกตเมื่อเปรียบเทียบกลุ่มย่อยกับกลุ่มโดยรวมนักวิจัยมักเปรียบเทียบกลุ่มย่อยกับกลุ่มย่อยของกลุ่มโดยรวมที่ไม่รวมกลุ่มย่อย

คิดแบบนี้

ถ้า p เป็นสัดส่วนที่เสียชีวิตและ 1p เป็นสัดส่วนที่ไม่ตายและ

X¯.=pX¯d+(1p)X¯a

โดยที่เป็นค่าเฉลี่ยโดยรวมเป็นค่าเฉลี่ยของผู้ที่เสียชีวิตและเป็นค่าเฉลี่ยของผู้ที่ยังมีชีวิตอยู่ แล้วก็X¯.X¯dX¯a

X¯dX¯a
ถ้าหากเมื่อใด

X¯dX¯.

สมมติว่า{a}} ดังนั้น{d}}Xd¯Xa¯X.¯pXd¯+(1p)Xd¯=Xd¯

สมมติว่าX.¯Xd¯{d}} ด้วยเหตุนี้ Xd¯pXd¯+(1p)Xa¯จากนั้น (1p)Xd¯(1p)Xa¯ และตั้งแต่ (1p)0จากนั้น Xd¯Xa¯.

สิ่งเดียวกันสามารถทำเพื่อความไม่เท่าเทียมกัน

ดังนั้นนักวิจัยมักทดสอบความแตกต่างระหว่างกลุ่มย่อยและกลุ่มย่อยของกลุ่มโดยรวมที่ไม่รวมกลุ่มย่อย นี่เป็นผลของการแสดงว่ากลุ่มย่อยแตกต่างจากกลุ่มโดยรวม นอกจากนี้ยังช่วยให้คุณใช้วิธีการทั่วไปเช่นการทดสอบกลุ่มอิสระ


1
Re: "คุณควรเปรียบเทียบกลุ่มย่อยกับกลุ่มย่อยของกลุ่มโดยรวมที่ไม่รวมกลุ่มย่อย" - ใช่นี่เป็นวิธีที่จะทำ แต่จะถามคำถามที่แตกต่างกันเล็กน้อย - มันทดสอบคำถามที่ตายแล้วและไม่ตายเมื่อมัน ดูเหมือนว่า OP ต้องการทดสอบความแตกต่างระหว่างคนตายและคนที่ไม่ทราบสถานะการตายดังนั้นฉันไม่แน่ใจว่าควรเป็นคำที่ถูกต้อง คุณสามารถทดสอบความแตกต่างในค่าเฉลี่ยระหว่างเซ็ตย่อยและกลุ่มโดยรวมตราบใดที่คุณอธิบายความแปรปรวนร่วมระหว่างX¯d และ X¯.ในการคำนวณข้อผิดพลาดมาตรฐานของคุณ
มาโคร

@ แมโครดีจุด ขอบคุณ ฉันเปลี่ยนถ้อยคำเล็กน้อยเป็น "นักวิจัยโดยทั่วไป ... "
Jeromy Anglim

@Marco ขอบคุณสำหรับความคิดเห็น แต่ความแปรปรวนร่วมของวิธีคำนวณX¯d และ X¯ของกลุ่มที่ไม่ได้จับคู่กัน (กลุ่มย่อยและกลุ่ม)?
Giordano

@JeromyAnglim ฉันไม่คิดว่าคุณต้องการ "ปกติ" หากเราเขียนสิ่งที่คุณเขียนในรูปแบบประชากร (mu's แทน x-bar เช่น) และตรวจสอบสมมติฐานว่างและทางเลือกโดยอาร์กิวเมนต์เดียวกับที่คุณทำการทดสอบว่า mu นั้นแตกต่างจาก mu_d จะเหมือนกับการทดสอบ mu_a นั้นแตกต่างจาก mu_d ดังนั้นการทำแบบทดสอบสองตัวอย่างจึงถูกต้องเสมอ ดังนั้นโดยทั่วไปแล้วฉันจะบอกว่า "มันเทียบเท่ากับการทดสอบนี้กับการทดสอบสองตัวอย่าง"
Richard DiSalvo

2

วิธีทดสอบที่นี่คือการเปรียบเทียบผู้ที่มีโรคและเสียชีวิตกับผู้ที่มีโรคและไม่ตาย คุณสามารถใช้การทดสอบตัวอย่าง t สองครั้งหรือการทดสอบผลรวมลำดับของ Wilcoxon หากไม่สามารถสันนิษฐานได้


คุณเจาะจงมากขึ้นได้ไหม ตัวอย่างการทดสอบ t สองชนิดใด การทดสอบ t ที่ไม่มีการจับคู่? ฉันคิดว่าสำหรับการทดสอบ t คุณถือว่าเป็นอิสระและเป็นเรื่องปกติ
user1061210

1
เมื่อกลุ่มแยกจากกันตามที่เราแนะนำกลุ่มตัวอย่างจะเป็นอิสระ การทดสอบ t จะไม่ถูกจับคู่เนื่องจากกลุ่มย่อยไม่จำเป็นต้องเท่ากันและไม่มีวิธีที่เป็นธรรมชาติในการจับคู่ตัวอย่างแม้ว่าขนาดตัวอย่างจะเท่ากัน ฉันพูดถึงการทดสอบ Wilcoxon เพราะการคาดคะเนความปกติอาจไม่ถูกต้องและการทดสอบ Wilcoxon ไม่ต้องการความปกติ
Michael R. Chernick

0

สิ่งที่คุณต้องทำคือการทดสอบสัดส่วนประชากร (ขนาดตัวอย่างขนาดใหญ่) สถิติที่เกี่ยวข้องกับสัดส่วนประชากรมักจะมีขนาดตัวอย่างที่มีขนาดใหญ่ (n => 30) ดังนั้นการแจกแจงการประมาณปกติและสถิติที่เกี่ยวข้องจะถูกนำมาใช้เพื่อตรวจสอบการทดสอบว่าสัดส่วนตัวอย่าง (ความดันโลหิตของผู้ที่เสียชีวิต) = สัดส่วนประชากร ผู้ที่เป็นโรครวมถึงผู้ที่เสียชีวิต)

นั่นคือเมื่อขนาดตัวอย่างมากกว่าหรือเท่ากับ 30 เราสามารถใช้สถิติคะแนน z เพื่อเปรียบเทียบสัดส่วนตัวอย่างกับสัดส่วนประชากรโดยใช้ค่าของค่าเบี่ยงเบนมาตรฐานตัวอย่าง p-hat เพื่อประมาณค่าเบี่ยงเบนมาตรฐานตัวอย่าง p ถ้ามันไม่เป็นที่รู้จัก

การแจกแจงตัวอย่างของ P (สัดส่วน) เป็นปกติโดยประมาณด้วยค่าเฉลี่ยหรือค่าคาดหวัง E (P) = p-hat และข้อผิดพลาดมาตรฐาน sigma (r) = sqrt (p * q / n)

ต่อไปนี้เป็นคำถามทดสอบสมมุติฐานที่อาจถามเมื่อเปรียบเทียบสองสัดส่วน:

  1. (การทดสอบแบบสองด้าน)

H0: p-hat = p กับ H1: p-hat ไม่เท่ากับ p

  1. (การทดสอบด้านขวา)

H0: p-hat = p กับ H1: p-hat> p

  1. (การทดสอบด้านซ้าย)

H0: p-hat = p กับ H1: p-hat <p

สถิติที่ใช้ทดสอบขนาดตัวอย่างขนาดใหญ่ ได้แก่

สถิติการทดสอบเกี่ยวข้องกับการแจกแจงแบบปกติมาตรฐาน:

สถิติ z-score สำหรับสัดส่วน

P-หมวก P / sqrt (PQ / n)

โดยที่ p = การประมาณสัดส่วน q = 1-p และเป็นสัดส่วนประชากร

สัดส่วนเฉลี่ยคือ:

np / n = p-hat = x / n

ส่วนเบี่ยงเบนมาตรฐาน:

= sqrt (npq / n) = sqrt (pq / n)

กฎการตัดสินใจ:

การทดสอบแบบเทลด์ (): (H0: P-hat> = P)

ยอมรับ H0 ถ้า Z <= Z (1-alpha)

ปฏิเสธ H0 ถ้า Z> Z (1-alpha)

ทดสอบปลายหาง (ฮา: P-hat <= P):

ยอมรับ H0 ถ้า Z> = Z (1-alpha)

ปฏิเสธ H0 ถ้า Z

การทดสอบแบบสองทาง (ฮา: P-hat ไม่เท่ากับ P):

ยอมรับ H0 ถ้า Z (อัลฟ่า / 2) <= Z <= Z (1-alpha / 2)

ปฏิเสธ H0 ถ้า Z <Z (อัลฟ่า / 2) หรือถ้า Z> Z (1-alpha / 2)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.