วิธีทดสอบค่ามัธยฐานของประชากรได้อย่างไร


9

ฉันมีตัวอย่าง 250 หน่วย การกระจายไม่สมมาตร ฉันต้องการทดสอบสมมุติฐานว่าค่ามัธยฐานของประชากรแตกต่างจาก 3.5 ดังนั้นฉันคิดว่าการทดสอบตัวอย่างหนึ่งรายการจะเหมาะสม ฉันรู้ว่าการทดสอบยศวิลคอกซันนั้นไม่เหมาะสมเพราะการแจกแจงนั้นไม่สมมาตร การทดสอบเครื่องหมายเหมาะสมที่จะใช้หรือไม่? หากไม่มีใครสามารถแนะนำการทดสอบอื่น ๆ ได้?


3
คุณสูญเสียฉันไปที่บรรทัดแรกด้วยเหตุผลหลายประการ (1) ตัวอย่างไม่สามารถมีการแจกแจงแบบเกาส์ (แต่มันสามารถมีได้ประมาณหนึ่งตัว) (2) ลักษณะหนึ่งของทั้งหมดกระจายเสียน (และของใกล้เคียงกับพวกเขา) เป็นสมมาตร คุณขัดแย้งกับตัวเอง โดยการอธิบายข้อมูลของคุณในแง่ของตัวเองแทนที่จะเป็นศัพท์แสงทางสถิติคุณจะสื่อสารสิ่งที่คุณมีได้ดีขึ้น คุณสามารถอธิบายได้อย่างชัดเจนที่สุดเท่าที่จะเป็นไปได้ว่าคุณต้องการทำอะไรกับข้อมูลของคุณ? ข้อมูลประเภทใดคือ "การทดสอบตัวอย่างจากค่ามัธยฐาน" ที่มีไว้เพื่อให้คุณ
whuber

1
ค่ามัธยฐานของตัวอย่างคืออะไรก็ตาม ไม่จำเป็นต้องทดสอบสิ่งนั้น คุณอาจต้องการทดสอบว่าค่ามัธยฐานของประชากร (จากตัวอย่างที่ได้รับ) เท่ากับหรือไม่ ถ้าเป็นเช่นนั้นสิ่งสำคัญคือต้องรู้ว่าค่าได้รับการพัฒนาอย่างไร มันเป็นบทสรุปของชุดข้อมูลอื่น ๆ หรือเปล่า? หรือเป็นจำนวนที่กำหนดไว้ล่วงหน้าเช่นมาตรฐานคุณภาพหรือไม่ 3.53.5
whuber

1
เป็นตัวเลขที่กำหนดไว้ล่วงหน้า
LeonRupnik

2
"การกระจายตัวไม่สมมาตรดังนั้นฉันต้องการทดสอบสมมติฐานว่าค่ามัธยฐานของประชากรแตกต่างจาก 3.5 ... " - ทำไมความไม่สมดุลของตัวอย่างจึงส่งผลกระทบต่อสมมติฐานที่น่าสนใจ? " การทดสอบเครื่องหมายเหมาะสมที่จะใช้หรือไม่ " - แน่นอน แต่ (อย่างน้อยในรูปแบบดั้งเดิม) จะต้องอาศัยความต่อเนื่อง - คุณต้องปรับเปลี่ยนหากตัวแปรของคุณไม่ต่อเนื่อง (คุณไม่ได้บอกว่าข้อมูลของคุณประกอบด้วยอะไร ของ).
Glen_b -Reinstate Monica

ข้อมูลมีความต่อเนื่อง
LeonRupnik

คำตอบ:


8

สรุป

จำนวนของข้อมูลเกินมีการกระจายทวินามที่มีความน่าจะเป็นที่ไม่รู้จักหน้าใช้นี้เพื่อดำเนินการทดสอบทวินามของกับทางเลือก1/23.5pp=1/2p1/2

ส่วนที่เหลือของโพสต์นี้จะอธิบายรูปแบบพื้นฐานและแสดงวิธีการคำนวณ มันมีRรหัสการทำงานเพื่อดำเนินการพวกเขาออก บัญชีที่กว้างขวางของทฤษฎีการทดสอบสมมติฐานที่ให้ไว้ในคำตอบของฉัน "ความหมายของค่า p และค่า t ในการทดสอบทางสถิติคืออะไร? .

แบบจำลองทางสถิติ

สมมติว่าค่ามีความหลากหลายพอสมควร (มีความสัมพันธ์ไม่กี่ตัวที่ ) จากนั้นภายใต้สมมติฐานว่างของคุณค่าสุ่มใด ๆ ที่สุ่มมีโอกาสมากกว่า (ตั้งแต่มีลักษณะเป็นค่ากลางของประชากร) . สมมติทั้งหมดค่าสุ่มและเป็นอิสระตัวอย่างจำนวนของพวกเขาเกินจึงจะมีทวินามการจัดจำหน่าย ขอให้เราโทรไปยังหมายเลขนี้ "นับ" k3.51/2=50%3.53.52503.5(250,1/2)k

ในทางตรงกันข้ามถ้าแตกต่างจากประชากรเฉลี่ยโอกาสของค่าสุ่มเกินจะแตกต่างจาก1/2นี่คือสมมติฐานทางเลือก3.53.51/2

การค้นหาแบบทดสอบที่เหมาะสม

วิธีที่ดีที่สุดในการแยกแยะสถานการณ์ว่างเปล่าจากทางเลือกคือดูค่าที่มีแนวโน้มมากที่สุดภายใต้ null และมีโอกาสน้อยกว่าภายใต้ทางเลือก เหล่านี้เป็นค่าที่อยู่ใกล้ของเท่ากับ125ดังนั้นภูมิภาคที่สำคัญสำหรับการทดสอบของคุณประกอบด้วยค่าค่อนข้างห่างไกลจาก : ใกล้กับหรือใกล้เคียงกับ250แต่ไกลจากพวกเขาจะต้องเป็นหลักฐานสำคัญว่าไม่ใช่ประชากรเฉลี่ย?k1/225012512502501253.5

ในขึ้นอยู่กับมาตรฐานของคุณมีความสำคัญ:นี้เรียกว่าขนาดการทดสอบมักจะเรียกว่า\ภายใต้สมมติฐานว่างควรมี - แต่ไม่เกิน - และมีโอกาสที่จะอยู่ในพื้นที่วิกฤติααk

ตามปกติแล้วเมื่อเราไม่มีอคติใด ๆ เกี่ยวกับตัวเลือกที่จะนำไปใช้ - ค่ามัธยฐานมากกว่าหรือน้อยกว่า - เราพยายามสร้างพื้นที่วิกฤตเพื่อให้มีโอกาสครึ่งหนึ่ง ,นั้นต่ำและ อีกครึ่ง ,นั้นสูง เนื่องจากเรารู้ว่าการกระจายตัวของภายใต้สมมติฐานว่างข้อมูลนี้เพียงพอที่จะกำหนดภูมิภาคที่สำคัญ3.5α/2kα/2kk

ในทางเทคนิคมีวิธีการทั่วไปสองวิธีในการคำนวณ: คำนวณความน่าจะเป็นแบบทวินามหรือประมาณพวกมันด้วยการแจกแจงแบบปกติ

การคำนวณด้วยความน่าจะเป็นทวินาม

ใช้ฟังก์ชันเปอร์เซ็นต์จุด (ควอนไทด์) ในRตัวอย่างนี้เรียกว่าqbinomและจะถูกเรียกเช่น

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

ผลลัพธ์สำหรับคือα=0.05

109 141

มันหมายความว่าพื้นที่ที่สำคัญประกอบด้วยค่าต่ำทั้งหมดของระหว่าง (และรวม)และร่วมกับทุกค่าสูงของระหว่าง (และรวม)และ250เพื่อเป็นการตรวจสอบเราสามารถขอให้คำนวณโอกาสที่อยู่ในภูมิภาคนั้นเมื่อค่า Null เป็นจริง:k0109k141250Rk

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

เอาท์พุทเป็นมากใกล้กับ - แต่ไม่มากขึ้น than--ตัวเอง เนื่องจากพื้นที่วิกฤตต้องสิ้นสุดที่จำนวนเต็มจึงไม่สามารถทำการทดสอบขนาดจริงนี้ได้เท่ากับขนาดการทดสอบเล็กน้อยแต่ในกรณีนี้ค่าทั้งสองจะใกล้เคียงกันมาก0.0497αα

การคำนวณด้วยการประมาณปกติ

ค่าเฉลี่ยของการแจกแจงแบบทวินามคือและความแปรปรวนคือทำให้ส่วนเบี่ยงเบนมาตรฐาน เท่ากับ7.9 เราจะแทนที่การแจกแจงแบบทวินามด้วยการแจกแจงแบบปกติ การแจกแจงแบบปกติมาตรฐานมีของความน่าจะเป็นน้อยกว่าซึ่งคำนวณโดยคำสั่ง(250,1/2)250×1/2=125250×1/2×(11/2)=250/4250/47.9α/2=0.05/21.95996R

qnorm(alpha/2)

เพราะการแจกแจงปกติสมมาตรก็ยังมีของความน่าจะเป็นมากขึ้นกว่า1.95996ดังนั้นภูมิภาคที่สำคัญประกอบด้วยค่าที่มีมากขึ้นกว่าค่าเบี่ยงเบนมาตรฐานห่างจาก125คำนวณเกณฑ์เหล่านี้พวกเขาเท่ากับ140.5 การคำนวณสามารถทำได้ในหนึ่งโฉบเช่น0.05/2+1.95996k1.95996125125±7.9×1.96109.5,140.5

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

เนื่องจากต้องเป็นจำนวนเต็มเราจึงเห็นว่ามันจะตกอยู่ในภูมิภาควิกฤติเมื่อเป็นหรือน้อยกว่าหรือหรือมากกว่า คำตอบนี้เหมือนกับคำตอบที่ได้จากการคำนวณแบบทวินาม นี่เป็นกรณีปกติเมื่อใกล้มากกว่าหรือขนาดตัวอย่างอยู่ในระดับปานกลางถึงมาก (หลายสิบหรือมากกว่า) และไม่เล็กมาก (ไม่กี่เปอร์เซ็นต์)k109141p1/201α


การทดสอบนี้เนื่องจากไม่มีข้อสันนิษฐานเกี่ยวกับประชากร (ยกเว้นว่ามีความน่าจะเป็นไม่มากนักที่มุ่งเน้นที่ค่ามัธยฐานของมัน) จึงไม่มีประสิทธิภาพเท่ากับการทดสอบอื่น ๆ ที่มีสมมติฐานเฉพาะเกี่ยวกับประชากร หากการทดสอบยังคงปฏิเสธโมฆะก็ไม่จำเป็นต้องกังวลเกี่ยวกับการขาดพลังงาน มิฉะนั้นคุณต้องทำการแลกเปลี่ยนที่ละเอียดอ่อนบางอย่างระหว่างสิ่งที่คุณยินดีที่จะคิดและสิ่งที่คุณสามารถสรุปเกี่ยวกับประชากร


2
เนื่องจากนี่เป็นตัวอย่างการทำงานของคำตอบ" ความหมายของ p-value " ที่เป็นนามธรรมมากกว่าของคุณไม่เพียง แต่ในการสร้างปรัชญาเดียวกัน แต่ในแบบที่คำตอบของคุณมีโครงสร้างฉันคิดว่าคุณควรจะเชื่อมโยงมัน ("ตัวอย่างของ วิธีนี้สามารถนำไปใช้ในทางปฏิบัติได้ในคำตอบของฉันต่อ ... ") ในบทสรุปของคำตอบของคุณที่นั่น
Silverfish

2
@Silver ขอบคุณ; ที่ได้ใจของฉันแน่นอน ฉันคิดว่าฉันอาจจะรอสักครู่ก่อน เหนือสิ่งอื่นใดฉันจะไม่แปลกใจหากสมาชิกชุมชนที่กล้าได้กล้าเสียบางคนขุดหัวข้อซ้ำซ้อนซึ่งฉันต้องการตรวจสอบอย่างละเอียดมากขึ้น ท้ายที่สุดนี่เป็นเนื้อหาพื้นฐาน - มีคำถามมากมายที่ถามเกี่ยวกับการทดสอบทวินาม สิ่งเดียวที่อ้างว่าสิ่งนี้จะต้องเป็นเรื่องใหม่คือมันมาถึงที่นี่เพื่อต้องการการทดสอบของค่ามัธยฐาน - ดังนั้นจึงไม่เห็นได้ชัดว่าเป็นการทดสอบแบบทวินามตอนแรก - และสิ่งเดียวที่อ้างว่าคำตอบของฉันต้องมีค่า การอ่านอยู่ในความพยายามที่จะอธิบายทุกขั้นตอน
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.