วิธีเปรียบเทียบค่าเฉลี่ยของสองตัวอย่างที่มีข้อมูลตรงกับการแจกแจงแบบเอ็กซ์โพเนนเชียล


10

ฉันมีสองตัวอย่างของข้อมูลตัวอย่างพื้นฐานและตัวอย่างการรักษา

สมมติฐานคือตัวอย่างการรักษามีค่าเฉลี่ยสูงกว่าตัวอย่างพื้นฐาน

ตัวอย่างทั้งสองมีรูปแบบเลขชี้กำลัง เนื่องจากข้อมูลมีขนาดค่อนข้างใหญ่ฉันจึงมีเพียงค่าเฉลี่ยและจำนวนองค์ประกอบสำหรับแต่ละตัวอย่าง ณ เวลาที่ฉันจะทำการทดสอบ

ฉันจะทดสอบสมมติฐานนั้นได้อย่างไร ฉันเดาว่ามันง่ายสุด ๆ และฉันได้พบการอ้างอิงหลายอย่างเกี่ยวกับการใช้การทดสอบ F แต่ฉันไม่แน่ใจว่าพารามิเตอร์แมป


2
ทำไมคุณไม่มีข้อมูล หากตัวอย่างเป็นการทดสอบที่ไม่ใช่พารามิเตอร์ขนาดใหญ่จริง ๆ ควรใช้งานได้ดี แต่ดูเหมือนว่าคุณกำลังพยายามทำการทดสอบจากสถิติสรุป นั่นถูกต้องใช่ไหม?
Mimshot

พื้นฐานและค่ารักษาจากผู้ป่วยรายเดียวกันหรือทั้งสองกลุ่มมีความเป็นอิสระหรือไม่?
Michael M

1
@Mimshot ข้อมูลกำลังส่งกระแสข้อมูล แต่คุณถูกต้องว่าฉันพยายามเรียกใช้การทดสอบจากสถิติสรุป มันทำงานได้ค่อนข้างดีกับการทดสอบ Z สำหรับข้อมูลปกติ
Jonathan Dobbie

1
ภายใต้สถานการณ์เหล่านี้การทดสอบ z ประมาณอาจเป็นสิ่งที่ดีที่สุดที่คุณสามารถทำได้ อย่างไรก็ตามฉันจะสนใจมากขึ้นว่าผลการรักษาที่แท้จริงนั้นมีขนาดใหญ่แค่ไหน โปรดจำไว้ว่าด้วยตัวอย่างที่มีขนาดใหญ่พอผลกระทบที่แท้จริงเล็ก ๆ ใด ๆ จะนำไปสู่ค่า p น้อย
Michael M

1
@january - แม้ว่าขนาดตัวอย่างของเขาจะใหญ่เพียงพอโดย CLT พวกเขาจะใกล้เคียงกับการแจกแจงแบบปกติมาก ภายใต้สมมติฐานว่างค่าความแปรปรวนจะเท่ากัน (ตามค่าเฉลี่ย) ดังนั้นด้วยขนาดตัวอย่างที่มีขนาดใหญ่พอการทดสอบ t ควรทำงานได้ดี มันจะไม่ดีเท่าที่คุณสามารถทำได้กับข้อมูลทั้งหมด แต่ก็ยังคงตกลง n1=n2=100ตัวอย่างเช่นน่าจะดีทีเดียว
jbowman

คำตอบ:


14

คุณสามารถทดสอบความเท่าเทียมกันของพารามิเตอร์ค่าเฉลี่ยกับทางเลือกที่พารามิเตอร์ค่าเฉลี่ยไม่เท่ากันด้วยการทดสอบอัตราส่วนความน่าจะเป็น (LR test) (อย่างไรก็ตามหากพารามิเตอร์ค่าเฉลี่ยแตกต่างกันและการแจกแจงแบบเอ็กซ์โปเนนเชียลนี่เป็นการเลื่อนระดับไม่ใช่การเปลี่ยนตำแหน่ง)

สำหรับการทดสอบแบบด้านเดียว (แต่เฉพาะในกรณีแบบสองด้านแบบอะซิมโตโทรติก) ฉันเชื่อว่าการทดสอบ LR ออกมาเทียบเท่ากับสิ่งต่อไปนี้ (เพื่อแสดงว่านี่เป็นความจริงเหมือนกับการทดสอบ LR แบบทางเดียว กรณีที่หนึ่งจะต้องแสดงให้เห็นว่าตัวเลข LR เป็นแบบโมโนโทนใน ):x¯/y¯

สมมติว่าเรากำหนดพารามิเตอร์การสังเกตที่ในเลขชี้กำลังแรกว่ามี pdf 1 / μ x exp ( - x i / μ x )และการสังเกตj th ในตัวอย่างที่สองว่ามี pdf 1 / μ y exp ( - y j / μ y ) (เหนือโดเมนที่เห็นได้ชัดสำหรับการสังเกตและพารามิเตอร์) (เพื่อความชัดเจนเรากำลังทำงานในรูปแบบเฉลี่ยไม่ใช่แบบฟอร์มอัตราที่นี่สิ่งนี้จะไม่ส่งผลต่อผลลัพธ์ของการคำนวณ)i1/μxexp(xi/μx)j1/μyexp(yj/μy)

XiΓ(1,μx)XSxΓ(nx,μx)YSyΓ(ny,μy)

2/μxSxχ2nx2μyμxSx/nxSy/nyF2nx,2ny

x¯/y¯F2nx,2ny


การจำลองเพื่อตรวจสอบว่าเราไม่ได้ทำผิดพลาดง่ายๆในพีชคณิต:

XY

F

การแจกแจงตัวอย่างแบบจำลองของสถิติอัตราส่วนภายใต้ null


ตัวอย่างด้วยการอภิปรายการคำนวณค่า p แบบสองด้าน :

เพื่อแสดงการคำนวณนี่คือตัวอย่างเล็ก ๆ สองตัวอย่างจากการแจกแจงแบบเลขชี้กำลัง กลุ่มตัวอย่าง X มีการสังเกต 14 ครั้งจากประชากรที่มีค่าเฉลี่ย 10 ตัวอย่าง Y นั้นมี 17 ข้อสังเกตจากประชากรที่มีค่าเฉลี่ย 15:

x: 12.173  3.148 33.873  0.160  3.054 11.579 13.491  7.048 48.836 
   16.478  3.323  3.520  7.113  5.358

y:  7.635  1.508 29.987 13.636  8.709 13.132 12.141  5.280 23.447 
   18.687 13.055 47.747  0.334  7.745 26.287 34.390  9.596

ค่าเฉลี่ยตัวอย่างคือ 12.082 และ 16.077 ตามลำดับ อัตราส่วนของค่าเฉลี่ยคือ 0.7515

พื้นที่ทางด้านซ้ายตรงไปตรงมาเนื่องจากอยู่ในส่วนท้าย (calc in R):

 > pf(r,28,34) 
 [1] 0.2210767

เราต้องการความน่าจะเป็นสำหรับหางอีกอัน หากการกระจายตัวเป็นแบบสมมาตรในการกลับกันมันจะตรงไปตรงมาที่จะทำเช่นนี้

การประชุมร่วมกับอัตราส่วนของความแปรปรวน F-test (ซึ่งคล้ายกันสองหาง) คือการเพิ่มค่า p-tailed สองเท่า (อย่างมีประสิทธิภาพสิ่งที่เกิดขึ้นที่นี่เช่นกันนั่นคือสิ่งที่ดูเหมือนจะทำใน R เช่น ); ในกรณีนี้มันให้ค่า p-0.44

α/2α


ฉันเดาว่านี่เป็นเพียงฉันหนา แต่ 0.7515 มาจากไหน
Jonathan Dobbie

r = mean (x) / mean (y) = 0.7515 - นั่นคือ "อัตราส่วนของค่าเฉลี่ย"
Glen_b

โอเคน่ากลัว ฉันได้ 0.67 แต่นั่นอาจเป็นเพราะข้อผิดพลาดในการป้อนข้อมูล
Jonathan Dobbie

1
ฉันได้แยกความแตกต่างระหว่างค่าเฉลี่ยของประชากรและตัวอย่างที่ได้นั้นมีความชัดเจนมากขึ้น
Glen_b

αα2

3

nxlognxxi+nylognyyj(nx+ny)lognx+nyxi+yj
nxlog(nxny+1r)+nylog(nynx+r)+nxlognynx+ny+nylognxnx+ny
r=x¯y¯r=1

rELRrobsPr(R>rELR)rELR=1.3272Pr(R>rELR)=0.21420.43520.4315

ป้อนคำอธิบายรูปภาพที่นี่

rETPPr(R>rETP)Pr(R<robs)Pr(R>rETP)μx>μyμx<μyμx>μyμx<μy

ป้อนคำอธิบายรูปภาพที่นี่

รหัส R ดังนี้:

x <- c(12.173, 3.148, 33.873, 0.160, 3.054, 11.579, 13.491, 7.048, 48.836,
       16.478, 3.323, 3.520, 7.113, 5.358)

y <- c(7.635, 1.508, 29.987, 13.636, 8.709, 13.132, 12.141, 5.280, 23.447, 
       18.687, 13.055, 47.747, 0.334,7.745, 26.287, 34.390, 9.596)

# observed ratio of sample means
r.obs <- mean(x)/mean(y)

# sample sizes
n.x <- length(x)
n.y <- length(y)

# define log likelihood ratio function
calc.llr <- function(r,n.x,n.y){
  n.x * log(n.x/n.y + 1/r) + n.y*log(n.y/n.x + r) + n.x*log(n.y/(n.x+n.y)) + n.y*log(n.x/(n.x+n.y))
}

# observed log likelihood ratio
calc.llr(r.obs,n.x, n.y) -> llr.obs

# p-value in lower tail
pf(r.obs,2*n.x,2*n.y) -> p.lo

# find the other ratio of sample means giving an LLR equal to that observed
uniroot(function(x) calc.llr(x,n.x,n.y)-llr.obs, lower=1.2, upper=1.4, tol=1e-6)$root -> r.hi

#p.value in upper tail
p.hi <- 1-pf(r.hi,2*n.x,2*n.y)

# overall p.value
p.value <- p.lo + p.hi

#approximate p.value
1-pchisq(2*llr.obs, 1)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.