เพิ่มหางสองเท่าในการทดสอบการเปลี่ยนรูปสองตัวอย่าง


10

สมมติว่าเรามีสองตัวอย่างและเราต้องการตรวจสอบว่าพวกมันถูกดึงมาจากการกระจายตัวเดียวกันหรือไม่ตัวอย่าง A, B ที่ประกอบไปด้วยจำนวนเต็มบางส่วนบอกว่า

ถ้าเราทดสอบสิ่งนี้โดยใช้การทดสอบการเปลี่ยนรูปสองตัวอย่างโดยเฉพาะโดยดูที่การเรียงสับเปลี่ยนที่ความแตกต่างในค่าเฉลี่ยของกลุ่มตัวอย่างนั้นรุนแรงมากเท่าความแตกต่างที่สังเกต: มีเหตุผลใดที่คิดว่าเราสามารถคำนวณค่า p- สองด้านได้ ให้ความสำคัญกับการมองที่หางเดียวและเพิ่มความน่าจะเป็นเป็นสองเท่า?

นี่คือสิ่งที่ดูเหมือนจะพูดในบันทึกการบรรยายของฉัน แต่ฉันไม่เข้าใจว่าทำไมเราจึงสามารถสันนิษฐานได้ว่าก้อยนั้นมีความสมมาตร คำอธิบายไม่ได้เตรียมพร้อม

คำตอบ:


10

การกระจายการเปลี่ยนแปลงของสถิติการทดสอบของคุณไม่รับประกันว่าจะสมมาตรดังนั้นคุณจึงไม่สามารถทำเช่นนั้นได้ คุณเพิ่มทั้งสองหางแทน ในกรณีของคุณจากตัวอย่างอิสระสองตัวอย่างสมมติฐานว่างคือพารามิเตอร์ตำแหน่งสองตัวนั้นเท่ากัน สมมติว่าการกระจายอย่างต่อเนื่องและการแพร่กระจายอย่างเท่าเทียมกันในทั้งสองกลุ่มเรามีการแลกเปลี่ยนภายใต้สมมติฐานว่าง สถิติการทดสอบคือความแตกต่างของค่าเฉลี่ยโดยภายใต้ค่า nullTE(T)=0

ค่าสำหรับในกลุ่มตัวอย่างเดิมคือและค่านิยมสำหรับพีชคณิตดาว} ย่อมาจาก "number of" something เช่นคือจำนวนสถิติการทดสอบการเปลี่ยนแปลง จากนั้นสำหรับสมมติฐานสองด้านคือโดยที่TTempT()(T)ppts=pleft+pright

pleft=(T<=min(Temp,Temp))(T)

pright=(T>=max(Temp,Temp))(T)

(สมมติว่าเรามีการกระจายการเปลี่ยนแปลงที่สมบูรณ์) ลองเปรียบเทียบทั้งสองวิธีสำหรับกรณีของสองตัวอย่างอิสระเมื่อเราสามารถคำนวณการแจกแจงการเปลี่ยนรูปที่แน่นอน (สมบูรณ์)

set.seed(1234)
Nj   <- c(9, 8)                      # group sizes
DVa  <- rnorm(Nj[1], 5, 20)^2        # data group 1
DVb  <- rnorm(Nj[2], 10, 20)^2       # data group 2
DVab <- c(DVa, DVb)                  # data from both groups
IV   <- factor(rep(c("A", "B"), Nj)) # grouping factor
idx  <- seq(along=DVab)              # all indices
idxA <- combn(idx, Nj[1])            # all possible first groups

# function to calculate test statistic for a given permutation x
getDM <- function(x) { mean(DVab[x]) - mean(DVab[!(idx %in% x)]) }
resDM <- apply(idxA, 2, getDM)       # test statistic for all permutations
diffM <- mean(DVa) - mean(DVb)       # empirical stest statistic

ตอนนี้คำนวณค่า value และตรวจสอบโซลูชันที่เสนอกับการใช้งานในแพ็คเกจของ R สังเกตว่าดังนั้นมันเป็นเรื่องสำคัญที่ทางคุณคำนวณ{TS}pcoinpleftprightpts

> (pL <- sum(resDM <= min(diffM, -diffM)) / length(resDM))  # left p-value
[1] 0.1755245

> (pR <- sum(resDM >= max(diffM, -diffM)) / length(resDM))  # right p-value
[1] 0.1585356

> 2*pL        # doubling left p-value
[1] 0.351049

> 2*pR        # doubling right p-value
[1] 0.3170712

> pL+pR       # two-sided p-value
[1] 0.3340601

> sum(abs(resDM) >= abs(diffM)) / length(resDM)  # two-sided p-value (more concise)
[1] 0.3340601

# validate with coin implementation
> library(coin)              # for oneway_test()    
> oneway_test(DVab ~ IV, alternative="two.sided", distribution="exact")
Exact 2-Sample Permutation Test
data:  DVab by IV (A, B) 
Z = 1.0551, p-value = 0.3341
alternative hypothesis: true mu is not equal to 0 

ป.ล. สำหรับกรณี Monte-Carlo ที่เราสุ่มตัวอย่างจากการกระจายการเปลี่ยนแปลงเท่านั้นค่า value จะถูกกำหนดดังนี้:p

พีซ้าย=(T<=นาที(TEMP,-TEMP))+1(T)+1

พีขวา=(T> =สูงสุด(TEMP,-TEMP))+1(T)+1

พีทีเอส=(เอบีเอส(T)> =เอบีเอส(TEMP))+1(T)+1

เหตุผลในการเพิ่มกรณีการเปลี่ยนแปลงที่รุนแรงมากขึ้นอย่างสังหรณ์ใจคือเราต้องนับตัวอย่างเชิงประจักษ์ด้วย มิฉะนั้นการเปลี่ยนแปลงอาจเป็น 0 ซึ่งไม่สามารถเกิดขึ้นได้ในกรณีต่อเนื่อง (ดูที่นี่หมายเหตุ: ข้อความบางข้อความแนะนำการแก้ไขนี้บางคนไม่ได้)พี


สิ่งนี้ไม่ถือว่าความคาดหวังของเป็นศูนย์หรือไม่ T
whuber

@ เมื่อฉันเพิ่มว่าด้วยสมมติฐานว่างของพารามิเตอร์ที่ตั้งเท่ากันในทั้งสองกลุ่มเรามีการแลกเปลี่ยนภายใต้ null และภายใต้ null (สมมติว่ามีความต่อเนื่องและการแพร่กระจายเท่ากัน) E(T)=0
caracal

ขอบคุณนั่นคือการปรับปรุง คุณช่วยอธิบายได้ไหมว่าสถิตินั้นไม่สามารถมีการกระจายแบบสมมาตรภายใต้สมมติฐานนี้ได้อย่างไร
whuber

2
@whuber การกระจายการเรียงสับเปลี่ยนอาจไม่สมมาตรเนื่องจากขึ้นอยู่กับค่าตัวอย่าง ค่ากลุ่ม: 1, กลุ่มค่า B: 2, 2. สามพีชคณิตที่เกี่ยวข้องเป็นไปได้ยอม0.5} T=-1,0.5,0.5
caracal

ขอบคุณสำหรับความกระจ่าง: ฉันทำตามตรรกะตอนนี้
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.