ทำไมประสิทธิภาพเชิงสัมพัทธ์ของซีมโทติคของการทดสอบ Wilcoxon


13

มันเป็นที่รู้จักกันดีว่าประสิทธิภาพญาติ asymptotic (เป็น) ของ Wilcoxon ลงนามในการทดสอบยศเป็นเมื่อเทียบกับนักศึกษาของT -test ถ้าข้อมูลจะถูกดึงออกมาจากประชากรกระจายตามปกติ สิ่งนี้เป็นจริงสำหรับทั้งการทดสอบหนึ่งตัวอย่างขั้นพื้นฐานและตัวแปรสำหรับสองตัวอย่างอิสระ (Wilcoxon-Mann-Whitney U) นอกจากนี้ยังเป็นส่วนของการทดสอบ Kruskal-Wallis เมื่อเทียบกับ ANOVA F -test สำหรับข้อมูลปกติ3π0.955

สิ่งนี้น่าทึ่ง (สำหรับฉันซึ่งเป็นหนึ่งใน " ลักษณะที่ไม่คาดคิดที่สุดของπ ") และผลลัพธ์ที่เรียบง่ายอย่างน่าทึ่งมีหลักฐานที่ลึกซึ้งน่าทึ่งหรือเรียบง่าย


ได้รับการปรากฏตัวของใน CDF ปกติลักษณะของในเป็นไม่ควรจริงๆจะทั้งหมดที่น่าแปลกใจ ฉันจะเสี่ยงต่อคำตอบ แต่จะใช้เวลาสักครู่ในการสร้างคำตอบที่ดี เธππ
Glen_b -Reinstate Monica

1
@Glen_b แน่นอน - ฉันเคยเห็นการอภิปราย"ทำไมปรากฏมากในสถิติ" ก่อน (แม้ว่าจำไม่ได้ว่ามันอยู่ในประวัติส่วนตัวหรือไม่) และ "เพราะการกระจายปกติ" ฉันรู้ว่าพืชผลมากขึ้น แต่3 / πยังคงเป็นที่น่าแปลกใจเป็นครั้งแรกที่คุณเห็นมัน สำหรับการเปรียบเทียบ ARE of Mann-Whitney กับ t-test สองตัวอย่างคือ 3 สำหรับข้อมูลเลขชี้กำลัง, 1.5 สำหรับการเอ็กซ์โพเนนเชียลสองเท่าและ 1 บนเครื่องแบบ - กลมมาก π3/π
Silverfish

1
@Silverfish ฉันได้เชื่อมโยงหน้า 197 ของ van der Vaart "Asymptotic Statistics" สำหรับตัวอย่างหนึ่งการทดสอบเครื่องหมายมีค่าอยู่ที่สัมพันธ์กับการทดสอบ t 2/π
Khashaa

1
@Silverfish ... และโลจิสติกมัน 2 มีค่อนข้างน้อยของพื้นที่ที่รู้จักกันดี (ในกรณีตัวอย่างหนึ่งหรือสองกรณี) ที่เกี่ยวข้องกับπและค่อนข้างน้อยที่เป็นอัตราส่วนที่เรียบง่ายของจำนวนเต็ม (π/3)2π
Glen_b -Reinstate Monica

1
หนึ่งในตัวอย่างการทดสอบลงนามยศมันน่าจะเป็น π สำหรับหนึ่งตัวอย่างการทดสอบสัญญาณมันเป็น2 / π ดังนั้นเราจึงชี้แจงตำแหน่งของเรา ฉันคิดว่ามันเป็นสัญญาณที่ดี 3/π2/π
Khashaa

คำตอบ:


10

ภาพร่างคร่าวๆของสำหรับหนึ่งตัวอย่าง -test ทดสอบการลงนามและการทดสอบการลงนามในอันดับt

ฉันคาดหวังว่าคำตอบของ @ Glen_b รุ่นยาวจะรวมการวิเคราะห์โดยละเอียดสำหรับการทดสอบยศสองตัวอย่างพร้อมด้วยคำอธิบายที่เข้าใจง่ายของ ARE ดังนั้นฉันจะข้ามมาส่วนใหญ่ (กรณีตัวอย่างหนึ่งคุณสามารถค้นหารายละเอียดที่ขาดหายไปใน Lehmann TSH)

ปัญหาการทดสอบ : ให้เป็นตัวอย่างแบบสุ่มจากตำแหน่งจำลองf ( x - θ ) , สมมาตรเกี่ยวกับศูนย์ เราต้องคำนวณ ARE ของการทดสอบที่ลงนาม, การจัดอันดับการทดสอบสำหรับสมมติฐานH 0 : θ = 0เทียบกับ t-testX1,,Xnf(xθ)H0:θ=0

ในการประเมินประสิทธิภาพของการทดสอบมีเพียงตัวเลือกในท้องถิ่นเท่านั้นที่พิจารณาเนื่องจากการทดสอบที่สอดคล้องกันมีกำลังงานที่มีแนวโน้มที่ 1 ต่อทางเลือกคงที่ ทางเลือกในท้องถิ่นที่ก่อให้เกิดพลัง asymptotic nontrivial มักจะอยู่ในรูปแบบสำหรับค่าคงที่hซึ่งเรียกว่าพิตแมนดริฟท์ในวรรณกรรมบางเล่มθn=h/nh

หน้าที่ของเราคือ

  • ค้นหาการแจกแจงขีด จำกัด ของสถิติการทดสอบแต่ละรายการภายใต้ค่า Null
  • ค้นหาการแจกแจงขีด จำกัด ของสถิติการทดสอบแต่ละอันภายใต้ทางเลือก
  • คำนวณกำลังซีมโทติคท้องถิ่นของการทดสอบแต่ละครั้ง

สถิติการทดสอบและ asymptotics

  1. t-test (ให้การมีอยู่ของ ) t n = σt n =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • ดังนั้นการทดสอบที่ปฏิเสธถ้ามีฟังก์ชันพลังงานเชิงเส้น 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. การทดสอบที่เซ็นชื่อSn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    และมีพลังงานแบบอะซิมโทติคเฉพาะที่ 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. ทดสอบการลงนามในอันดับW n d N ( 2 ชั่วโมงf 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    และมีพลังงานแบบอะซิมโทติคเฉพาะที่ 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

ARE(Sn)=(2f(0)σ)2
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

ข้อสังเกตเกี่ยวกับการสืบทอดของการแจกแจงภายใต้ทางเลือก

มีหลายวิธีที่แน่นอนที่จะได้รับการ จำกัด การกระจายภายใต้ทางเลือก แนวทางทั่วไปอย่างหนึ่งคือการใช้บทแทรกที่สามของ Le Cam เวอร์ชั่นย่อของมันระบุ

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 ฉันจะไม่เข้าไปดูรายละเอียดมากขนาดนี้ (แน่นอนด้วยคำตอบของคุณครอบคลุมสิ่งต่าง ๆ ค่อนข้างเรียบร้อยแล้วฉันอาจจะไม่เพิ่มอะไรกับสิ่งที่ฉันมีตอนนี้) ดังนั้นหากคุณต้องการใส่รายละเอียดเพิ่มเติมอย่า อย่าระงับบัญชีของฉัน ฉันจะได้รับหลายวัน (และยังน้อยกว่าที่คุณมีอยู่แล้ว) ดังนั้นจึงเป็นสิ่งที่ดีที่คุณเข้ามา
Glen_b

นี่เป็นคำตอบที่ดีโดยเฉพาะอย่างยิ่งสำหรับการเพิ่มบทแทรกของ Le Cam (+1) ดูเหมือนว่าฉันมีการกระโดดที่ค่อนข้างใหญ่ระหว่างการสร้าง asymptotics ใน 1, 2 และ 3 และบิต "ดังนั้น" ที่คุณเขียน ARE ฉันคิดว่าถ้าฉันเขียนมันขึ้นมาฉันจะนิยามประสิทธิภาพเชิงซีมโทติค ณ จุดนี้ (หรืออาจจะเร็วกว่านั้นดังนั้นผลที่สุดของคะแนน 1, 2 และ 3 จะเป็น AE ไม่ใช่แค่พลัง asymptotic ในแต่ละกรณี) และขั้นตอน ไปที่ ARE จะง่ายขึ้นมากสำหรับผู้อ่านในอนาคตที่จะติดตาม
Silverfish

H1

รู้สึกอิสระที่จะแก้ไขคำตอบของฉันหรือผนวกเข้ากับ OP
Khashaa

1

6

πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

นี่เป็นความคิดเห็นที่มีประโยชน์มากจริงๆ มันใกล้กับแนวคิดเล็กน้อยในการทำn <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(ซึ่งเห็นได้ชัดว่าให้ผลลัพธ์เดียวกัน)?
Silverfish


nnn

สำหรับความทรงจำของฉันประสิทธิภาพตัวอย่างขนาดเล็กของทั้ง Wilcoxon ที่ได้รับการจัดอันดับการทดสอบและ WMW นั้นต่ำกว่าค่า asymptotic เล็กน้อยสำหรับทางเลือกการเปลี่ยนแบบที่การแจกแจงแบบปกติ
Glen_b -Reinstate Monica

5

12σ2[f2(x)dx]2fσ

f2f1ππ

คำเดียวกัน - ที่มีอินทิกรัลเดียวกันมีส่วนร่วมในการทดสอบการจัดอันดับที่มีการเซ็นชื่อดังนั้นมันจึงใช้ค่าเดียวกัน

4σ2f(0)2f(0)2π

π

อ้างอิง:

JL Hodges และ EL Lehmann (1956),
"ประสิทธิภาพของคู่แข่งขันที่ไม่ใช่พารามิเตอร์ของ t-Test",
Ann. คณิตศาสตร์. statist , 27 : 2, 324-335


π

f2dx

α=2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.