ประโยชน์ของการใช้การทดสอบการเปลี่ยนรูปคืออะไร?


10

เมื่อทำการทดสอบสมมติฐานบางตัวเทียบกับสมมติฐานทางเลือกโดยสถิติทดสอบโดยที่ให้ใช้การทดสอบการเปลี่ยนรูปกับชุดของการเปลี่ยนลำดับบนและเรามีสถิติใหม่ U(X)X={xi,...,xn}GX

T(X):=#{πG:U(πX)U(X)}|G|.
  1. ประโยชน์ของการใช้แบบทดสอบการเปลี่ยนรูปมากกว่าไม่ใช้มันคืออะไร? คือเมื่อการทดสอบการเรียงสับเปลี่ยนทำงานอย่างไร

  2. มีเงื่อนไขอะไรที่จะทำให้เกิดขึ้น เช่นเงื่อนไขบางอย่างในสถิติการทดสอบและ / หรือตามสมมติฐานว่าง?U

ตัวอย่างเช่น,

  1. ควร เท่ากับ p-value ขึ้นอยู่กับสำหรับตัวอย่าง ? ถ้าใช่ทำไม (การอ้างอิงยังชื่นชม)T(X)U(X)X

    p-value ของถูกกำหนดเป็นF) หากการทดสอบการเปลี่ยนรูปคือการประมาณการกระจายการเปลี่ยนแปลงของU (X) | X = x , T (X)เท่ากับ p-value ของU (X)ที่X = xอย่างไร โดยเฉพาะอย่างยิ่งอาจมีการแจกแจงมากกว่าหนึ่งครั้งใน null HและT (X)ไม่พิจารณาการแจกแจงโมฆะทีละหนึ่งแล้วใช้\ sup_ {F \ in H}และ\ inf_ {c: U (x) \ geq C}U(X)

    infcR:U(x)csupFHP(U(X)c|XF)
    U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)c
  2. การทดสอบการเรียงสับเปลี่ยนควรทำให้การแจกแจงแบบเป็นไปตามสมมติฐานว่างหรือไม่? เงื่อนไขใดที่จะทำให้เกิดขึ้นT(X)

  3. ควรกระจายอย่างสม่ำเสมอทั่วหรือไม่ เงื่อนไขใดที่จะทำให้เกิดขึ้น ขอให้สังเกตว่าเมื่อเป็นฟังก์ชั่นอย่างต่อเนื่อง,ยังคงเป็นที่และการกระจายของ อยู่ไกลจากการเครื่องแบบกว่า[0,1]T(X)[0,1]U()T()1T(X)[0,1]

ขอบคุณและขอแสดงความนับถือ!


@Glen_b: ขอบคุณ! ควร เท่ากับ p-value ขึ้นอยู่กับสำหรับตัวอย่าง ? ถ้าฉันเข้าใจถูกต้องฉันพบมันในหน้า 5 ของสไลด์นี้ดังนั้นประโยชน์ของการใช้การทดสอบการเปลี่ยนแปลงคือการคำนวณ p-value ของสถิติการทดสอบดั้งเดิมโดยไม่ทราบว่าการแจกแจงของโมฆะ? ดังนั้นการกระจายตัวของจึงไม่จำเป็นต้องเหมือนกัน? T(X)U(X)XUXT(X)
ทิม

"T คือค่า p (สำหรับกรณีที่ U ขนาดใหญ่บ่งชี้ว่าส่วนเบี่ยงเบนจาก null และ U เล็กสอดคล้องกับมันหรือไม่)" หมายความว่า p-value สำหรับสถิติการทดสอบและตัวอย่างคือหรือไม่ UXT(X)
ทิม

ทำไม? มีการอ้างอิงเพื่ออธิบายสิ่งนั้นหรือไม่?
ทิม

คำตอบ:


18

ตั้งแต่การอภิปรายใช้เวลานานฉันจึงตอบคำตอบของฉัน แต่ฉันเปลี่ยนคำสั่ง

การทดสอบการเปลี่ยนรูปคือ "แน่นอน" แทนที่จะเป็นแบบซีมโทติค (เปรียบเทียบกับตัวอย่างเช่นการทดสอบอัตราส่วนความน่าจะเป็น) ตัวอย่างเช่นคุณสามารถทำการทดสอบวิธีการได้แม้ว่าจะไม่สามารถคำนวณการกระจายตัวของความแตกต่างในวิธีการภายใต้ค่า null; คุณไม่จำเป็นต้องระบุการแจกแจงที่เกี่ยวข้องด้วยซ้ำ คุณสามารถออกแบบสถิติการทดสอบที่มีพลังที่ดีภายใต้ข้อสันนิษฐานได้โดยไม่ต้องอ่อนไหวต่อพวกเขาเหมือนกับการตั้งสมมติฐานแบบเต็มพารามิเตอร์ (คุณสามารถใช้สถิติที่มีความแข็งแกร่ง

โปรดทราบว่าคำจำกัดความที่คุณให้ (หรือมากกว่าใครก็ตามที่คุณอ้างมีให้) ไม่เป็นสากล บางคนจะเรียกคุณว่าสถิติการทดสอบการเปลี่ยนรูป (สิ่งที่ทำให้การทดสอบการเปลี่ยนแปลงไม่ได้เป็นสถิติ แต่คุณประเมินค่า p-value) อย่างไร แต่เมื่อคุณทำการทดสอบการเปลี่ยนรูปและคุณได้กำหนดทิศทางในฐานะ 'สุดขั้วของสิ่งนี้ไม่สอดคล้องกับ H0' คำจำกัดความแบบนั้นสำหรับ T ด้านบนนั้นเป็นวิธีที่คุณหาค่า p - เป็นสัดส่วนที่แท้จริงของ การกระจายการเปลี่ยนรูปอย่างน้อยที่สุดเท่าตัวอย่างใต้โมฆะ (ความหมายของ p-value)

ตัวอย่างเช่นถ้าฉันต้องการทำการทดสอบ (หนึ่งหางเพื่อความง่าย) ของวิธีการเช่นการทดสอบสองตัวอย่างฉันจะทำให้สถิติของฉันเป็นตัวเศษของสถิติ t หรือสถิติของตัวเอง หรือผลรวมของตัวอย่างแรก (คำจำกัดความแต่ละคำนั้นคือแบบโมโนโทนิกในแบบอื่นแบบมีเงื่อนไขบนตัวอย่างแบบรวม) หรือการแปลงแบบโมโนโทนิกใด ๆ ของพวกมันและมีการทดสอบแบบเดียวกัน สิ่งที่ฉันต้องทำคือดูว่าการกระจายการเรียงลำดับ (ในแง่ของสัดส่วน) ของสถิติอะไรก็ตามที่ฉันเลือกสถิติการโกหก T ตามที่นิยามไว้ข้างต้นเป็นเพียงสถิติอื่นและฉันก็สามารถเลือกได้ (T ตามที่นิยามไว้มี monotonic ใน U)

T จะไม่เหมือนกันทุกประการเพราะนั่นจะต้องมีการแจกแจงแบบต่อเนื่องและ T ก็ไม่จำเป็น เนื่องจาก U และดังนั้น T สามารถแมปมากกว่าหนึ่งการเปลี่ยนแปลงกับสถิติที่กำหนดผลลัพธ์จึงไม่น่าจะเป็นไปได้ แต่พวกมันมี "cdf ** เหมือนกัน" แต่มีขั้นตอนที่ไม่จำเป็นต้องมีขนาดเท่ากัน .

** (และเท่ากับที่ จำกัด ไว้อย่างถูกต้องในการกระโดดแต่ละครั้ง - อาจมีชื่อสำหรับสิ่งที่เป็นจริง)F(x)x

สำหรับสถิติที่สมเหตุสมผลเมื่อไปที่อนันต์การกระจายตัวของใกล้เคียงกัน ฉันคิดว่าวิธีที่ดีที่สุดในการเริ่มเข้าใจพวกเขาคือการทำในสถานการณ์ที่หลากหลาย nT

T (X) ควรเท่ากับ p-value ตาม U (X) หรือไม่สำหรับตัวอย่าง X ใด ๆ หากฉันเข้าใจถูกต้องฉันพบในหน้า 5 ของสไลด์นี้

T คือค่า p (สำหรับกรณีที่ U มีขนาดใหญ่หมายถึงการเบี่ยงเบนจากโมฆะและ U ที่มีขนาดเล็กสอดคล้องกับค่านั้น) โปรดทราบว่าการกระจายเป็นเงื่อนไขในตัวอย่าง ดังนั้นการกระจายของมันจึงไม่ใช่ 'สำหรับตัวอย่างใด ๆ '

ดังนั้นประโยชน์ของการใช้การทดสอบการเปลี่ยนรูปคือการคำนวณ p-value ของสถิติการทดสอบดั้งเดิม U โดยไม่ทราบว่าการแจกแจงของ X ต่ำกว่าค่าใด? ดังนั้นการกระจายตัวของ T (X) จึงไม่จำเป็นต้องเหมือนกัน?

ฉันอธิบายแล้วว่า T ไม่เหมือนกัน

ฉันคิดว่าฉันได้อธิบายสิ่งที่ฉันเห็นแล้วว่าเป็นประโยชน์ของการทดสอบการเปลี่ยนแปลง คนอื่นจะแนะนำข้อดีอื่น ๆ ( เช่น )

"T คือค่า p (สำหรับกรณีที่ U ขนาดใหญ่บ่งชี้ว่าส่วนเบี่ยงเบนจาก null และ U เล็กสอดคล้องกับมันหรือไม่)" หมายความว่า p-value สำหรับสถิติการทดสอบ U และตัวอย่าง X คือ T (X) หรือไม่ ทำไม? มีการอ้างอิงเพื่ออธิบายสิ่งนั้นหรือไม่?

ประโยคที่คุณยกมาอย่างชัดเจนระบุว่า T เป็นค่า p และเมื่อเป็น หากคุณสามารถอธิบายสิ่งที่ไม่ชัดเจนเกี่ยวกับเรื่องนี้ฉันอาจพูดได้มากกว่านี้ สำหรับสาเหตุให้ดูคำจำกัดความของp-value (ประโยคแรกที่ลิงก์) - มันค่อนข้างติดตามจากนั้นโดยตรง

มีการอภิปรายประถมศึกษาที่ดีของการทดสอบการเปลี่ยนแปลงเป็นที่นี่

-

แก้ไข: ฉันเพิ่มที่นี่ตัวอย่างการทดสอบการเปลี่ยนแปลงเล็ก ๆ น้อย ๆ ที่นี่; รหัส (R) นี้เหมาะสำหรับตัวอย่างขนาดเล็กเท่านั้น - คุณต้องการอัลกอริทึมที่ดีกว่าสำหรับการค้นหาชุดค่าผสมที่รุนแรงในตัวอย่างระดับปานกลาง

พิจารณาการทดสอบการเปลี่ยนแปลงกับทางเลือกเดียว:

H0:μx=μy (บางคนยืนยันใน *)μxμy
H1:μx<μy

* แต่ฉันมักจะหลีกเลี่ยงเพราะมักจะสร้างความสับสนให้กับนักเรียนเมื่อพยายามหาการแจกแจงที่ไม่มีค่า

บนข้อมูลต่อไปนี้:

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

มี 35 วิธีในการแบ่งข้อสังเกต 7 แบบออกเป็นตัวอย่างขนาด 3 และ 4:

> choose(7,3)
[1] 35

ดังที่ได้กล่าวไว้ก่อนหน้านี้เมื่อได้รับค่าข้อมูล 7 ผลรวมของตัวอย่างแรกเป็นแบบโมโนโทนิกในความแตกต่างของค่าเฉลี่ยดังนั้นลองใช้ว่าเป็นสถิติทดสอบ ดังนั้นตัวอย่างดั้งเดิมจึงมีสถิติการทดสอบของ:

> sum(x)
[1] 64.77

ตอนนี้นี่คือการกระจายการเปลี่ยนรูป:

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(มันไม่จำเป็นที่จะต้องจัดเรียงพวกเขาฉันแค่ทำอย่างนั้นเพื่อให้ง่ายขึ้นที่จะเห็นสถิติการทดสอบเป็นค่าที่สองในตอนท้าย)

เราสามารถเห็น (ในกรณีนี้จากการตรวจสอบ) ว่าคือ 2/35 หรือp

> 2/35
[1] 0.05714286

(โปรดทราบว่าเฉพาะในกรณีที่ไม่มีการทับซ้อน xy เป็นค่า p ด้านล่าง. 05 ที่เป็นไปได้ที่นี่ในกรณีนี้จะเป็นชุดที่ไม่ต่อเนื่องเนื่องจากไม่มีค่าผูกใน )TU

การกระจายการเปลี่ยนแปลง

ลูกศรสีชมพูระบุสถิติตัวอย่างบนแกน x และค่า p บนแกน y


ขอบคุณ! โดยพื้นฐานแล้วการทดสอบการเปลี่ยนรูปใช้เพื่อประเมินการกระจายตัวของภายใต้การแจกแจงโมฆะของใช่ไหม ดังนั้นขึ้นอยู่กับการแจกแจงโมฆะของแต่ p-value คือ inf ของอัตรา FP สำหรับการแจกแจงโมฆะทั้งหมดของและคือ p-value สำหรับและ ? U(X)XT(X)XXT(X)UX
ทิม

มันประมาณการการกระจายการเปลี่ยนแปลงของ x มันเป็นความจริงที่ว่าคุณปฏิบัติกับพีชคณิตทั้งหมดเท่า ๆ กันที่ทำให้มัน 'อยู่ภายใต้ค่า null' (เนื่องจากภายใต้ค่า null นั้นการเรียงสับเปลี่ยนควรมีโอกาสเท่ากัน) U(X)|X=x
Glen_b -Reinstate Monica

(1) p-value ของถูกกำหนดเป็นF) หากการทดสอบการเปลี่ยนรูปคือการประมาณการกระจายการเปลี่ยนแปลงของ ,เท่ากับ p-value ของที่อย่างไร โดยเฉพาะอย่างยิ่งอาจมีการแจกแจงมากกว่าหนึ่งครั้งใน nullและไม่พิจารณาการแจกแจงโมฆะทีละหนึ่งแล้วใช้และC} (2)มีการแจกแจงแบบเดียวกันสำหรับการแจกแจงแบบโมฆะทั้งหมดหรือไม่เช่นการแจกแจงแบบไม่มีค่าเป็นโมฆะ? U(X)
infcR:U(x)csupFHP(U(X)c|XF)
U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)cT(X)
ทิม

เพิ่มไปที่ (1) การทดสอบการเปลี่ยนรูปไม่เพียง แต่นำไปใช้กับค่า null แบบง่าย แต่รวมถึงค่าคอมโพสิตค่า null ด้วยใช่ไหม
ทิม

(1) กำหนดที่ไหน? ดูเหมือนจะเป็นคำจำกัดความที่แปลก ทำไมคุณถึงระบุการกระจายของ X คุณกำลังอยู่บนเครื่อง x ความสับสนของคุณดูเหมือนจะเกิดจากคำจำกัดความที่ค่อนข้างแปลก (2) ไม่สมเหตุสมผลกับฉันเลย X=x
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.