ตั้งแต่การอภิปรายใช้เวลานานฉันจึงตอบคำตอบของฉัน แต่ฉันเปลี่ยนคำสั่ง
การทดสอบการเปลี่ยนรูปคือ "แน่นอน" แทนที่จะเป็นแบบซีมโทติค (เปรียบเทียบกับตัวอย่างเช่นการทดสอบอัตราส่วนความน่าจะเป็น) ตัวอย่างเช่นคุณสามารถทำการทดสอบวิธีการได้แม้ว่าจะไม่สามารถคำนวณการกระจายตัวของความแตกต่างในวิธีการภายใต้ค่า null; คุณไม่จำเป็นต้องระบุการแจกแจงที่เกี่ยวข้องด้วยซ้ำ คุณสามารถออกแบบสถิติการทดสอบที่มีพลังที่ดีภายใต้ข้อสันนิษฐานได้โดยไม่ต้องอ่อนไหวต่อพวกเขาเหมือนกับการตั้งสมมติฐานแบบเต็มพารามิเตอร์ (คุณสามารถใช้สถิติที่มีความแข็งแกร่ง
โปรดทราบว่าคำจำกัดความที่คุณให้ (หรือมากกว่าใครก็ตามที่คุณอ้างมีให้) ไม่เป็นสากล บางคนจะเรียกคุณว่าสถิติการทดสอบการเปลี่ยนรูป (สิ่งที่ทำให้การทดสอบการเปลี่ยนแปลงไม่ได้เป็นสถิติ แต่คุณประเมินค่า p-value) อย่างไร แต่เมื่อคุณทำการทดสอบการเปลี่ยนรูปและคุณได้กำหนดทิศทางในฐานะ 'สุดขั้วของสิ่งนี้ไม่สอดคล้องกับ H0' คำจำกัดความแบบนั้นสำหรับ T ด้านบนนั้นเป็นวิธีที่คุณหาค่า p - เป็นสัดส่วนที่แท้จริงของ การกระจายการเปลี่ยนรูปอย่างน้อยที่สุดเท่าตัวอย่างใต้โมฆะ (ความหมายของ p-value)
ตัวอย่างเช่นถ้าฉันต้องการทำการทดสอบ (หนึ่งหางเพื่อความง่าย) ของวิธีการเช่นการทดสอบสองตัวอย่างฉันจะทำให้สถิติของฉันเป็นตัวเศษของสถิติ t หรือสถิติของตัวเอง หรือผลรวมของตัวอย่างแรก (คำจำกัดความแต่ละคำนั้นคือแบบโมโนโทนิกในแบบอื่นแบบมีเงื่อนไขบนตัวอย่างแบบรวม) หรือการแปลงแบบโมโนโทนิกใด ๆ ของพวกมันและมีการทดสอบแบบเดียวกัน สิ่งที่ฉันต้องทำคือดูว่าการกระจายการเรียงลำดับ (ในแง่ของสัดส่วน) ของสถิติอะไรก็ตามที่ฉันเลือกสถิติการโกหก T ตามที่นิยามไว้ข้างต้นเป็นเพียงสถิติอื่นและฉันก็สามารถเลือกได้ (T ตามที่นิยามไว้มี monotonic ใน U)
T จะไม่เหมือนกันทุกประการเพราะนั่นจะต้องมีการแจกแจงแบบต่อเนื่องและ T ก็ไม่จำเป็น เนื่องจาก U และดังนั้น T สามารถแมปมากกว่าหนึ่งการเปลี่ยนแปลงกับสถิติที่กำหนดผลลัพธ์จึงไม่น่าจะเป็นไปได้ แต่พวกมันมี "cdf ** เหมือนกัน" แต่มีขั้นตอนที่ไม่จำเป็นต้องมีขนาดเท่ากัน .
** (และเท่ากับที่ จำกัด ไว้อย่างถูกต้องในการกระโดดแต่ละครั้ง - อาจมีชื่อสำหรับสิ่งที่เป็นจริง)F(x)≤x
สำหรับสถิติที่สมเหตุสมผลเมื่อไปที่อนันต์การกระจายตัวของใกล้เคียงกัน ฉันคิดว่าวิธีที่ดีที่สุดในการเริ่มเข้าใจพวกเขาคือการทำในสถานการณ์ที่หลากหลาย nT
T (X) ควรเท่ากับ p-value ตาม U (X) หรือไม่สำหรับตัวอย่าง X ใด ๆ หากฉันเข้าใจถูกต้องฉันพบในหน้า 5 ของสไลด์นี้
T คือค่า p (สำหรับกรณีที่ U มีขนาดใหญ่หมายถึงการเบี่ยงเบนจากโมฆะและ U ที่มีขนาดเล็กสอดคล้องกับค่านั้น) โปรดทราบว่าการกระจายเป็นเงื่อนไขในตัวอย่าง ดังนั้นการกระจายของมันจึงไม่ใช่ 'สำหรับตัวอย่างใด ๆ '
ดังนั้นประโยชน์ของการใช้การทดสอบการเปลี่ยนรูปคือการคำนวณ p-value ของสถิติการทดสอบดั้งเดิม U โดยไม่ทราบว่าการแจกแจงของ X ต่ำกว่าค่าใด? ดังนั้นการกระจายตัวของ T (X) จึงไม่จำเป็นต้องเหมือนกัน?
ฉันอธิบายแล้วว่า T ไม่เหมือนกัน
ฉันคิดว่าฉันได้อธิบายสิ่งที่ฉันเห็นแล้วว่าเป็นประโยชน์ของการทดสอบการเปลี่ยนแปลง คนอื่นจะแนะนำข้อดีอื่น ๆ ( เช่น )
"T คือค่า p (สำหรับกรณีที่ U ขนาดใหญ่บ่งชี้ว่าส่วนเบี่ยงเบนจาก null และ U เล็กสอดคล้องกับมันหรือไม่)" หมายความว่า p-value สำหรับสถิติการทดสอบ U และตัวอย่าง X คือ T (X) หรือไม่ ทำไม? มีการอ้างอิงเพื่ออธิบายสิ่งนั้นหรือไม่?
ประโยคที่คุณยกมาอย่างชัดเจนระบุว่า T เป็นค่า p และเมื่อเป็น หากคุณสามารถอธิบายสิ่งที่ไม่ชัดเจนเกี่ยวกับเรื่องนี้ฉันอาจพูดได้มากกว่านี้ สำหรับสาเหตุให้ดูคำจำกัดความของp-value (ประโยคแรกที่ลิงก์) - มันค่อนข้างติดตามจากนั้นโดยตรง
มีการอภิปรายประถมศึกษาที่ดีของการทดสอบการเปลี่ยนแปลงเป็นที่นี่
-
แก้ไข: ฉันเพิ่มที่นี่ตัวอย่างการทดสอบการเปลี่ยนแปลงเล็ก ๆ น้อย ๆ ที่นี่; รหัส (R) นี้เหมาะสำหรับตัวอย่างขนาดเล็กเท่านั้น - คุณต้องการอัลกอริทึมที่ดีกว่าสำหรับการค้นหาชุดค่าผสมที่รุนแรงในตัวอย่างระดับปานกลาง
พิจารณาการทดสอบการเปลี่ยนแปลงกับทางเลือกเดียว:
H0:μx=μy (บางคนยืนยันใน *)μx≥μy
H1:μx<μy
* แต่ฉันมักจะหลีกเลี่ยงเพราะมักจะสร้างความสับสนให้กับนักเรียนเมื่อพยายามหาการแจกแจงที่ไม่มีค่า
บนข้อมูลต่อไปนี้:
> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99
มี 35 วิธีในการแบ่งข้อสังเกต 7 แบบออกเป็นตัวอย่างขนาด 3 และ 4:
> choose(7,3)
[1] 35
ดังที่ได้กล่าวไว้ก่อนหน้านี้เมื่อได้รับค่าข้อมูล 7 ผลรวมของตัวอย่างแรกเป็นแบบโมโนโทนิกในความแตกต่างของค่าเฉลี่ยดังนั้นลองใช้ว่าเป็นสถิติทดสอบ ดังนั้นตัวอย่างดั้งเดิมจึงมีสถิติการทดสอบของ:
> sum(x)
[1] 64.77
ตอนนี้นี่คือการกระจายการเปลี่ยนรูป:
> sort(apply(combn(c(x,y),3),2,sum))
[1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07
(มันไม่จำเป็นที่จะต้องจัดเรียงพวกเขาฉันแค่ทำอย่างนั้นเพื่อให้ง่ายขึ้นที่จะเห็นสถิติการทดสอบเป็นค่าที่สองในตอนท้าย)
เราสามารถเห็น (ในกรณีนี้จากการตรวจสอบ) ว่าคือ 2/35 หรือp
> 2/35
[1] 0.05714286
(โปรดทราบว่าเฉพาะในกรณีที่ไม่มีการทับซ้อน xy เป็นค่า p ด้านล่าง. 05 ที่เป็นไปได้ที่นี่ในกรณีนี้จะเป็นชุดที่ไม่ต่อเนื่องเนื่องจากไม่มีค่าผูกใน )TU
ลูกศรสีชมพูระบุสถิติตัวอย่างบนแกน x และค่า p บนแกน y