"ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่" อาจจะคลุมเครือเล็กน้อย แต่โดยปกติแล้วฉันจะตีความเจตนาของมันว่าถ้าเราดูที่การสุ่มตัวอย่างแบบสุ่มเวลาส่วนใหญ่ผู้ชายจะเร็วขึ้น - เช่น P(Mผม<FJ) >12 สำหรับการสุ่ม ผม , J (ในกรณีที่ Mผม ถึงเวลาแล้ว ผมชายคนที่เป็นต้น)
แน่นอนว่าการตีความวลีอื่น ๆ นั้นเป็นไปได้ (นั่นคือความกำกวม) และความเป็นไปได้อื่น ๆ เหล่านั้นอาจสอดคล้องกับเหตุผลของคุณ
[เรายังมีปัญหาว่าเรากำลังพูดถึงตัวอย่างหรือประชากร ... "ผู้ชายส่วนใหญ่ [... ] ผู้หญิงส่วนใหญ่" ดูเหมือนว่าจะเป็นคำแถลงประชากร (ประมาณประชากรที่มีศักยภาพ) แต่เราสังเกตเวลาเท่านั้น ที่เราดูเหมือนจะปฏิบัติต่อเป็นตัวอย่างดังนั้นเราจึงต้องระมัดระวังด้วยวิธีที่เราเรียกร้องในวงกว้าง]
สังเกตได้ว่า P(Mผม<FJ) >12 ไม่ได้บอกเป็นนัยโดย M~<F~. พวกเขาสามารถไปในทิศทางตรงกันข้าม
[ฉันไม่ได้บอกว่าคุณคิดผิดว่าสัดส่วนของคู่เอ็มเอฟสุ่มที่ชายนั้นเร็วกว่าผู้หญิงมากกว่า 1/2 - คุณเกือบถูกต้องแน่นอน ฉันแค่บอกว่าคุณไม่สามารถบอกได้โดยการเปรียบเทียบค่ามัธยฐาน คุณไม่สามารถบอกได้โดยดูที่สัดส่วนในแต่ละตัวอย่างด้านบนหรือด้านล่างค่ามัธยฐานของตัวอย่างอื่น คุณจะต้องทำการเปรียบเทียบที่แตกต่างกัน]
นั่นคือในขณะที่คนมัธยฐานอาจเร็วกว่าผู้หญิงมัธยฐาน แต่ก็มีความเป็นไปได้ที่จะมีตัวอย่างของเวลา (หรือการกระจายครั้งต่อเนื่องสำหรับเรื่องนั้น) ซึ่งโอกาสที่ผู้ชายแบบสุ่มจะเร็วกว่าผู้หญิงแบบสุ่มคือน้อยกว่า12. ในตัวอย่างขนาดใหญ่สิ่งบ่งชี้ตรงกันข้ามสองตัวสามารถมีความหมายได้
ตัวอย่าง:
ชุดข้อมูล A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
ชุดข้อมูล B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
ชุดข้อมูล C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(ข้อมูลอยู่ที่นี่แต่ถูกใช้เพื่อจุดประสงค์อื่นที่นั่น - สำหรับความทรงจำของฉันฉันสร้างสิ่งนี้ด้วยตัวเอง)
โปรดทราบว่าสัดส่วนของ <B's คือ 2/3 สัดส่วนของ A <C คือ 5/9 และสัดส่วนของ B <C คือ 2/3 ทั้ง A กับ B และ B กับ C มีนัยสำคัญที่ระดับ 5% แต่เราสามารถบรรลุระดับความสำคัญใด ๆ เพียงแค่เพิ่มสำเนาตัวอย่างที่เพียงพอ เราสามารถหลีกเลี่ยงความสัมพันธ์ได้ด้วยการทำซ้ำตัวอย่าง แต่เพิ่มความกระวนกระวายใจอย่างพอเพียง (เล็กกว่าช่องว่างที่เล็กที่สุดระหว่างคะแนน)
ค่ามัธยฐานตัวอย่างไปในทิศทางอื่น: ค่ามัธยฐาน (A)> ค่ามัธยฐาน (B)> ค่ามัธยฐาน (C)
เราสามารถบรรลุความสำคัญอีกครั้งสำหรับการเปรียบเทียบค่ามัธยฐาน - ถึงระดับความสำคัญใด ๆ - โดยการทำซ้ำตัวอย่าง
เพื่อเชื่อมโยงกับปัญหาปัจจุบันลองจินตนาการว่า A คือ "เวลาของผู้หญิง" และ B คือ "เวลาของผู้ชาย" จากนั้นค่ามัธยฐานของผู้ชายจะเร็วขึ้น แต่คนที่เลือกแบบสุ่มจะ 2/3 ของเวลานั้นช้ากว่าผู้หญิงที่ถูกสุ่มเลือก
รับคิวของเราจากตัวอย่าง A และ C เราสามารถสร้างชุดข้อมูลที่ใหญ่ขึ้น (ใน R) ดังนี้:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
ค่ามัธยฐานของ F จะอยู่ที่ประมาณ 16.25 ในขณะที่ค่ามัธยฐานของ M จะอยู่ที่ประมาณ 11.25 แต่สัดส่วนของกรณีที่ F <M จะเท่ากับ 5/9
[ถ้าเราแทนที่ n / 3 ด้วยตัวแปรทวินามด้วยพารามิเตอร์ n และ 13
เราจะสุ่มตัวอย่างจากประชากรที่ค่ามัธยฐานของการกระจายตัวของ F อยู่ที่ 16.25 ในขณะที่ค่ามัธยฐานของการกระจายตัวของ M อยู่ที่ 11.25 ความน่าจะเป็นที่ F <M จะอยู่ที่ 5/9 อีกครั้ง]
ทราบด้วยว่า P( F< med ( M) ) =23 และ P( M> med ( F) ) =23 ในขณะที่ ยา( M) < med ( F) (ตามระยะทางที่สำคัญ)