ทำไมความจริงที่ว่า 1 มัธยฐานต่ำกว่าค่ามัธยฐานอื่นหมายความว่าส่วนใหญ่ในกลุ่ม 1 ต่ำกว่าในกลุ่มที่ 2 มากที่สุด?


9

ฉันเชื่อว่ากล่องสี่เหลี่ยมด้านล่างอาจตีความได้ว่า "ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่" (ในชุดข้อมูลนี้) ส่วนใหญ่เป็นเพราะเวลาเฉลี่ยของผู้ชายต่ำกว่าเวลาเฉลี่ยของผู้หญิง แต่หลักสูตร EdX สำหรับแบบทดสอบ R และสถิติบอกฉันว่าไม่ถูกต้อง โปรดช่วยฉันเข้าใจว่าทำไมปรีชาของฉันไม่ถูกต้อง

นี่คือคำถาม:

ลองพิจารณาตัวอย่างของนักสำเร็จจากนิวยอร์กซิตี้มาราธอนในปี 2002 ชุดข้อมูลนี้สามารถพบได้ในแพคเกจ UsingR โหลดไลบรารีจากนั้นโหลดชุดข้อมูล nym.2002

library(dplyr)
data(nym.2002, package="UsingR")

ใช้บ็อกซ์พล็อตและฮิสโทแกรมเพื่อเปรียบเทียบเวลาสิ้นสุดของชายและหญิง ข้อใดต่อไปนี้อธิบายความแตกต่างได้ดีที่สุด

  1. เพศชายและเพศหญิงมีการกระจายตัวเหมือนกัน
  2. ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่
  3. ตัวผู้และตัวเมียมีการแจกแจงเบ้คล้ายกันกับแบบก่อนหน้านี้, 20 นาทีเปลี่ยนไปทางซ้าย
  4. การแจกแจงทั้งสองแบบจะกระจายตามปกติโดยมีความแตกต่างในค่าเฉลี่ยประมาณ 30 นาที

ที่นี่เวลา NYC มาราธอนสำหรับชายและหญิงเป็น quantiles, histograms และ boxplots:

# Men's time quantile
      0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
      0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

ชายและหญิงครั้ง - ฮิสโตแกรม

ชายและหญิงครั้ง - boxplot


ในการตรวจสอบการแจกแจงแบบเดียวกันด้วยสายตาฮิสโทแกรมของคุณควรใช้โดเมน x และถังขยะเดียวกันในขณะที่แกน y ควรแสดงความถี่สัมพัทธ์ ขนาดของถังขยะจะได้ประโยชน์จากความละเอียดที่สูงขึ้นเช่น 25 หรือ 50 นาที นอกจากนี้บนทั้งบ็อกซ์พล็อตและฮิสโทแกรมให้วาดค่ามัธยฐาน (มีอยู่ในกล่องแล้ว), ค่าเฉลี่ยและโหมด
g3o2

ตอบคำถามจากชื่อเรื่อง: พิจารณาการแจกแจงแบบสม่ำเสมอ {0,3} และ {2}. ค่ามัธยฐานของหลังมีขนาดใหญ่กว่า แต่ได้รับการสุ่มจากแต่ละความน่าจะเป็นที่สองมีขนาดใหญ่เท่ากับที่เล็กกว่า (0.5) ดังนั้นถ้าคุณนิยาม "ส่วนใหญ่จะใหญ่กว่า" โดย "ให้ตัวอย่างสุ่มสองค่า X และ Y หนึ่งค่าจากแต่ละตัวอย่างP(X>Y)>0.5"ความสัมพันธ์ระหว่างค่ามัธยฐานของ X และ Y ไม่ได้พูดถึงมันมากนัก
AlexR

คำตอบ:


7

ฉันคิดว่าเหตุผลที่คุณทำเครื่องหมายว่าไม่ถูกต้องนั้นไม่มากที่คำตอบที่คุณให้กับคำถามหลายคำนั้นผิด แต่ตัวเลือกที่ 3 "ชายและหญิงมีการแจกแจงเบ้คล้ายกันกับอดีต 20 นาทีเปลี่ยนไปทางซ้าย" จะเป็นทางเลือกที่ดีกว่าเนื่องจากเป็นข้อมูลที่มากขึ้นตามข้อมูลที่ให้ไว้


ฉันเห็นด้วยกับคำอธิบายนี้ นอกจากนี้ "เร็วกว่าที่สุด" ก็คลุมเครือเช่นกัน แม้จะมีคำตอบของ @glen_b แต่ฉันก็คาดหวังว่าจะมีการแยกกล่องแปลงสำหรับภาษาประเภทนี้มากขึ้น เช่นเดียวกับ "ผู้ชายทั้งหมด 75% นั้นเร็วกว่าผู้หญิง 75%" ซึ่งฉันคิดว่าน่าจะแปลเป็น 75% ของบุรุษในเวลาต่ำกว่า 25% ของผู้หญิง แต่ภาษานั้นคลุมเครือ
Sal Mangiafico

1
นอกจากนี้ยังได้รับหลักการของการทดสอบแบบปรนัย: เลือกคำตอบที่ดีที่สุดเสมอ
Sal Mangiafico

เรื่องนี้ทำให้รู้สึก; ไม่ใช่ตัวเลือกอื่นคือผิด แต่ตัวเลือกที่ถูกต้อง ("ตัวผู้และตัวเมียมีการแจกแจงเบ้คล้ายกันกับที่ผ่านมาในอดีต 20 นาทีเปลี่ยนไปทางซ้าย") เป็นจริง อย่างไรก็ตามฉันไม่เห็นการเปลี่ยนแปลงฮิสโทแกรมในเวลา 20 นาที ดูเหมือนว่าฉันจะเปลี่ยนเป็น 50 นาที เนื่องจากฉันมีโอกาสสองครั้งฉันได้รับคำถามที่ถูกต้อง FWIW :-)
ยี่หร่า

@ ยี่หร่า: ฉันไม่แน่ใจว่าถูกต้องจริง "ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่" คลุมเครือว่า "ที่สุด" หมายถึงอะไร - ฉันไม่เชื่อว่าฉันเคยเห็นคำจำกัดความที่เข้มงวดและโดยสังหรณ์ใจมักจะมีความหมายมากกว่า 50% (อาจเป็น 70% +) . หากพวกเขาพูดว่า "ส่วนใหญ่" ก็อาจจะชัดเจนกว่า
user541686

9

นี่คือตัวอย่างที่เล็กที่สุดที่ฉันสามารถหาได้:

A 1,4,10;  B 0,6,9

  • A ( [1, 4, 10])และB ( [0, 6, 9]) มีค่าเฉลี่ยเท่ากัน ( 5)

  • Bมีค่ามัธยฐานที่ใหญ่กว่า ( 6) มากกว่าA ( 4)

  • มีความน่าจะเป็น 5/9 ว่าองค์ประกอบAสุ่มมีขนาดใหญ่กว่าองค์ประกอบBสุ่ม

นี่เป็นอีกตัวอย่างหนึ่งที่มี 4 องค์ประกอบ:

A 1,1,3,10;  B 0,0,6,9


7

"ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่" อาจจะคลุมเครือเล็กน้อย แต่โดยปกติแล้วฉันจะตีความเจตนาของมันว่าถ้าเราดูที่การสุ่มตัวอย่างแบบสุ่มเวลาส่วนใหญ่ผู้ชายจะเร็วขึ้น - เช่น P(Mผม<FJ)>12 สำหรับการสุ่ม ผม,J (ในกรณีที่ Mผม ถึงเวลาแล้ว ผมชายคนที่เป็นต้น)

แน่นอนว่าการตีความวลีอื่น ๆ นั้นเป็นไปได้ (นั่นคือความกำกวม) และความเป็นไปได้อื่น ๆ เหล่านั้นอาจสอดคล้องกับเหตุผลของคุณ

[เรายังมีปัญหาว่าเรากำลังพูดถึงตัวอย่างหรือประชากร ... "ผู้ชายส่วนใหญ่ [... ] ผู้หญิงส่วนใหญ่" ดูเหมือนว่าจะเป็นคำแถลงประชากร (ประมาณประชากรที่มีศักยภาพ) แต่เราสังเกตเวลาเท่านั้น ที่เราดูเหมือนจะปฏิบัติต่อเป็นตัวอย่างดังนั้นเราจึงต้องระมัดระวังด้วยวิธีที่เราเรียกร้องในวงกว้าง]

สังเกตได้ว่า P(Mผม<FJ)>12 ไม่ได้บอกเป็นนัยโดย M~<F~. พวกเขาสามารถไปในทิศทางตรงกันข้าม

[ฉันไม่ได้บอกว่าคุณคิดผิดว่าสัดส่วนของคู่เอ็มเอฟสุ่มที่ชายนั้นเร็วกว่าผู้หญิงมากกว่า 1/2 - คุณเกือบถูกต้องแน่นอน ฉันแค่บอกว่าคุณไม่สามารถบอกได้โดยการเปรียบเทียบค่ามัธยฐาน คุณไม่สามารถบอกได้โดยดูที่สัดส่วนในแต่ละตัวอย่างด้านบนหรือด้านล่างค่ามัธยฐานของตัวอย่างอื่น คุณจะต้องทำการเปรียบเทียบที่แตกต่างกัน]

นั่นคือในขณะที่คนมัธยฐานอาจเร็วกว่าผู้หญิงมัธยฐาน แต่ก็มีความเป็นไปได้ที่จะมีตัวอย่างของเวลา (หรือการกระจายครั้งต่อเนื่องสำหรับเรื่องนั้น) ซึ่งโอกาสที่ผู้ชายแบบสุ่มจะเร็วกว่าผู้หญิงแบบสุ่มคือน้อยกว่า12. ในตัวอย่างขนาดใหญ่สิ่งบ่งชี้ตรงกันข้ามสองตัวสามารถมีความหมายได้


ตัวอย่าง:

ชุดข้อมูล A:

 1.58  2.10 16.64 17.34 18.74 19.90  1.53  2.78 16.48 17.53 18.57 19.05
 1.64  2.01 16.79 17.10 18.14 19.70  1.25  2.73 16.19 17.76 18.82 19.08
 1.42  2.56 16.73 17.01 18.86 19.98

ชุดข้อมูล B:

 3.35  4.62  5.03 20.97 21.25 22.92  3.12  4.83  5.29 20.82 21.64 22.06
 3.39  4.67  5.34 20.52 21.10 22.29  3.38  4.96  5.70 20.45 21.67 22.89
 3.44  4.13  6.00 20.85 21.82 22.05

ชุดข้อมูล C:

 6.63  7.92  8.15  9.97 23.34 24.70  6.40  7.54  8.24  9.37 23.33 24.26
 6.18  7.74  8.63  9.62 23.07 24.80  6.54  7.37  8.37  9.09 23.22 24.16
 6.57  7.58  8.81  9.08 23.43 24.45

(ข้อมูลอยู่ที่นี่แต่ถูกใช้เพื่อจุดประสงค์อื่นที่นั่น - สำหรับความทรงจำของฉันฉันสร้างสิ่งนี้ด้วยตัวเอง)

โปรดทราบว่าสัดส่วนของ <B's คือ 2/3 สัดส่วนของ A <C คือ 5/9 และสัดส่วนของ B <C คือ 2/3 ทั้ง A กับ B และ B กับ C มีนัยสำคัญที่ระดับ 5% แต่เราสามารถบรรลุระดับความสำคัญใด ๆ เพียงแค่เพิ่มสำเนาตัวอย่างที่เพียงพอ เราสามารถหลีกเลี่ยงความสัมพันธ์ได้ด้วยการทำซ้ำตัวอย่าง แต่เพิ่มความกระวนกระวายใจอย่างพอเพียง (เล็กกว่าช่องว่างที่เล็กที่สุดระหว่างคะแนน)

ค่ามัธยฐานตัวอย่างไปในทิศทางอื่น: ค่ามัธยฐาน (A)> ค่ามัธยฐาน (B)> ค่ามัธยฐาน (C)

เราสามารถบรรลุความสำคัญอีกครั้งสำหรับการเปรียบเทียบค่ามัธยฐาน - ถึงระดับความสำคัญใด ๆ - โดยการทำซ้ำตัวอย่าง

แผนภูมิตัวอย่างของ A, B และ C ที่มีค่ามัธยฐานระบุไว้ในการแสดง P (A <B) ในทิศทางตรงกันข้ามกับค่ามัธยฐาน ฯลฯ

เพื่อเชื่อมโยงกับปัญหาปัจจุบันลองจินตนาการว่า A คือ "เวลาของผู้หญิง" และ B คือ "เวลาของผู้ชาย" จากนั้นค่ามัธยฐานของผู้ชายจะเร็วขึ้น แต่คนที่เลือกแบบสุ่มจะ 2/3 ของเวลานั้นช้ากว่าผู้หญิงที่ถูกสุ่มเลือก

รับคิวของเราจากตัวอย่าง A และ C เราสามารถสร้างชุดข้อมูลที่ใหญ่ขึ้น (ใน R) ดังนี้:

n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))

ค่ามัธยฐานของ F จะอยู่ที่ประมาณ 16.25 ในขณะที่ค่ามัธยฐานของ M จะอยู่ที่ประมาณ 11.25 แต่สัดส่วนของกรณีที่ F <M จะเท่ากับ 5/9

[ถ้าเราแทนที่ n / 3 ด้วยตัวแปรทวินามด้วยพารามิเตอร์ n และ 13 เราจะสุ่มตัวอย่างจากประชากรที่ค่ามัธยฐานของการกระจายตัวของ F อยู่ที่ 16.25 ในขณะที่ค่ามัธยฐานของการกระจายตัวของ M อยู่ที่ 11.25 ความน่าจะเป็นที่ F <M จะอยู่ที่ 5/9 อีกครั้ง]

ทราบด้วยว่า P(F<med(M))=23 และ P(M>med(F))=23 ในขณะที่ med(M)<med(F) (ตามระยะทางที่สำคัญ)


ฉันสามารถดูว่าค่าเฉลี่ยสามารถไปในทิศทางตรงกันข้ามได้อย่างไร แต่ฉันจะยอมรับสัญชาติญาณของฉันที่นี่ตรงกับ OP ฉันไม่เห็นว่าคนมัธยฐานสามารถทำได้อย่างไร (นอกเหนือจากปัญหาการสุ่มตัวอย่างผิดพลาด)
gung - Reinstate Monica

@gung ฉันมีตัวอย่าง ฉันชอบทิ่มแทงสัญชาตญาณเริ่มต้นของฉันด้วยวิธีนี้ - โดยการหาคู่ตัวอย่างให้พวกเขา ถ้าฉันเจอมากกว่านี้ (ฉันเชื่อว่าฉันมีที่อื่น) ฉันจะพยายามพูดถึงพวกเขา
Glen_b -Reinstate Monica

พล็อตบ็อกซ์ในคำถามกำเนิดแสดงให้เห็นว่าประมาณ 60-65% (โดยลูกตา) ของผู้ชายมีเวลาน้อยกว่าเวลาเฉลี่ยสำหรับผู้หญิง (เช่นน้อยกว่าเวลาสำหรับ 50% ของผู้หญิง) นั่นคือชิ้นส่วนที่ฉันต้องการอธิบาย
ยี่หร่า

@cumin ในตัวอย่าง A และ C ของฉันด้านบน 2/3 ของ C นั้นน้อยกว่าค่ามัธยฐานสำหรับ A (C ส่วนใหญ่จะเร็วกว่าค่ามัธยฐาน A) ในขณะที่ P(Aผม<J) สำหรับการสุ่ม ผม,Jมีค่าประมาณ 56% (ส่วนใหญ่เป็นการสุ่ม A ชนะ a สุ่ม C) [ฉันไม่คิดว่าข้อสรุปของคุณไม่ถูกต้องจริง ๆ แล้วเกี่ยวกับข้อมูลของคุณมันเป็นเพียงข้อมูลชิ้นนี้เท่านั้นที่จะไม่เพียงพอที่จะสร้างมันขึ้นมา] - ฉันได้ทำการแก้ไขเล็กน้อยในตอนท้ายของโพสต์เกี่ยวกับเรื่องนั้น การเปรียบเทียบ ฉันคิดว่ามันยากมากที่จะจับคู่รายละเอียดในฮิสโตแกรมและ
บ็อกซ์พล็อต

3
ฉันจะตีความวลีที่ว่า "ผู้ชายส่วนใหญ่เร็วกว่าผู้หญิงส่วนใหญ่" เนื่องจาก "อย่างน้อย 50% ของผู้ชายจะเร็วกว่าผู้หญิงอย่างน้อย 50%" กล่าวอีกนัยหนึ่ง: ให้ผู้ชาย X มันสมเหตุสมผลที่จะถามว่า X นั้นเร็วกว่าผู้หญิง 50% หรือไม่ สำหรับฉันแล้วการอ้างสิทธิ์บอกว่าอย่างน้อย 50% ของผู้ชายมีคุณสมบัตินี้ (ฉันคิดว่า) นี้เป็น TRUE ถ้าคนมัธยฐานเร็วกว่าผู้หญิงมัธยฐานเนื่องจาก 50% ของผู้ชายจะเร็วกว่าชายมัธยฐานซึ่งเร็วกว่าผู้หญิงมัธยฐานซึ่งเร็วกว่าผู้หญิง 50% (แต่ขอให้สังเกตว่านี่ครอบคลุม 25% ของคู่ชาย - หญิงเท่านั้นซึ่งฉันคิดว่าจะอธิบายตัวอย่างที่ดีของคุณ)
mathmandan

3

ตัวเลขต่อไปนี้นำมาจากโพสต์บล็อกนี้ซึ่งแสดงให้เห็นถึงการใช้งานจริงที่สำคัญของแนวคิดเหล่านี้

การกำหนดมาตรฐานให้อุปกรณ์ที่มีประสิทธิภาพสำหรับการเปรียบเทียบ 2 ดิสทริบิวชัน ตัวเลข 3 ตัวอย่างต่อไปนี้เปรียบเทียบความสูงของเด็กชายและเด็กหญิงอายุ 130 เดือนจากโครงการตรวจวัดระดับเด็กแห่งชาติของอังกฤษ (NCMP) (นี่คืออายุที่เป็นกิริยาช่วยในชุดข้อมูลนี้ฉันเลือกเพียงเพื่อให้ได้รับข้อมูลมากที่สุดและดังนั้นแผนการที่ราบรื่นที่สุดภายในกลุ่มอายุเดียว)

รูปที่ 1: ความสูงของเด็กชายและเด็กหญิงอายุ 130 เดือนจากโครงการตรวจเด็กแห่งชาติของอังกฤษ (NCMP)

รูปที่ 1: ความสูงของเด็กชายและเด็กหญิงอายุ 130 เดือนจากโครงการตรวจเด็กแห่งชาติของอังกฤษ (NCMP)

รูปที่ 2: เปอร์เซ็นต์ความสูงสำหรับเด็กชายและเด็กหญิงอายุ 130 เดือน  ที่มา: English NCMP

รูปที่ 2:เปอร์เซ็นต์ความสูงสำหรับเด็กชายและเด็กหญิงอายุ 130 เดือน ที่มา: English NCMP

รูปที่ 3: การกระจายของความสูงของเด็กหญิงอายุ 130 เดือนที่สัมพันธ์กับเด็กชายในวัยเดียวกัน

รูปที่ 3: การกระจายของความสูงของเด็กหญิงอายุ 130 เดือนที่สัมพันธ์กับเด็กชายในวัยเดียวกัน

ในช่วงสุดท้ายของตัวเลขเหล่านี้การเปรียบเทียบความสูงได้มาตรฐานตามความสูงของเด็กผู้ชาย ดังนั้นการอ่านตามเส้นสีเทาประในรูปที่ 3 คุณสามารถสร้างข้อความเช่น:

  • ค่ามัธยฐาน (เช่นความสูง 50 เปอร์เซ็นไทล์) สำหรับเด็กผู้ชายนั้นเป็นเพียงประมาณร้อยละ 45 สำหรับผู้หญิง ดังนั้น 100% - 45% = 55% ของผู้หญิงสูงกว่าค่ามัธยฐานของเด็ก
  • ความสูงควอไทล์อันดับหนึ่ง (เปอร์เซ็นไทล์ที่ 75) สำหรับเด็กผู้หญิงนั้นควอไทล์อันดับสูงสุด (เปอร์เซ็นไทล์ 80th) สำหรับเด็กผู้ชาย ดังนั้นในเด็กอายุ 130 มอสผู้หญิงที่สูงกว่า 3 จาก 4 สาวก็สูงกว่า 4 จาก 5 เด็กชาย

จุดหนึ่งของความสับสนที่เป็นไปได้ในพล็อตนี้ไม่สมควรพูดถึง แม้ว่าเส้น 45 °ของเด็กชายจะสูงกว่าโครงโค้งสีม่วงของหญิงสาว แต่การสังเกตนี้สอดคล้องกับความจริงที่รู้จักกันดีว่าในยุคนี้ . โปรดทราบว่าความสูงนี้จะสะท้อนอย่างถูกต้องในความจริงที่ว่าเส้นโค้งสีม่วงแดงเลื่อนไปทางขวาเมื่อเทียบกับเส้นสีฟ้า

วิธีการนี้ค่อนข้างทั่วไป ภายใต้การเปรียบเทียบดังกล่าวหนึ่งในกลุ่ม - กลุ่มที่คุณสร้างมาตรฐาน - จะกลายเป็นเส้น 45 ° กลุ่มอื่น ๆโดยทั่วไปอาจเป็นเส้นโค้งที่เพิ่มขึ้นโมโนโทนใด ๆ ที่ดึงจากซ้ายล่างถึงขวาบน โดยมีเงื่อนไขว่าการแจกแจงพื้นฐานเป็นแบบต่อเนื่อง (ความหนาแน่นขาดมวลจุด) เส้นโค้งที่เปรียบเทียบจะต่อเนื่อง หากความหนาแน่นพื้นฐานใช้การสนับสนุนเดียวกันเส้นโค้งจะต้องวิ่งออกมา(0,0) ถึง (1,1).

ตอนนี้คำถามเดิมของคุณสามารถสร้างใหม่ได้ในแง่เรขาคณิตเป็นคำถามเกี่ยวกับว่าคุณสามารถวาดเส้นโค้งสีม่วงแดงของรูปที่ 3 เพื่อที่จะบรรลุพร้อมกัน (a) ความสัมพันธ์ที่ถูกกำหนดระหว่าง medians และ (b) ความสัมพันธ์ที่เข้าใจยากเล็กน้อย @Glen_b อธิบายอย่างชัดเจน (ถูกต้องฉันเชื่อ) ในคำตอบของเขา ฉันสงสัยว่าการไม่ต่อเนื่องแบบกระจาย (จุดจำนวนมากในความหนาแน่น) อาจเปิดใช้งานกรณี 'พยาธิวิทยา' หรือไม่ ฉันเดาว่ากรณีทางพยาธิวิทยาใด ๆ จะเป็น 'ข้อยกเว้นที่พิสูจน์กฎ'


หากเราใช้การตอบคำถามแบบตรงไปตรงมาที่สุดการแปลอย่างมีเหตุผลของคุณให้เป็นภาษาทางการที่ตอบสนองต่อการวิเคราะห์มากขึ้นแล้ว (โดยใช้การตั้งค่าความสูงของเด็กจากด้านบน) เราอาจต้องการพูดถึงบุคคล x TMB มีคุณสมบัติถ้า xเป็นเสื้อ aller กว่าเมตร ost oys จากนั้นคำถามตอบคำถามของคุณถามว่าผู้หญิงส่วนใหญ่มีคุณสมบัติ TMBหรือไม่ ถ้าใครนิยาม 'ส่วนใหญ่' ให้หมายถึงมากกว่าครึ่งแล้วการมีคุณสมบัติ TMB หมายถึงสูงกว่าเด็กผู้ชายที่มีค่ามัธยฐาน การถามว่าผู้หญิงส่วนใหญ่มีคุณสมบัติ TMB หรือไม่นั้นมีจำนวนเท่ากับการถามว่าหญิงสาวมีค่ามัธยฐานหรือไม่ ในบัญชีนี้คำตอบสำหรับคำถามแบบทดสอบจะใช่

ในทางกลับกันหากความตั้งใจที่แท้จริงของ 'มากที่สุด' คือ "> 50%" หนึ่งอาจคาดหวังว่าวลีส่วนใหญ่ "แม่นยำ" ส่วนใหญ่จะได้รับการว่าจ้าง ถ้าใครบางคนบอกฉันบางอย่าง "อาจจะเกิดขึ้น" ฉันจะคิดว่าความน่าจะเป็นอัตวิสัยที่ 60% หรือมากกว่านั้นถูกพาดพิงถึง สำหรับฉัน "ส่วนใหญ่" หมายถึงบางสิ่งบางอย่างที่มากขึ้นเช่น 70–80% เห็นได้ชัดว่าจากพล็อตข้างต้นหาก 'ส่วนใหญ่' เป็นเกณฑ์ที่เข้มงวดกว่า 52.5% คุณจะไม่สามารถพูดว่า "เด็กผู้หญิงส่วนใหญ่ [มีทรัพย์สินที่พวกเขา] สูงกว่าเด็กผู้ชายส่วนใหญ่" ฉันสงสัยว่าเหตุผลส่วนหนึ่งของคำถามคำถามคือเพื่อกระตุ้นการตรวจคำที่เกี่ยวข้องกับความคิดเชิงตัวเลข (ถ้าคุณคิดว่ามันโง่ไปหน่อยลองพิจารณาดูกราฟเหล่านี้ดูแสดงให้เห็นว่าผู้คนมีแนวโน้มที่จะตีความคำและวลีที่น่าจะเป็นไปได้ที่แตกต่างกัน) บางทีความตั้งใจก็เพื่อเน้นจุดที่มีการเปลี่ยนแปลงมากมายในการแจกแจงในโลกแห่งความเป็นจริงและสถิติเดียว (มัธยฐานหมายถึง คุณ) ไม่ค่อยสนับสนุนงบที่กว้างขวางและกว้างไกล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.