ฉันจะทำวิศวกรรมย้อนกลับจากประสบการณ์กับกรณีการเลือกปฏิบัติ ฉันสามารถกำหนดได้ว่าค่าของ "หนึ่งใน 741" ฯลฯมาจากไหน อย่างไรก็ตามข้อมูลจำนวนมากหายไปในการแปลว่าการสร้างที่เหลือของฉันขึ้นอยู่กับการได้เห็นว่าผู้คนทำสถิติในการตั้งค่าห้องพิจารณาคดี ฉันสามารถเดาได้จากรายละเอียดบางอย่างเท่านั้น
ตั้งแต่เวลากฎหมายต่อต้านการเลือกปฏิบัติที่ถูกส่งผ่านไปในปี 1960 (ชื่อ VI), สนามในประเทศสหรัฐอเมริกาได้เรียนรู้ที่จะดูที่ค่า P-และเปรียบเทียบกับเกณฑ์ของและ0.01 พวกเขายังเรียนรู้ที่จะดูเอฟเฟ็คที่เป็นมาตรฐานซึ่งโดยทั่วไปจะเรียกว่า "การเบี่ยงเบนมาตรฐาน" และเปรียบเทียบกับเกณฑ์ "การเบี่ยงเบนมาตรฐานสองถึงสาม" เพื่อสร้างกรณีเบื้องต้นสำหรับชุดการเลือกปฏิบัติโจทก์มักจะพยายามคำนวณทางสถิติแสดง "ผลกระทบที่แตกต่างกัน" ที่เกินเกณฑ์เหล่านี้ หากไม่สามารถรองรับการคำนวณดังกล่าวได้มักจะไม่สามารถดำเนินการล่วงหน้าได้0.050.01
ผู้เชี่ยวชาญทางสถิติสำหรับโจทก์มักจะพยายามที่จะวลีผลลัพธ์ของพวกเขาในแง่ที่คุ้นเคยเหล่านี้ ผู้เชี่ยวชาญบางคนทำการทดสอบทางสถิติซึ่งสมมติฐานว่างเป็นการแสดงออกว่า "ไม่มีผลกระทบเชิงลบ" โดยสมมติว่าการตัดสินใจจ้างงานนั้นเป็นการสุ่มและไม่ได้รับการปกครองจากลักษณะอื่นใดของพนักงาน (ไม่ว่าจะเป็นทางเลือกเดียวหรือสองทางขึ้นอยู่กับผู้เชี่ยวชาญและสถานการณ์) พวกเขาแปลงค่า p-value ของการทดสอบนี้เป็นจำนวน "ส่วนเบี่ยงเบนมาตรฐาน" โดยอ้างอิงจากการแจกแจงแบบปกติมาตรฐาน - - แม้ว่ามาตรฐานปกติจะไม่เกี่ยวข้องกับการทดสอบดั้งเดิม ในวงเวียนนี้พวกเขาหวังว่าจะได้ข้อสรุปที่ชัดเจนถึงผู้ตัดสิน
การทดสอบที่ชื่นชอบสำหรับข้อมูลที่สามารถสรุปในตารางฉุกเฉินคือการทดสอบที่แน่นอนของฟิชเชอร์ การเกิดขึ้นของ "ที่แน่นอน" ในชื่อของมันเป็นที่พอใจโดยเฉพาะอย่างยิ่งแก่โจทก์เพราะมันหมายถึงการตัดสินใจทางสถิติที่ได้รับการทำโดยไม่มีข้อผิดพลาด (สิ่งที่อาจจะเป็น!)
นี่คือการคำนวณของฉันสำหรับการคำนวณของกระทรวงแรงงาน
พวกเขาใช้การทดสอบที่แม่นยำของฟิชเชอร์หรืออะไรทำนองนั้น (เช่นการทดสอบโดยมีค่า p ที่กำหนดโดยการสุ่ม) การทดสอบนี้ถือว่าการแจกแจงแบบไฮเพอร์เมตริกซ์ตามที่อธิบายไว้ในคำตอบของ Matthew Gunn (สำหรับคนจำนวนน้อยที่มีส่วนร่วมในการร้องเรียนนี้การกระจาย hypergeometric นั้นไม่ได้รับการประมาณโดยการแจกแจงแบบปกติ)χ2
พวกเขาแปลงค่า p-value เป็นคะแนน Z ปกติ ("จำนวนส่วนเบี่ยงเบนมาตรฐาน")
พวกเขาปัดเศษคะแนน Z เป็นจำนวนเต็มที่ใกล้ที่สุด: "เกินสามส่วนเบี่ยงเบนมาตรฐาน" "เกินห้าส่วนเบี่ยงเบนมาตรฐาน" และ "เกินกว่าเบี่ยงเบนมาตรฐานหกส่วน" (เพราะบางส่วนของเหล่า Z-คะแนนอ้อมขึ้นเพื่อเบี่ยงเบนมาตรฐานมากขึ้นผมไม่สามารถแสดงให้เห็นถึง "เกิน"; ทั้งหมดที่ฉันสามารถทำได้คือการพูดมัน.)
ในการร้องเรียนคะแนนอินทิกรัล Z ถูกแปลงกลับไปเป็นค่า p! ใช้การแจกแจงแบบปกติมาตรฐานอีกครั้ง
p-values เหล่านี้ถูกอธิบาย (เนื้อหาในลักษณะที่ทำให้เข้าใจผิด) ว่า "ความน่าจะเป็นที่ผลลัพธ์นี้เกิดขึ้นตามโอกาส"
1 /ความละเอียด 12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
นี่คือR
รหัสบางส่วนที่ใช้ในการคำนวณเหล่านี้
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))