มันเป็นสิ่งสำคัญที่จะต้องวางกรอบคำถามให้ถูกต้องและนำแบบจำลองเชิงแนวคิดที่มีประโยชน์มาใช้
คำถาม
เกณฑ์การโกงที่อาจเกิดขึ้นเช่น 55, 65 และ 85 เป็นที่ทราบกันดีว่าเป็นข้อมูลที่ไม่เกี่ยวข้อง: ไม่จำเป็นต้องพิจารณาจากข้อมูล (ดังนั้นนี่ไม่ใช่ปัญหาการตรวจหาค่าผิดปกติหรือปัญหาการกระจายสัญญาณที่เหมาะสม) การทดสอบควรประเมินหลักฐานว่าคะแนนบางส่วน (ไม่ใช่ทั้งหมด) น้อยกว่าขีด จำกัด เหล่านี้ถูกย้ายไปยังขีด จำกัด เหล่านั้น (หรืออาจมากกว่าขีด จำกัด เหล่านั้น)
รูปแบบความคิด
สำหรับโมเดลเชิงแนวคิดสิ่งสำคัญคือต้องเข้าใจว่าคะแนนไม่น่าจะมีการแจกแจงแบบปกติ (หรือการแจกแจงแบบพารามิเตอร์อื่น ๆ ได้ง่าย) ที่ชัดเจนอย่างมากในตัวอย่างที่โพสต์และในทุกๆ ตัวอย่างจากรายงานต้นฉบับ คะแนนเหล่านี้เป็นส่วนผสมของโรงเรียน แม้ว่าการแจกแจงภายในโรงเรียนใด ๆ เป็นเรื่องปกติ (ไม่ใช่พวกเขา) แต่ส่วนผสมไม่น่าจะเป็นปกติ
วิธีง่ายๆยอมรับว่ามีการแจกแจงคะแนนจริง: วิธีการที่จะรายงานยกเว้นการโกงรูปแบบนี้โดยเฉพาะ ดังนั้นจึงเป็นการตั้งค่าที่ไม่ใช่พารามิเตอร์ ดูเหมือนจะกว้างเกินไป แต่มีบางลักษณะของการแจกแจงคะแนนที่สามารถคาดการณ์หรือสังเกตได้ในข้อมูลจริง:
นับคะแนน , ฉันและฉัน+ 1จะมีความสัมพันธ์อย่างใกล้ชิด1 ≤ ฉัน≤ 99ฉัน- 1ผมฉัน+ 11 ≤ ฉัน≤ 99
จะมีการเปลี่ยนแปลงในจำนวนเหล่านี้เกี่ยวกับการแจกแจงคะแนนในอุดมคติที่ราบรื่น รูปแบบเหล่านี้โดยทั่วไปจะมีขนาดเท่ากับรากที่สองของการนับ
โกงเทียบกับเกณฑ์จะไม่ส่งผลกระทบต่อการนับคะแนนใด ๆฉัน≥ที ผลของมันคือสัดส่วนกับจำนวนของคะแนนแต่ละคะแนน (จำนวนนักเรียน "เสี่ยง" ที่ได้รับผลกระทบจากการโกง) สำหรับคะแนนฉันต่ำกว่าเกณฑ์นี้นับค( ฉัน)จะลดลงบางส่วนδ ( T - ฉัน) ค( ฉัน)และเงินจำนวนนี้จะถูกเพิ่มเข้าไปที( ฉัน )เสื้อฉัน≥ ทีผมc ( i )δ( t - i ) c ( i )t ( i )
จำนวนของการเปลี่ยนแปลงลดลงด้วยระยะห่างระหว่างคะแนนและเกณฑ์: เป็นฟังก์ชั่นการลดลงของฉัน= 1 , 2 , ...δ( i )i = 1 , 2 , ...
กำหนดเกณฑ์ , สมมติฐาน (ไม่มีโกง) คือδ ( 1 ) = 0หมายความδเป็นเหมือนกัน0 ทางเลือกคือที่δ ( 1 ) > 0เสื้อδ( 1 ) = 0δ0δ( 1 ) > 0
การสร้างแบบทดสอบ
สถิติทดสอบใดที่จะใช้ ตามสมมติฐานเหล่านี้ (a) ผลกระทบคือสารเติมแต่งในการนับและ (b) ผลกระทบที่ยิ่งใหญ่ที่สุดจะเกิดขึ้นรอบเกณฑ์ นี้แสดงให้เห็นความแตกต่างที่กำลังมองหาที่แรกของการนับ, ) การพิจารณาเพิ่มเติมชี้ให้เห็นอีกหนึ่งขั้นตอนต่อไป: ภายใต้สมมติฐานทางเลือกเราคาดว่าจะเห็นลำดับของการนับหดหู่ค่อยเป็นค่อยไปเมื่อคะแนนที่ฉันเข้าใกล้เกณฑ์tจากด้านล่างจากนั้น (i) การเปลี่ยนแปลงเชิงบวกขนาดใหญ่ที่tตามด้วย (ii) a การเปลี่ยนแปลงเชิงลบขนาดใหญ่ที่ค'( i ) = c ( i + 1 ) - c ( i )ผมเสื้อเสื้อ 1 เพื่อเพิ่มพลังของการทดสอบให้มากที่สุดเรามาดูความแตกต่างที่สองt + 1
ค''( i ) = c'( i + 1 ) - c'( i ) = c ( i + 2 ) - 2 c ( i + 1 ) + c ( i ) ,
เพราะที่สิ่งนี้จะรวมการปฏิเสธเชิงลบที่ใหญ่โตc ( t + 1 ) - c ( t )กับการลบของการเพิ่มเชิงบวกที่มีขนาดใหญ่c ( t ) - c ( t - 1 )ดังนั้นจึงขยายผลการโกง .i = t - 1c ( t + 1 ) - c ( t )c ( t ) - c ( t - 1 )
ฉันจะตั้งสมมติฐาน - และสิ่งนี้สามารถตรวจสอบได้ - ความสัมพันธ์แบบอนุกรมของจำนวนที่ใกล้กับธรณีประตูนั้นค่อนข้างเล็ก (ความสัมพันธ์แบบอนุกรมที่อื่นไม่เกี่ยวข้อง) นี่ก็หมายความว่าความแปรปรวนของมีค่าประมาณค''( t - 1 ) = c ( t + 1 ) - 2 c ( t ) + c ( t - 1 )
var ( c''( t - 1 ) ) ≈ var ( c ( t + 1 ) ) + ( - 2 )2var ( ค( T ) ) + var ( ค( T - 1 ) )
ก่อนหน้านี้ฉันแนะนำว่าสำหรับiทั้งหมด(บางสิ่งที่สามารถตรวจสอบได้) จากไหนvar ( c ( i ) ) ≈ c ( i )ผม
Z= c''( t - 1 ) / c ( t + 1 ) + 4 c ( t ) + c ( t - 1 )--------------------√
ควรมีความแปรปรวนของหน่วยโดยประมาณ สำหรับประชากรที่มีคะแนนจำนวนมาก (คนที่โพสต์ดูเหมือนว่าจะมีประมาณ 20,000 คน) เราสามารถคาดหวังการกระจายตัวแบบปกติประมาณเช่นกัน เนื่องจากเราคาดว่าจะมีค่าติดลบอย่างมากที่จะบ่งบอกถึงรูปแบบการโกงเราได้อย่างง่ายดายได้รับการทดสอบของขนาดα : เขียนΦสำหรับ CDF ของการกระจายปกติมาตรฐานปฏิเสธสมมติฐานของการไม่มีโกงที่เกณฑ์ทีเมื่อΦ ( Z ) < αค''( t - 1 )αΦเสื้อΦ ( z) < α
ตัวอย่าง
ตัวอย่างเช่นลองพิจารณาคะแนนการทดสอบจริงชุดนี้วาด iid จากส่วนผสมของการแจกแจงปกติสามแบบ:
t = 65δ( i ) = exp( - 2 ฉัน)
Zเสื้อ
Z
Z= - 4.19Φ ( z) = 0.0000136
Z
เมื่อใช้การทดสอบนี้กับหลาย ๆ เกณฑ์การปรับขนาด Bonferroni ของขนาดทดสอบจะเป็นการฉลาด การปรับเพิ่มเติมเมื่อใช้กับการทดสอบหลายรายการในเวลาเดียวกันก็เป็นความคิดที่ดีเช่นกัน
การประเมินผล
ZZ ง่ายมากการจำลองจะสามารถทำได้และดำเนินการอย่างรวดเร็ว