รูปแบบการตรวจจับการโกงในการสอบแบบหลายคำถาม


25

คำถาม:

ฉันมีข้อมูลเลขฐานสองสำหรับคำถามสอบ (ถูกต้อง / ไม่ถูกต้อง) บุคคลบางคนอาจเคยเข้าถึงชุดคำถามและคำตอบที่ถูกต้องมาก่อน ฉันไม่รู้ว่าใครเป็นใครหรืออะไร หากไม่มีการโกงคิดว่าฉันจะรูปแบบน่าจะเป็นของการตอบสนองที่ถูกต้องสำหรับรายการที่ผมเป็นล.โอก.ผมเสื้อ((พีผม=1|Z))=βผม+Zที่βผมแสดงให้เห็นถึงความยากลำบากคำถามและZคือความสามารถแฝงของแต่ละบุคคล นี่คือรูปแบบการตอบสนองข้อสอบที่ง่ายมากที่สามารถประมาณได้ด้วยฟังก์ชั่นเช่น Rasch LTM ของ () ในอาร์นอกจากนี้ยังมีการประมาณการZ J (ที่เจดัชนีบุคคล) ของตัวแปรแฝงฉันมีการเข้าถึงการประมาณการแยกต่างหากQของตัวแปรแฝงเดียวกันซึ่งได้มาจากชุดข้อมูลอื่นที่ไม่สามารถทำการโกงได้Z^JJQ^J

เป้าหมายคือการระบุบุคคลที่น่าจะถูกโกงและสิ่งของที่พวกเขาถูกโกง คุณอาจใช้แนวทางอะไรบ้าง? βฉันβ^ผม , ซีเจและQที่มีอยู่ทั้งหมดแม้จะเป็นครั้งแรกที่ทั้งสองจะมีอคติบางอย่างเกิดจากการโกง ตามหลักการแล้ววิธีแก้ปัญหาจะอยู่ในรูปแบบของการจัดกลุ่ม / การจัดกลุ่มความน่าจะเป็นแม้ว่าจะไม่จำเป็นก็ตาม แนวคิดเชิงปฏิบัติได้รับการต้อนรับอย่างสูงเช่นเดียวกับแนวทางที่เป็นทางการZ^JQ^J

จนถึงตอนนี้ผมได้มีการเปรียบเทียบความสัมพันธ์ของคะแนนคำถามสำหรับคู่ของบุคคลที่มีสูงขึ้นเมื่อเทียบกับที่ลดลงQเจ- ซีเจคะแนน (ที่Qเจ- ซีเจเป็นดัชนีคร่าวๆของความน่าจะเป็นว่าพวกเขาโกง) ตัวอย่างเช่นผมเรียงบุคคลโดยQเจ- ซีเจแล้วพล็อตความสัมพันธ์ของคู่ต่อเนื่องของบุคคลคะแนนคำถาม ฉันยังพยายามวางแผนความสัมพันธ์เฉลี่ยของคะแนนสำหรับบุคคลที่มีคิวเจ- ซีเจQ^J-Z^JQ^J-Z^JQ^J-Z^JQ^J-Z^Jมีค่ามากกว่า quantile ของQเจ- ซีเจเป็นหน้าที่ของn ไม่มีรูปแบบที่ชัดเจนสำหรับทั้งสองวิธีnเสื้อชั่วโมงQ^J-Z^Jn


UPDATE:

ฉันสิ้นสุดการรวมแนวคิดจาก @SheldonCooper และกระดาษ Freakonomics ที่เป็นประโยชน์ที่ @whuber ชี้ให้ฉันเห็น ความคิด / ความเห็น / วิจารณ์อื่น ๆ ยินดีต้อนรับ

Let เป็นคนที่ j ‘s คะแนนไบนารีกับคำถามฉัน ประมาณรูปแบบการตอบสนองรายการl o g ฉันt ( P r ( X ฉันj = 1 | z j ) = β ฉัน + z jโดยที่β ฉันเป็นพารามิเตอร์ความง่ายของรายการและz jเป็นตัวแปรความสามารถแฝง (เพิ่มเติม แบบจำลองที่ซับซ้อนสามารถทดแทนได้ฉันใช้ 2PL ในแอปพลิเคชันของฉัน) ตามที่ฉันพูดถึงในโพสต์ดั้งเดิมของฉันฉันมีการประมาณการXผมJJผม

ล.โอก.ผมเสื้อ(PR(XผมJ=1|ZJ)=βผม+ZJ,
βผมZJของตัวแปรความสามารถจากชุดข้อมูลที่แยกต่างหาก{yij}(รายการที่แตกต่างกัน, บุคคลเดียวกัน) ที่ไม่สามารถโกงได้ โดยเฉพาะ ^ q jเป็นค่าประมาณแบบเบย์เชิงประจักษ์จากแบบจำลองการตอบสนองไอเท็มเดียวกันกับด้านบนQJ^{YผมJ}QJ^

ความน่าจะเป็นของคะแนนที่สังเกตได้ , เงื่อนไขเกี่ยวกับความง่ายของรายการและความสามารถของบุคคล, สามารถเขียนได้p i j = P r ( X i j = x i j | ^ β i , ^ q j ) = P i j ( ^ β i , ^ q j ) x i j ( 1 - P i j ( ^ β i)xผมJที่ P i j ( ^ β i , ^ q j ) = i l o g i t ( ^ β i + ^ q j )คือความน่าจะเป็นที่คาดการณ์ของการตอบสนองที่ถูกต้อง, และฉันลิตรo กรัมฉันทีเป็น logit ผกผัน จากนั้นมีเงื่อนไขกับรายการและลักษณะบุคคลความน่าจะเป็นร่วมที่บุคคลนั้น

พีผมJ=PR(XผมJ=xผมJ|βผม^,QJ^)=PผมJ(βผม^,QJ^)xผมJ(1-PผมJ(βผม^,QJ^))1-xผมJ,
PผมJ(βผม^,QJ^)=ผมล.โอก.ผมเสื้อ(βผม^+QJ^)ผมล.โอก.ผมเสื้อมีข้อสังเกต x เจเป็นพีเจ = Πฉันหน้าฉันเจ ,และในทำนองเดียวกันที่น่าจะร่วมกันว่ารายการผมมีข้อสังเกต x ฉันคือ P ฉัน = Πเจพีฉันเจ บุคคลที่มีต่ำสุดพีเจค่าคือบรรดาผู้ที่สังเกตได้คะแนนเป็นเงื่อนไขอย่างน้อยน่า - พวกเขาอาจจะเป็นคนขี้โกง รายการที่มีต่ำสุดพีเจJxJ
พีJ=ΠผมพีผมJ,
ผมxผม
พีผม=ΠJพีผมJ.
พีJพีJค่าคือค่าที่มีความเป็นไปได้น้อยที่สุดตามเงื่อนไข - เป็นรายการที่รั่วไหล / ใช้ร่วมกันได้ วิธีนี้ต้องอาศัยบนสมมติฐานว่ารุ่นที่ถูกต้องและว่าคน ‘s คะแนนเป็น uncorrelated เงื่อนไขในลักษณะบุคคลและรายการ การละเมิดสมมติฐานที่สองไม่ใช่ปัญหา แต่ตราบใดที่ระดับความสัมพันธ์ไม่แตกต่างกันไปตามบุคคลและโมเดลสำหรับp i jสามารถปรับปรุงได้ง่าย (เช่นโดยการเพิ่มบุคคลหรือรายการเพิ่มเติม)JพีผมJ

ขั้นตอนเพิ่มเติมที่ฉันพยายามคือการใช้ r% ของคนที่มีโอกาสน้อยที่สุด (เช่นคนที่มีค่า r% ต่ำสุดของค่า p_j ที่เรียงลำดับ) คำนวณระยะทางเฉลี่ยระหว่างคะแนนที่สังเกตเห็นของพวกเขา x_j (ซึ่งควรสัมพันธ์กับผู้ที่มี r ต่ำ เป็นตัวโกงที่เป็นไปได้) และเขียนเป็น r = 0.001, 0.002, ... , 1.000 ระยะทางเฉลี่ยเพิ่มขึ้นสำหรับ r = 0.001 ถึง r = 0.025, สูงสุดและจากนั้นลดลงอย่างช้าๆจนถึงขั้นต่ำที่ r = 1 ไม่ใช่สิ่งที่ฉันหวังไว้


4
นี่เป็นปัญหาที่ยากเพราะคุณมีข้อมูลน้อยมากเกี่ยวกับธรรมชาติของการโกง คุณจะแยกความแตกต่างสิบแปดมงกุฎจากนักเรียนที่เรียนยากเป็นพิเศษได้อย่างไร หากไม่มีข้อมูลเพิ่มเติมคุณจะทำไม่ได้ ความเป็นไปได้อย่างหนึ่งคือถ้านักเรียนสามารถโกงโดยการลอกออกจากกันหรือถ้าส่วนย่อยของนักเรียนมีการเข้าถึงคำตอบเดียวกัน หากเป็นกรณีนี้คุณสามารถสร้างฟังก์ชันระยะทางระหว่างนักเรียน (ระยะทางที่ต่ำกว่าหมายความว่าพวกเขาทำได้ดีในคำถามเดียวกัน) และมองหารูปแบบที่นี่ นี่จะเป็นข้อสรุปที่มากขึ้นของ IMO
rm999

2
Levitt และ Dubner อธิบายวิธีการของพวกเขาในFreakonomics ( freakonomicsmedia.com )
whuber

@ rm999 เพื่อชี้แจงให้ชัดเจนว่าคนขี้โกงเข้าถึงชุดย่อยของคำถามเดียวกัน (เช่นคีย์คำตอบบางส่วนถูก leaked ก่อนการบริหารการสอบ) ฉันไม่สนใจการโกงที่อาจเกิดขึ้นจากการคัดลอก ฉันจะแก้ไขคำถามของฉันในช่วงสุดสัปดาห์หากยังไม่ชัดเจน
lockedoff

@whuber ขอบคุณฉันจะค้นหากระดาษ (สมมติว่ามันเผยแพร่) ฉันฟังหนังสือเสียง แต่ไม่สามารถจำรายละเอียดของวิธีที่พวกเขาระบุคนขี้โกง (ซึ่งเป็นครูที่ฟัดจ์คำตอบของนักเรียน
lockedoff

ถ้าฉันจำกรณีของ Freakonomics มันเกี่ยวข้องกับการจำเด็กในโรงเรียน / ชั้นเรียนเดียวกันที่มี (a) การกระโดดขนาดใหญ่ในการบรรลุเมื่อเปรียบเทียบกับปีก่อนหน้า (b) คำตอบที่แตกต่างกันสำหรับคำถามที่ง่ายกว่าก่อนหน้านี้และ (c) คำตอบสำหรับคำถามที่ยากขึ้นในภายหลังดังนั้นควรแนะนำให้ครูกรอกคำตอบที่เด็กเว้นว่างไว้
Henry

คำตอบ:


4

วิธีการเฉพาะกิจ

βผมผมJβผม+QJQJเป็นเพียงอ็อฟเซ็ตคงที่) และเกณฑ์ในบางสถานที่ที่เหมาะสม (เช่น p (ถูกต้อง) <0.6 นี่เป็นชุดคำถามที่นักเรียนไม่น่าจะตอบได้อย่างถูกต้อง ตอนนี้คุณสามารถใช้การทดสอบสมมติฐานเพื่อดูว่ามีการละเมิดหรือไม่ในกรณีนี้นักเรียนอาจโกง (สมมติว่าแบบจำลองของคุณถูกต้อง) หนึ่งข้อแม้คือว่าหากมีคำถามดังกล่าวน้อยคุณอาจมีข้อมูลไม่เพียงพอที่การทดสอบจะเชื่อถือได้ นอกจากนี้ฉันไม่คิดว่าเป็นไปได้ที่จะตัดสินว่าคำถามใดที่เขาโกงเพราะเขามักจะมีโอกาส 50% ที่จะคาดเดา แต่ถ้าคุณสมมติว่านักเรียนหลายคนเข้าถึงคำถามชุดเดียวกันคุณสามารถเปรียบเทียบคำถามเหล่านี้กับนักเรียนและดูว่าคำถามใดที่ตอบบ่อยกว่าโอกาส

QJβผม

หลักการวิธีการ

Jล.ผมaผมJJผมJ=1ล.ผม=1aผมJล.โอก.ผมเสื้อ(βผม+QJ)aผมJJล.ผม


ฉันอ่านส่วนแรกของคำตอบของคุณและคิดว่ามันเป็นคำสัญญา บันทึกย่อสองฉบับ - นี่เป็นตัวเลือกที่หลากหลายดังนั้นความน่าจะเป็นในการเดาที่ถูกต้องคือ 25% หรือ 20% คุณถูกต้องเนื่องจากเราอาจสันนิษฐานว่ามีคำถามบางส่วนรั่วไหลออกมาก่อนการสอบ จะกลับมาที่นี่ในวันอาทิตย์หรือวันจันทร์
lockedoff

3

หากคุณต้องการเข้าใกล้แนวทางที่ซับซ้อนมากขึ้นคุณอาจดูแบบจำลองทฤษฎีการตอบกลับข้อสอบ จากนั้นคุณสามารถจำลองปัญหาของแต่ละคำถามได้ ฉันคิดว่านักเรียนที่ได้รับของที่ยากในขณะที่ขาดหายไปนั้นจะง่ายกว่าคนที่ทำตรงกันข้าม

เป็นเวลากว่าทศวรรษแล้วที่ฉันทำสิ่งนี้ แต่ฉันคิดว่ามันน่าจะเป็นไปได้ สำหรับรายละเอียดเพิ่มเติมดูที่หนังสือ psychometrics


โดยปกติแล้วการโกงหรือการเดาอาจรวมเข้ากับ IRM นี่คือสิ่งที่สำคัญในรูปแบบ 3-PL ตั้งใจที่จะทำตามที่มันมีพารามิเตอร์สำหรับความยากลำบาก , การเลือกปฏิบัติและการคาดเดาซึ่งทำหน้าที่เป็นสิ้นสุดที่ต่ำกว่าสำหรับความน่าจะเป็นของสาที่รายการ อย่างไรก็ตามมันได้รับการพิสูจน์แล้วว่าไม่สมจริงในสถานการณ์ส่วนใหญ่และสถิติบุคคลแบบเฉพาะอื่น ๆได้รับการพัฒนาควบคู่ไปกับ (ทั้งในการทดสอบทางการศึกษาหรือการประเมินทางจิตวิทยา) Meijer, Person-Fit research: บทนำ APM (1996), 9: 3-8 มีการทบทวนที่ดีเกี่ยวกับรูปแบบการตอบสนองที่ผิดปกติ
chl

@chl ขอบคุณ! ฉันศึกษาสิ่งนี้ในโรงเรียนที่จบ แต่เมื่อไม่นานมานี้ - ชั้นเรียนสุดท้ายของฉันคือในปี 1996 หรือมากกว่านั้น
Peter Flom - Reinstate Monica

@chl ขอบคุณสำหรับคำแนะนำของคุณ แบบจำลองในคำถามของฉันเป็นจริงรูปแบบการตอบสนองรายการ (โมเดล Rasch หรือ 1PL พร้อมพารามิเตอร์การเลือกปฏิบัติคงที่) ฉันคิดว่าคำแนะนำในการดูบุคคลที่มีความผิดปกติเป็นการเริ่มต้นที่ดี แต่ฉันกำลังมองหาวิธีการที่ใช้ประโยชน์จากข้อมูลเพิ่มเติมที่ได้รับจากความสัมพันธ์ในการตอบสนองของผู้โกงสำหรับสิ่งของที่มีการโกง คุณสามารถจินตนาการได้ว่าถ้าเราใช้กระบวนการของคุณเพื่อระบุคนขี้โกงเช่นพวกเขาจะทำงานได้ดีในรายการที่ยากเหมือนกัน
lockedoff
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.