มีสองส่วนดังนี้: (a) การเลือกกราฟ ( การออกแบบการทดลอง ) เพื่อตรวจสอบว่าคู่ของบทความที่นักเรียนจะประเมินในกระบวนการจัดเกรดเพียร์และ (b) การจัดอันดับเรียงความทั้งหมดตามเกรดเพื่อนของนักเรียนเพื่อ ตรวจสอบว่าครูควรอันดับ ฉันจะแนะนำวิธีการบางอย่างสำหรับแต่ละ
การเลือกกราฟ
คำชี้แจงปัญหา. ขั้นตอนแรกคือการสร้างกราฟ กล่าวอีกนัยหนึ่งคุณต้องเลือกคู่เรียงความที่จะแสดงต่อนักเรียนในระหว่างการฝึกการคัดเกรด
ทางออกที่แนะนำ สำหรับภารกิจนี้ฉันขอแนะนำให้คุณสร้างกราฟแบบสุ่มGเลือกสุ่มอย่างสม่ำเสมอจากชุดกราฟทั้ง 3 แบบธรรมดา (แบบง่าย)
เหตุผลและรายละเอียด มันเป็นที่รู้จักกันว่าการสุ่มdกราฟที่สม่ำเสมอเป็นตัวขยายที่ดี ในความเป็นจริงกราฟปกติมีปัจจัยการขยายตัวที่เหมาะสมที่สุดแบบ asymptotically นอกจากนี้เนื่องจากกราฟเป็นแบบสุ่มสิ่งนี้จะช่วยลดความเสี่ยงในการจัดลำดับการเอียง โดยการเลือกกราฟที่สุ่มอย่างสม่ำเสมอคุณจะมั่นใจได้ว่าวิธีการของคุณยุติธรรมกับนักเรียนทุกคนอย่างเท่าเทียมกัน ฉันสงสัยว่ากราฟแบบสุ่ม 3 ปกติที่สม่ำเสมอจะเหมาะสมที่สุดสำหรับวัตถุประสงค์ของคุณ
สิ่งนี้ทำให้เกิดคำถาม: เราจะเลือกกราฟ 3 แบบธรรมดา (ง่าย) ได้อย่างไร n จุดยอดสุ่มอย่างสม่ำเสมอหรือไม่
โชคดีที่มีอัลกอริทึมที่รู้จักกันสำหรับการทำเช่นนี้ โดยทั่วไปคุณทำสิ่งต่อไปนี้:
สร้าง 3 nจุด คุณสามารถคิดว่านี่เป็น 3 สำเนาของแต่ละnจุด สร้างสุ่มอย่างเท่าเทียมกันเป็นคู่ที่สมบูรณ์แบบแบบสุ่มกับสิ่งเหล่านี้3 nจุด (กล่าวอีกนัยหนึ่งให้ทำซ้ำขั้นตอนต่อไปนี้จนกระทั่งทั้งหมด3 n คะแนนถูกจับคู่ออก: เลือกจุดใดก็ได้ที่ไม่ได้จับคู่แล้วจับคู่กับจุดอื่นที่เลือกแบบสุ่มโดยสม่ำเสมอจากชุดของจุดที่ไม่ได้จับคู่)
สำหรับแต่ละจุดที่จับคู่โดยการจับคู่ให้วาดเส้นขอบระหว่างจุดยอดที่สอดคล้องกัน (ซึ่งเป็นจุดคัดลอก) นี่จะให้กราฟกับคุณn จุด
ถัดไปทดสอบว่ากราฟที่ได้นั้นง่ายหรือไม่ (เช่นไม่มีลูปและไม่มีขอบซ้ำ) ถ้ามันไม่ง่ายให้ทิ้งกราฟและกลับไปที่ขั้นตอนที่ 1 ถ้ามันง่ายคุณก็ทำเสร็จแล้ว แสดงกราฟนี้
เป็นที่รู้จักกันว่าขั้นตอนนี้จะสร้างการกระจายชุดในชุดของ 3 ปกติ (แบบง่าย) กราฟ นอกจากนี้เป็นที่ทราบกันดีว่าในขั้นตอนที่ 3 คุณมีความน่าจะเป็นที่จะรับกราฟผลลัพธ์ดังนั้นค่าเฉลี่ยของอัลกอริทึมจะทำO ( 1 ) การทดลอง - ดังนั้นนี่คือที่มีประสิทธิภาพสวย (เช่นเวลาทำงานพหุนาม)
ฉันได้เห็นวิธีการนี้ให้เครดิตกับ Bollobas, Bender และ Canfield วิธีการนี้ยังสรุปสั้น ๆในวิกิพีเดีย คุณสามารถค้นหาการสนทนาในโพสต์บล็อกนี้
ในทางเทคนิคการพูดสิ่งนี้ต้องใช้หมายเลข n จะเท่ากัน (ไม่เช่นนั้นจะไม่มีกราฟ 3 ตัวเป็นปกติ nจุด) อย่างไรก็ตามเรื่องนี้ง่ายต่อการจัดการ ตัวอย่างเช่นถ้าnแปลกคุณสามารถสุ่มเรียงความหนึ่งชุดวางเรียงกันสร้างกราฟสุ่ม 3 แบบปกติบนเรียงความที่เหลือจากนั้นเพิ่มขอบอีก 3 ขอบจากเรียงความเรียงกันเป็น 3 เรียงความอื่นที่สุ่มเลือก (ซึ่งหมายความว่าจะมี 3 บทความที่ให้คะแนนจริง 4 ครั้ง แต่ไม่ควรทำอันตรายใด ๆ )
จัดอันดับเรียงความทั้งหมด
คำชี้แจงปัญหา. ตกลงดังนั้นตอนนี้คุณมีกราฟและคุณได้นำเสนอบทความคู่นี้ (ตามที่ระบุโดยขอบในกราฟ) ให้กับนักเรียนเพื่อให้พวกเขาได้เกรดในระหว่างการฝึกคัดเกรด คุณมีผลลัพธ์ของการเปรียบเทียบเรียงความแต่ละครั้ง ตอนนี้งานของคุณคือการจัดอันดับเชิงเส้นบนเรียงความทั้งหมดเพื่อช่วยให้คุณกำหนดได้ว่าจะให้ครูคนไหนประเมิน
สารละลาย. ผมแนะนำให้คุณใช้รูปแบบแบรดลีย์เทอร์รี่ มันเป็นวิธีการทางคณิตศาสตร์ที่แก้ปัญหานี้ได้อย่างแน่นอน มันถูกออกแบบมาสำหรับการจัดอันดับผู้เล่นในกีฬาบางอย่างขึ้นอยู่กับผลของการแข่งขันระหว่างผู้เล่นบางคู่ สันนิษฐานว่าผู้เล่นแต่ละคนมีความแข็งแกร่ง (ไม่ทราบ) ซึ่งสามารถนับเป็นจำนวนจริงและความน่าจะเป็นที่อลิซเต้นบ๊อบถูกกำหนดโดยฟังก์ชั่นที่ราบรื่นของความแตกต่างของจุดแข็งของพวกเขา จากนั้นเมื่อพิจารณาจากสถิติการชนะ / แพ้คู่นั้นจะประเมินความแข็งแกร่งของผู้เล่นแต่ละคน
นี่ควรจะสมบูรณ์แบบสำหรับคุณ คุณสามารถปฏิบัติต่อแต่ละเรียงความเป็นผู้เล่น การเปรียบเทียบระหว่างบทความทั้งสอง (ระหว่างกระบวนการคัดเกรดเพื่อน) เป็นเหมือนผลลัพธ์ของการจับคู่ระหว่างพวกเขา รุ่นแบรดลีย์เทอร์รี่จะช่วยให้คุณใช้เวลาทั้งหมดของข้อมูลนั้นและอนุมานความแข็งแรงสำหรับแต่ละเรียงความที่จุดแข็งที่สูงขึ้นสอดคล้องกับการเขียนเรียงความที่ดีกว่า ตอนนี้คุณสามารถใช้จุดแข็งเหล่านั้นเพื่อเรียงลำดับบทความทั้งหมดได้
รายละเอียดและการอภิปราย ในความเป็นจริงรูปแบบแบรดลีย์เทอร์รี่จะดียิ่งขึ้นกว่าสิ่งที่คุณขอ คุณขอการจัดอันดับเชิงเส้น แต่โมเดลของ Bradley-Terry ให้คะแนนจริง (เรียงตามจำนวนจริง) ซึ่งหมายความว่าคุณรู้ไม่เพียง แต่เรียงความผม แข็งแกร่งกว่าเรียงความ Jแต่เป็นการประมาณคร่าวๆของ ว่ามันแข็งแกร่งแค่ไหน ตัวอย่างเช่นคุณสามารถใช้นี้เพื่อแจ้งให้เลือกซึ่งการเขียนเรียงความในการจัดอันดับของคุณ
มีวิธีอื่นในการสรุปการจัดอันดับหรือการจัดอันดับสำหรับเรียงความทั้งหมดตามข้อมูลที่คุณมี ตัวอย่างเช่นวิธี Elo เป็นอีกวิธีหนึ่ง ฉันสรุปหลายคำตอบในคำถามอื่นอื่น อ่านคำตอบสำหรับรายละเอียดเพิ่มเติมที่
หนึ่งความคิดเห็นอื่น ๆ : รุ่นแบรดลีย์เทอร์รี่อนุมานว่าผลของแต่ละการเปรียบเทียบระหว่างผู้เล่นสองคนคือชนะหรือการสูญเสีย (เช่นผล binary) อย่างไรก็ตามดูเหมือนว่าคุณจะมีข้อมูลที่มีรายละเอียดมากขึ้น: ตัวเลื่อนของคุณจะให้การประมาณคร่าวๆว่าจะให้คะแนนนักเรียนดีกว่าหนึ่งคนมากเท่าใด วิธีที่ง่ายที่สุดที่จะเป็นเพียงแผนที่เลื่อนแต่ละที่จะเป็นผลไบนารี อย่างไรก็ตามหากคุณต้องการจริงๆคุณอาจสามารถใช้ข้อมูลทั้งหมดโดยใช้การวิเคราะห์ที่ซับซ้อนยิ่งขึ้น แบรดลีย์ - เทอร์รี่โมเดลเกี่ยวข้องกับการถดถอยโลจิสติกส์ หากคุณพูดคุยทั่วไปว่าจะใช้logit สั่งฉันเดิมพันว่าคุณสามารถใช้ประโยชน์จากข้อมูลเพิ่มเติมที่คุณได้รับจากตัวเลื่อนแต่ละตัวเนื่องจากผลลัพธ์จากตัวเลื่อนไม่ใช่เลขฐานสอง แต่เป็นหนึ่งในความเป็นไปได้หลายอย่าง
การใช้ครูอย่างมีประสิทธิภาพ
คุณแนะนำให้ครูจัดเกรด X% และ X% ด้านล่างของเรียงความทั้งหมดด้วยตนเอง (โดยใช้การจัดอันดับที่อนุมานจากผลลัพธ์ของการคัดเกรด) สิ่งนี้สามารถใช้งานได้ แต่ฉันคิดว่ามันไม่ได้ใช้เวลาที่ จำกัด ที่สุดของครู ฉันอยากจะแนะนำวิธีการอื่นแทน
ฉันขอแนะนำให้คุณให้คะแนนนักเรียนเป็นส่วนย่อยของบทความโดยเลือกส่วนย่อยอย่างระมัดระวังเพื่อพยายามให้การสอบเทียบที่ดีที่สุดเท่าที่จะเป็นไปได้สำหรับบทความทั้งหมดที่ไม่ได้ให้คะแนนโดยครู สำหรับเรื่องนี้ฉันคิดว่ามันอาจช่วยได้ถ้าคุณเลือกตัวอย่างของบทความที่ครอบคลุมช่วงของคำตอบที่เป็นไปได้ (ดังนั้นสำหรับทุกเรียงความมีเรียงความที่ให้คะแนนโดยอาจารย์ที่อยู่ไม่ไกลจากมัน) สำหรับวันนี้ผมจะคิดว่าสองวิธีที่คุณสามารถลอง:
การจัดกลุ่ม รับการจัดอันดับที่ผลิตโดยรุ่น Terry-Bradley นี่คือชุดของnจำนวนจริงหนึ่งจำนวนจริงต่อเรียงความ ตอนนี้กลุ่มพวกเขา สมมติว่าคุณต้องการมีคะแนนครูkการเขียนเรียงความ วิธีการหนึ่งที่จะใช้k- หมายถึงการจัดกลุ่ม (บนจุดข้อมูลหนึ่งมิติเหล่านี้) เพื่อจัดเรียงบทความลงใน k กลุ่มและจากนั้นเลือกหนึ่งเรียงความจากแต่ละคลัสเตอร์สำหรับครูเพื่อให้คะแนน - หรือให้เกรดครู "หัวหน้ากลุ่ม" ของแต่ละกลุ่ม
จุดที่ไกลที่สุดก่อนอีกทางเลือกหนึ่งคือพยายามเลือกชุดย่อยของkเรียงความที่แตกต่างจากกันมากที่สุด อัลกอริทึม "จุดแรกสุด" (FPF) เป็นวิธีการที่สะอาดสำหรับสิ่งนี้ สมมติว่าคุณมีฟังก์ชั่นระยะทางd(อีผม,อีJ) ที่ช่วยให้คุณวัดระยะทางระหว่างบทความสองเรื่อง อีผม และ อีJ: ระยะทางขนาดเล็กหมายความว่าเรียงความคล้ายกันระยะทางที่กว้างขึ้นหมายถึงเรียงความต่างกัน รับชุดS ของบทความให้ d( e , S) =นาทีอี'∈ Sd( e ,อี') เป็นระยะทางจาก อี เพื่อเรียงความที่ใกล้ที่สุดใน S. อัลกอริธึมแรกที่อยู่ห่างจากจุดสูงสุดคำนวณรายการของk การเขียนเรียงความ อี1,อี2, … ,อีkดังนี้ อีฉัน+ 1 เป็นบทความที่เพิ่มมากที่สุด d( e , {อี1,อี2, … ,อีผม} ) (จากบทความทั้งหมด อี ดังนั้น e ∉ {อี1,อี2, … ,อีผม}) อัลกอริทึมนี้สร้างชุดของk เรียงความที่แตกต่างจากกันมากที่สุดเท่าที่จะทำได้ - ซึ่งหมายความว่าเรียงความที่เหลืออยู่นั้นมีความคล้ายคลึงกับอย่างน้อยหนึ่งข้อ k. ดังนั้นจึงมีเหตุผลที่จะให้เกรดครูk เรียงความที่เลือกโดยอัลกอริทึม FPF
ฉันสงสัยว่าวิธีการใดวิธีการหนึ่งเหล่านี้อาจให้คะแนนที่แม่นยำกว่าการให้คะแนนครูระดับสูงสุด X% และ X% ด้านล่างของเรียงความ - เนื่องจากบทความที่ดีที่สุดและแย่ที่สุดอาจไม่ใช่ตัวแทนของมวลเรียงความตรงกลาง
ในทั้งสองวิธีคุณสามารถใช้ฟังก์ชั่นระยะทางที่ซับซ้อนยิ่งขึ้นซึ่งไม่ได้คำนึงถึงเพียงแค่การประเมินความแข็งแกร่งตามการจัดระดับเพื่อน แต่ยังรวมถึงปัจจัยอื่น ๆ ที่ได้มาจากบทความ ฟังก์ชันระยะทางที่ง่ายที่สุดที่เป็นไปได้จะพิจารณาเฉพาะผลลัพธ์ของโมเดลเทอร์รี่แบรดลีย์เท่านั้นเช่นd(อี1,อี2) = ( s (อี1) - s (อี2))2 ที่ไหน s ( e ) เป็นจุดแข็งของเรียงความ อีประเมินโดยโมเดลเทอร์รี่ - แบรดลีย์ตามผลลัพธ์ของการให้เกรดเพื่อน อย่างไรก็ตามคุณสามารถทำสิ่งที่ซับซ้อนมากขึ้น ตัวอย่างเช่นคุณสามารถคำนวณปกติแก้ไข Levenshtein ระยะทางระหว่างการเขียนเรียงความอี1 และ อี2(ถือว่าเป็นสตริงข้อความคำนวณระยะทางแก้ไขและหารด้วยความยาวของทั้งสองที่ใหญ่กว่า) และใช้สิ่งนั้นเป็นอีกปัจจัยหนึ่งในฟังก์ชันระยะทาง คุณสามารถคำนวณคุณสมบัติเวคเตอร์โดยใช้แบบจำลองถุงคำในคำในบทความและใช้ระยะทาง L2 ระหว่างเวกเตอร์คุณลักษณะเหล่านี้ คุณอาจใช้ฟังก์ชันระยะทางซึ่งเป็นค่าเฉลี่ยถ่วงน้ำหนักของความแตกต่างในจุดแข็ง (ตามการประมาณการของ Terry-Bradley) ระยะแก้ไขแบบปกติและสิ่งอื่น ๆ ที่มีประโยชน์ ฟังก์ชันระยะทางที่ซับซ้อนเช่นนี้อาจช่วยให้ทำงานได้ดีขึ้นในการช่วยอัลกอริธึมการเลือกกลุ่มที่ดีที่สุดk เรียงความเพื่อให้ได้เกรดครู