นี่เป็นไปได้อย่างหนึ่ง
การประเมินประสิทธิภาพของครูนั้นเป็นเรื่องยาก ส่วนหนึ่งของความยากลำบากนี้คือนักเรียนที่แตกต่างกันมีระดับความสนใจแตกต่างกันในแต่ละวิชา หากนักเรียนที่ได้รับ A ไม่ได้หมายความว่าการสอนนั้นยอดเยี่ยม แต่อาจหมายถึงว่านักเรียนที่มีพรสวรรค์และมีความสนใจทำอย่างดีที่สุดเพื่อประสบความสำเร็จแม้จะมีคุณภาพการสอนที่ไม่ดีก็ตาม ในทางกลับกันนักเรียนที่ได้รับ D ไม่ได้แปลว่าการสอนไม่ดี - แต่อาจหมายถึงว่านักเรียนที่ไม่สนใจเข้าฝั่งแม้จะพยายามอย่างที่สุดในการให้การศึกษาและสร้างแรงบันดาลใจ
ความยากลำบากนั้นรุนแรงขึ้นจากความจริงที่ว่าการเลือกนักเรียน (และระดับความสนใจของนักเรียน) อยู่ไกลจากการสุ่ม เป็นเรื่องปกติที่โรงเรียนจะเน้นเรื่องใดเรื่องหนึ่ง (หรือกลุ่มวิชา) ให้มากกว่าวิชาอื่น ตัวอย่างเช่นโรงเรียนอาจเน้นวิชาด้านเทคนิคมากกว่ามนุษยศาสตร์ นักเรียนในโรงเรียนดังกล่าวอาจให้ความสนใจในด้านเทคนิคที่พวกเขาจะได้รับคะแนนผ่านแม้จะเป็นครูที่แย่ที่สุดก็ตาม ดังนั้นเศษส่วนของนักเรียนที่ผ่านวิชาคณิตศาสตร์จึงไม่ใช่วิธีการสอนที่ดี - เราคาดหวังให้ครูที่ดีทำดีกว่านั้นกับนักเรียนที่กระตือรือร้นที่จะเรียนรู้ ในทางตรงกันข้ามนักเรียนคนเดียวกันอาจไม่สนใจศิลปะเลย มันยากที่จะคาดหวังจากครูที่ดีที่สุดเพื่อให้แน่ใจว่านักเรียนทุกคนได้รับ A
ปัญหาอีกประการหนึ่งคือความสำเร็จที่ไม่ได้เกิดขึ้นในชั้นเรียนนั้นเป็นผลมาจากอาจารย์ของชั้นเรียนนั้นโดยตรง แต่ความสำเร็จอาจเกิดจากโรงเรียน (หรือทั้งเขต) สร้างแรงบันดาลใจและกรอบการทำงานเพื่อความสำเร็จ
เพื่อพิจารณาปัญหาทั้งหมดเหล่านี้นักวิจัยได้สร้างแบบจำลองที่ประเมิน 'มูลค่าเพิ่ม' ของครู โดยสรุปแล้วตัวแบบจะคำนึงถึงลักษณะที่แท้จริงของนักเรียนแต่ละคน (ระดับโดยรวมของความสนใจและความสำเร็จในการเรียนรู้) เช่นเดียวกับผลงานของโรงเรียนและเขตการปกครองที่มีต่อความสำเร็จของนักเรียนและคาดการณ์ผลการเรียนของนักเรียน การสอนในสภาพแวดล้อมนั้น จากนั้นแบบจำลองจะเปรียบเทียบคะแนนจริงกับคะแนนที่คาดการณ์ไว้และพิจารณาจากการตัดสินใจว่าการสอนนั้นเพียงพอหรือไม่เมื่อพิจารณาอื่น ๆ ทั้งหมดดีกว่าเพียงพอหรือแย่กว่านั้น แม้ว่าแบบจำลองอาจดูซับซ้อนสำหรับนักคณิตศาสตร์ที่ไม่ใช่นักคณิตศาสตร์ แต่จริงๆแล้วมันเรียบง่ายและเป็นมาตรฐาน นักคณิตศาสตร์ใช้แบบจำลองที่คล้ายคลึงกัน (และซับซ้อนยิ่งขึ้น) มานานหลายทศวรรษ
เพื่อสรุปการเดาของ Ms. Isaacson นั้นถูกต้อง แม้ว่านักเรียน 65 คนจาก 66 คนของเธอทำคะแนนได้ดีในการทดสอบระดับรัฐ แต่พวกเขาก็จะได้คะแนนเท่ากันแม้ว่าสุนัขจะเป็นครูของพวกเขา ครูที่ดีจริงจะช่วยให้นักเรียนเหล่านี้ประสบความสำเร็จไม่เพียง แต่ 'เชี่ยวชาญ' แต่จริง ๆ แล้วคะแนน 'ดี' ในการทดสอบเดียวกัน
ณ จุดนี้ฉันสามารถพูดถึงข้อกังวลบางอย่างของฉันกับโมเดล ตัวอย่างเช่นผู้พัฒนาโมเดลอ้างว่าได้จัดการกับปัญหาบางอย่างด้วยการประเมินคุณภาพการสอน ฉันมีเหตุผลเพียงพอที่จะเชื่อพวกเขาหรือไม่? ย่านที่มีประชากรที่มีรายได้ต่ำจะมีคะแนน 'เขต' และ 'โรงเรียน' ที่ต่ำกว่า สมมติว่าย่านที่คุ้นเคยจะมีคะแนนคาดว่าจะเท่ากับ 2.5 ครูที่จะบรรลุค่าเฉลี่ย 3 จะได้รับการประเมินที่ดี สิ่งนี้อาจกระตุ้นให้ครูเล็งเป้าหมายไปที่คะแนน 3 แทนที่จะพูดเป็นคะแนน 4 หรือ 5 กล่าวอีกนัยหนึ่งครูจะมุ่งเป้าไปที่คนธรรมดามากกว่าความสมบูรณ์แบบ เราต้องการให้สิ่งนี้เกิดขึ้นหรือไม่ ในที่สุดถึงแม้ว่าแบบจำลองจะง่ายในเชิงคณิตศาสตร์มันทำงานในลักษณะที่แตกต่างจากสัญชาตญาณของมนุษย์ ดังนั้นเราจึงไม่มีวิธีที่ชัดเจนในการตรวจสอบหรือโต้แย้งรูปแบบ ' การตัดสินใจของ ตัวอย่างที่โชคร้ายของมิสซิสไอแซคแสดงให้เห็นว่าสิ่งนี้นำไปสู่อะไร เราต้องการพึ่งพาคอมพิวเตอร์ในสิ่งที่สำคัญมาก ๆ หรือไม่?
โปรดทราบว่านี่เป็นคำอธิบายของบุคคลทั่วไป ฉันหลีกเลี่ยงปัญหาที่อาจเป็นข้อโต้แย้งหลายประการ ตัวอย่างเช่นฉันไม่ต้องการบอกว่าโรงเรียนที่มีประชากรที่มีรายได้ต่ำคาดว่าจะทำงานได้แย่ลงเพราะสิ่งนี้ไม่ได้ผลดีกับคนธรรมดา
นอกจากนี้ฉันได้สันนิษฐานว่าเป้าหมายคือการให้คำอธิบายที่ยุติธรรมพอสมควรแก่โมเดล แต่ฉันค่อนข้างแน่ใจว่านี่ไม่ใช่เป้าหมายของ NYT ที่นี่ ดังนั้นอย่างน้อยส่วนหนึ่งของเหตุผลที่คำอธิบายของพวกเขาไม่ดีคือ FUD โดยเจตนาในความคิดของฉัน