คะแนนทดสอบเป็นไปตามการแจกแจงปกติหรือไม่


14

ฉันพยายามเรียนรู้ว่าการแจกแจงแบบใดที่จะใช้ใน GLMs และฉันสับสนเล็กน้อยเมื่อต้องใช้การแจกแจงแบบปกติ ในส่วนหนึ่งของตำราเรียนของฉันบอกว่าการแจกแจงแบบปกติอาจจะดีสำหรับการทำแบบจำลองคะแนนสอบ ในส่วนถัดไปมันจะถามว่าการจัดจำหน่ายแบบใดที่เหมาะสมในการสร้างแบบจำลองการเคลมประกันรถยนต์ เวลานี้มันบอกว่าการแจกแจงที่เหมาะสมจะเป็นแกมม่าหรืออินเวอร์สเกาส์เนื่องจากพวกมันมีค่าบวกอย่างต่อเนื่องเท่านั้น ฉันเชื่อว่าคะแนนสอบจะต่อเนื่องกับค่าบวกเท่านั้นดังนั้นทำไมเราถึงใช้การแจกแจงแบบปกติที่นั่น? การแจกแจงปกติไม่อนุญาตสำหรับค่าลบหรือไม่


1
หากคุณกังวลเกี่ยวกับขอบเขตของคะแนนคุณสามารถลองen.wikipedia.org/wiki/Truncated_normal_distribution
JG

6
แน่นอนว่าในโลกแห่งความเป็นจริงการแจกแจงคะแนนสอบมักไม่ได้มีลักษณะเหมือนการแจกแจงแบบปกติอยู่ดี เป็นตัวอย่างจากคณิตศาสตร์ของฉันในระดับปริญญาตรีฉันจำได้ว่าTopology I class มีชื่อเสียงในด้านการกระจายเกรด "ดัมเบลโค้ง" ที่สูงมาก: คุณเข้าใจแนวคิดหลักและได้คะแนนที่สมบูรณ์แบบหรือคุณไม่ได้และเป็น โชคดีที่ได้รับคะแนนใด ๆ เลย มีเพียงไม่กี่คนที่จบลงด้วยการให้คะแนนที่ใดก็ได้ที่อยู่ตรงกลางระหว่างสุดขั้วทั้งสอง
Ilmari Karonen

2
ไม่คำถามต่อไป
Carl Witthoft

คำตอบ:


14

ยกตัวอย่างเช่นความสูงมักจะเป็นแบบอย่างที่เป็นปกติ บางทีความสูงของผู้ชายอาจเป็น 5 ฟุต 10 ที่มีค่าเบี่ยงเบนมาตรฐาน 2 นิ้ว เรารู้ว่าความสูงเชิงลบนั้นไม่ไร้ค่า แต่ภายใต้โมเดลนี้ความน่าจะเป็นที่สังเกตความสูงเชิงลบนั้นเป็นศูนย์ เราใช้โมเดลนี้เพราะมันเป็นการประมาณที่ดีพอ

ทุกรุ่นผิด คำถามคือ "แบบจำลองนี้ยังคงมีประโยชน์" และในกรณีที่เราทำแบบจำลองสิ่งต่างๆเช่นความสูงและคะแนนการทดสอบการสร้างแบบจำลองปรากฏการณ์ตามปกติจะมีประโยชน์


ในกรณีพิเศษนี้ก็เป็นที่น่าสงสัยว่าการแจกแจงแบบปกตินั้นเป็นประโยชน์อย่างยิ่ง เกือบทุกระดับการแจกแจงที่ฉันเห็นคล้ายกับเส้นโค้ง bimodal Ilmari Karonen ที่กล่าวถึงในความคิดเห็นในระดับหนึ่ง (แม้ว่าโดยปกติจะมีโหมดประมาณ 0.6 และ 0.9 มากกว่าที่ปลายสุด) อย่างไรก็ตามการรวมเชิงเส้นของการแจกแจงปกติสองวิธีที่มีวิธีการต่างกันจะไม่เป็นการประมาณที่ไม่ดี
เรย์

ฉันไม่ได้โต้เถียงว่าปกติคือการประมาณที่ดีที่สุด จุดทั้งหมดของความคิดเห็นของฉันทำขึ้นจริง ๆ ในย่อหน้าสุดท้าย ความคิดเห็นเกี่ยวกับ bimodality ของการแจกแจงคะแนนจริงอย่างน้อยที่สุดในระดับนามธรรมนี้ไม่มีประโยชน์จริง ๆ
Demetri Pananos

ฉันเห็นด้วยกับทุกสิ่งที่คุณพูดในคำตอบของคุณ แต่ส่วนหนึ่งของคำถามเกี่ยวข้องว่าการแจกแจงแบบปกตินั้นใช้เฉพาะกับการแจกแจงเกรดแบบจำลองหรือไม่ และคำตอบก็คือ "ไม่" แบบจำลองทั้งหมดผิดและแบบจำลองบางแบบมีประโยชน์ แต่บางแบบก็ผิดและมีประโยชน์น้อยกว่าแบบอื่น ๆ ความจริงที่ว่าการกระจายตัวแบบปกติโดยเฉพาะอย่างยิ่งเป็นสิ่งที่ไม่ดีอย่างยิ่งสำหรับปัญหานี้เป็นสิ่งสำคัญและคำตอบที่ดูเหมือนว่าจะแนะนำว่าปกติเป็นเพียงผิดเพราะหางไปในเชิงลบและไม่มีที่สิ้นสุดเมื่อมีปัญหาลึกมาก
เรย์

คุณกำลังอวดความกระตือรือร้นเล็กน้อยที่นี่ ปัญหาของ OP คือปกติให้คะแนนลบ Bimodality ไม่ใช่ปัญหา คุณไม่เห็นป่าสำหรับต้นไม้ที่เกี่ยวกับคำถามนี้ รายละเอียดการสร้างแบบจำลองไม่เกี่ยวข้องในขณะนี้
Demetri Pananos

10

การแจกแจงปกติไม่อนุญาตสำหรับค่าลบหรือไม่

แก้ไข. มันไม่มีขอบเขตบน

ในส่วนหนึ่งของตำราเรียนของฉันบอกว่าการแจกแจงแบบปกติอาจจะดีสำหรับการทำแบบจำลองคะแนนสอบ

อย่างไรก็ตามข้อความก่อนหน้านี้อย่างไรก็ตามบางครั้งก็เป็นกรณีนี้ หากคุณมีองค์ประกอบหลายอย่างในการทดสอบไม่เกี่ยวข้องกันมากเกินไป (เช่นคุณไม่ได้เป็นคำถามเดียวกันเป็นสิบ ๆ ครั้งและไม่มีส่วนใดที่ต้องการคำตอบที่ถูกต้องในส่วนก่อนหน้า) และไม่ใช่เรื่องง่ายหรือยากมาก ( ดังนั้นเครื่องหมายส่วนใหญ่จะอยู่ใกล้กับจุดกึ่งกลาง) จากนั้นเครื่องหมายมักจะถูกประมาณด้วยการแจกแจงแบบปกติ บ่อยครั้งมากพอที่การวิเคราะห์ทั่วไปควรทำให้เกิดความกังวลเล็กน้อย

เรารู้ว่ามันไม่ปกติแต่นั่นไม่ใช่ปัญหาโดยอัตโนมัติ - ตราบใดที่พฤติกรรมของขั้นตอนที่เราใช้นั้นใกล้เคียงกับสิ่งที่ควรจะเป็นเพื่อจุดประสงค์ของเรา (เช่นข้อผิดพลาดมาตรฐานช่วงความมั่นใจระดับนัยสำคัญ และพลังงาน - สิ่งใดก็ตามที่จำเป็น - ทำใกล้กับสิ่งที่เราคาดหวังให้)

ในส่วนถัดไปมันจะถามว่าการจัดจำหน่ายแบบใดที่เหมาะสมในการสร้างแบบจำลองการเคลมประกันรถยนต์ เวลานี้มันบอกว่าการแจกแจงที่เหมาะสมจะเป็นแกมม่าหรืออินเวอร์สเกาส์เนื่องจากพวกมันมีค่าบวกอย่างต่อเนื่องเท่านั้น

ใช่ แต่ยิ่งไปกว่านั้นพวกเขามักจะเอียงอย่างหนักและความแปรปรวนมีแนวโน้มที่จะเพิ่มขึ้นเมื่อค่าเฉลี่ยเพิ่มขึ้น

นี่คือตัวอย่างของการกระจายการอ้างสิทธิ์สำหรับการอ้างสิทธิ์รถยนต์:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(รูปที่ 5 จาก Garrido, Genest & Schulz (2016) "โมเดลเชิงเส้นทั่วไปสำหรับความถี่และความรุนแรงของการเรียกร้องค่าสินไหมทดแทน", การประกันภัย: คณิตศาสตร์และเศรษฐศาสตร์, ปีที่ 70, ก.ย. , p205-215 https: //www.sciencedirect com / วิทยาศาสตร์ / บทความ / pii / S0167668715303358 )

นี่แสดงให้เห็นว่าหางขวาและขวาหนักทั่วไป อย่างไรก็ตามเราต้องระวังให้มากเพราะนี่คือการกระจายแบบขอบและเรากำลังเขียนแบบจำลองสำหรับการแจกแจงแบบมีเงื่อนไขซึ่งโดยทั่วไปแล้วจะน้อยกว่ามาก ของการแจกแจงแบบมีเงื่อนไขเหล่านี้) อย่างไรก็ตามโดยทั่วไปแล้วเป็นกรณีที่ถ้าเราดูขนาดการเรียกร้องในกลุ่มย่อยของผู้ทำนาย (อาจจัดประเภทตัวแปรต่อเนื่อง) ว่าการแจกแจงยังคงเอียงอย่างรุนแรงและค่อนข้างเทลทางด้านขวาค่อนข้างมาก น่าจะเหมาะสมกว่าแบบเกาส์เซียนมาก

* อาจมีการแจกแจงอื่น ๆ อีกจำนวนมากซึ่งจะเหมาะสมกว่าแบบเกาส์เซียน - การกลับแบบเกาส์เป็นตัวเลือกอื่น - แม้ว่าจะเป็นเรื่องธรรมดา รุ่น lognormal หรือ Weibull ในขณะที่ไม่ใช่ GLM อย่างที่เป็นอยู่ก็มีประโยชน์เช่นกัน

[แทบจะไม่เคยมีกรณีใดที่การแจกแจงเหล่านี้มีคำอธิบายที่สมบูรณ์แบบ พวกมันประมาณไม่ถูกต้อง แต่ในหลาย ๆ กรณีก็ดีพอที่การวิเคราะห์นั้นมีประโยชน์และใกล้เคียงกับคุณสมบัติที่ต้องการ]

ฉันเชื่อว่าคะแนนสอบจะต่อเนื่องกับค่าบวกเท่านั้นดังนั้นทำไมเราถึงใช้การแจกแจงแบบปกติที่นั่น?

เพราะ (ภายใต้เงื่อนไขที่ฉันพูดถึงมาก่อน - ส่วนประกอบจำนวนมากไม่ขึ้นอยู่กับว่าไม่ยากหรือง่าย) การกระจายมีแนวโน้มที่จะใกล้เคียงกับสมมาตร


0

คะแนนสอบอาจเป็นแบบจำลองที่ดีกว่าโดยการแจกแจงทวินาม ในกรณีที่ง่ายมากคุณอาจมีคำถามจริง / เท็จ 100 คำถามแต่ละค่า 1 คะแนนดังนั้นคะแนนจะเป็นจำนวนเต็มระหว่าง 0 ถึง 100 ถ้าคุณคิดว่าไม่มีความสัมพันธ์กันระหว่างความถูกต้องของผู้ทดสอบจากปัญหาหนึ่งไปยังอีกปัญหาหนึ่ง ) คะแนนนั้นเป็นผลรวมของตัวแปรสุ่มแบบอิสระและใช้ทฤษฎีการ จำกัด ขั้นกลาง เมื่อจำนวนคำถามเพิ่มขึ้นเศษส่วนของปัญหาที่ถูกต้องจะแปรเปลี่ยนเป็นการแจกแจงแบบปกติ

คุณถามคำถามที่ดีเกี่ยวกับค่าน้อยกว่า 0 คุณสามารถถามคำถามเดียวกันเกี่ยวกับค่าที่มากกว่า 100% เมื่อจำนวนคำถามทดสอบเพิ่มขึ้นความแปรปรวนของผลรวมจะลดลงดังนั้นค่าสูงสุดจะถูกดึงเข้าหาค่าเฉลี่ย ในทำนองเดียวกันการกระจายตัวแบบปกติที่ดีที่สุดจะมีความแปรปรวนน้อยลงและน้ำหนักของ pdf นอกช่วง [0, 1] มีแนวโน้มเป็น 0 แม้ว่ามันจะไม่ใช่ศูนย์ก็ตาม ช่องว่างระหว่างค่าที่เป็นไปได้ของ "เศษส่วนที่ถูกต้อง" จะลดลง (1/100 สำหรับ 100 คำถาม, 1/1000 สำหรับ 1,000 คำถาม ฯลฯ ) ดังนั้นอย่างไม่เป็นทางการไฟล์ pdf เริ่มทำงานมากขึ้นเรื่อย ๆ เช่นเดียวกับไฟล์ PDF แบบต่อเนื่อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.