ฉันจะประเมินความเบี่ยงเบนมาตรฐานได้อย่างไร


15

ฉันได้รวบรวมคำตอบจาก 85 คนเกี่ยวกับความสามารถในการทำงานบางอย่าง

การตอบสนองอยู่ในระดับห้าจุด Likert:

5 = ดีมาก 4 = ดี 3 = ปานกลาง 2 = แย่ 1 = แย่มาก

คะแนนเฉลี่ยคือ 2.8 และส่วนเบี่ยงเบนมาตรฐานคือ 0.54

ฉันเข้าใจว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเป็นอย่างไร

คำถามของฉันคือ: ส่วนเบี่ยงเบนมาตรฐานนี้ดีแค่ไหน (หรือไม่ดี)

กล่าวอีกนัยหนึ่งมีแนวทางใดบ้างที่สามารถช่วยในการประเมินค่าเบี่ยงเบนมาตรฐาน


การที่ SD ดีหรือไม่ดีหมายความว่าอย่างไร
gung - Reinstate Monica

7
มันค่อนข้างยากที่จะได้รับเช่น SD ขนาดเล็กที่มีข้อมูลเช่นนี้สำหรับค่าเฉลี่ยอยู่ที่ 2.8, SD จะต้องมีอย่างน้อย 0.8} (แม้ว่า 2.8 แทนค่าที่ถูกปัดเศษ SD จะต้องยังคงเกิน 0.357) SD ที่ 0.54 หมายถึงว่าไม่เกินสองคนที่สามารถตอบด้วย 5 (กับ 21 2 และ 62 3) และไม่เกินหกสามารถตอบได้ กับ 1 (กับ 5 2 และ 74 3) สิ่งนี้ชี้ให้เห็นว่าคำถามอาจให้ข้อมูลที่น้อยมากเป็นพิเศษเนื่องจากสเกลนั้นไม่สามารถแยกแยะได้อย่างมีประสิทธิภาพ 0.2×0.8=0.4
whuber

@whuber นิติเวชศาสตร์ที่ยอดเยี่ยม! แต่ฉันสามารถจินตนาการได้ว่าเขาเฉลี่ยคำถามที่ต่างกันหรือทำอะไรผิดในการคำนวณของเขา ดูเหมือนยากที่จะจินตนาการว่าผู้คนตอบสนองอย่างสม่ำเสมอโดยเฉพาะเมื่อพูดถึงความสามารถที่ควรจะเป็น
Erik

คำตอบ:


17

ความเบี่ยงเบนมาตรฐานไม่ใช่ "ดี" หรือ "ไม่ดี" มันเป็นตัวบ่งชี้ว่าการกระจายข้อมูลของคุณเป็นอย่างไร บางครั้งในระดับการจัดอันดับเราต้องการสเปรดที่กว้างเพราะมันบ่งบอกว่าคำถาม / การให้คะแนนของเราครอบคลุมช่วงของกลุ่มที่เราให้คะแนน บางครั้งเราต้องการ sd ขนาดเล็กเพราะเราต้องการให้ทุกคน "สูง"

ตัวอย่างเช่นถ้าคุณกำลังทดสอบทักษะทางคณิตศาสตร์ของนักเรียนในหลักสูตรแคลคูลัสคุณอาจจะได้รับ SD ขนาดเล็กมากโดยการถามคำถามของประถมคณิตศาสตร์เช่นพวกเขา 2 แต่สมมติว่าคุณได้ทำแบบทดสอบวัดระดับแคลคูลัส (นั่นคือนักเรียนที่สอบผ่านจะเข้าสู่แคลคูลัส I ผู้ที่ไม่ได้ลงเรียนหลักสูตรระดับล่าง) คุณอาจคาดหวังว่า sd ที่ต่ำกว่า (และค่าเฉลี่ยสูงกว่า) ในกลุ่มนักศึกษาใหม่ของ MIT ที่รัฐ Podunk ใต้ได้รับการทดสอบเดียวกัน3+2

ดังนั้น. จุดประสงค์ของการทดสอบของคุณคืออะไร? ใครอยู่ในกลุ่มตัวอย่าง


2
(+1) เพียงเพิ่มคำพูดเล็กน้อย "ความเบี่ยงเบนมาตรฐานไม่ใช่ 'ดี' หรือ 'ไม่ดี' '- การมีตัวทำนายค่าเบี่ยงเบนมาตรฐานขนาดใหญ่อาจเป็น" ดี "เพราะในการถดถอยมันมีความสัมพันธ์แบบตรงกันข้ามกับมาตรฐาน ข้อผิดพลาดของการประมาณค่าสัมประสิทธิ์การถดถอย ในทางกลับกันหากคุณกังวลเกี่ยวกับความแม่นยำในการวัดค่าเบี่ยงเบนมาตรฐานขนาดใหญ่จะ "แย่" ฉันเดาว่าความสนใจของโปสเตอร์ต้นฉบับนั้นใกล้เคียงกับอดีต แต่ก็ไม่ชัดเจน
มาโคร

10

คำตอบสั้น ๆ ก็ใช้ได้และต่ำกว่าที่ฉันคาดไว้เล็กน้อยจากข้อมูลการสำรวจ แต่อาจเป็นเรื่องธุรกิจของคุณในค่าเฉลี่ยหรือร้อยละ 2 กล่องด้านบน

สำหรับเครื่องชั่งที่ไม่ต่อเนื่องจากการวิจัยทางสังคมศาสตร์ในทางปฏิบัติค่าเบี่ยงเบนมาตรฐานเป็นหน้าที่โดยตรงของค่าเฉลี่ย โดยเฉพาะอย่างยิ่งฉันได้ค้นพบจากการวิเคราะห์เชิงประจักษ์ของการศึกษาจำนวนมากเช่นว่าค่าเบี่ยงเบนมาตรฐานจริงในการสำรวจในเครื่องชั่ง 5 จุดคือ 40% -60% ของการเปลี่ยนแปลงที่เป็นไปได้สูงสุด

ในระดับที่ง่ายที่สุดให้พิจารณาสุดขั้วจินตนาการว่าค่าเฉลี่ยคือ 5.0 ค่าเบี่ยงเบนมาตรฐานต้องเป็นศูนย์เนื่องจากวิธีเดียวที่ค่าเฉลี่ย 5 คือให้ทุกคนตอบ 5 ในทางกลับกันถ้าค่าเฉลี่ยเท่ากับ 1.0 ดังนั้นข้อผิดพลาดมาตรฐานจะต้องเป็น 0 เช่นกัน ดังนั้นค่าเบี่ยงเบนมาตรฐานจะถูกกำหนดอย่างแม่นยำให้ค่าเฉลี่ย

ในระหว่างนั้นมีพื้นที่สีเทามากขึ้น ลองนึกภาพว่าผู้คนสามารถตอบ 5.0 หรือ 1.0 ก็ได้ จากนั้นค่าเบี่ยงเบนมาตรฐานคือฟังก์ชันที่แม่นยำของค่าเฉลี่ย:

stdev = sqrt ((5-Mean) * (mean-1))

ค่าเบี่ยงเบนมาตรฐานสูงสุดสำหรับคำตอบของสเกลที่ถูก จำกัด คือความกว้างของสเกลเพียงครึ่งเดียว นี่คือ sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2

ตอนนี้แน่นอนผู้คนสามารถตอบรับค่าระหว่าง จาก metastudies ของข้อมูลการสำรวจใน บริษัท ของเราฉันพบว่าค่าเบี่ยงเบนมาตรฐานสำหรับเครื่องชั่งเชิงตัวเลขในทางปฏิบัติคือ 40% -60% ของสูงสุด เฉพาะ

  • 40% สำหรับเครื่องชั่ง 100%
  • 50% สำหรับเครื่องชั่ง 10 จุดและ
  • 60% สำหรับเครื่องชั่ง 5 จุดและ
  • 100% สำหรับเครื่องชั่งไบนารี

ดังนั้นสำหรับชุดข้อมูลของคุณฉันคาดหวังว่าค่าเบี่ยงเบนมาตรฐานของ 60% x 2.0 = 1.2 คุณได้ 0.54 ซึ่งคิดเป็นครึ่งหนึ่งของสิ่งที่ฉันคาดหวังหากผลลัพธ์นั้นเป็นคะแนนที่อธิบายตนเอง คะแนนทักษะเป็นผลจากการทดสอบแบตเตอรี่ที่ซับซ้อนกว่าซึ่งเป็นค่าเฉลี่ยและจะมีความแปรปรวนต่ำกว่าหรือไม่

อย่างไรก็ตามเรื่องจริงอาจเป็นไปได้ว่าความสามารถต่ำหรือสูงมากเมื่อเทียบกับงานอื่น ๆ รายงานค่าเฉลี่ยหรือเปอร์เซ็นต์สูงสุดของกล่องระหว่างทักษะและเน้นการวิเคราะห์ของคุณ


-1

หากกระจายข้อมูลตามปกติคุณจะเห็นว่าประชากรตั้งอยู่อย่างไร

  • 68% ของคนทั้งหมดอยู่ภายใน 1 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย ( 2.26 - 3.34):

ป้อนคำอธิบายรูปภาพที่นี่

  • 95% ของคนทั้งหมดอยู่ภายใน 2 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย ( 1.72 - 3.88):

ป้อนคำอธิบายรูปภาพที่นี่

มันบอกคุณว่า "กระจาย" หมายเลขของคุณเป็นอย่างไร


1
คำตอบนี้ยังไม่ได้รับการอัปเดตเนื่องจากไม่ถูกต้อง: ใช้กฎนิ้วหัวแม่มือโดยประมาณ (ราวกับว่าเป็นจริง) ในกรณีที่ไม่เหมาะสม คำตอบจะเป็นจริงหากถูกแทนที่ด้วยข้อสรุปของความไม่เท่าเทียมกันของ Chebyshev (ซึ่งระบุว่าอย่างน้อย 75% ของการสังเกตอยู่ภายในสอง SDs ของการสังเกตค่าเฉลี่ย; อย่างน้อย 75% ของการตอบสนองคือ 2 หรือ 3) แต่นี่ จะไม่ให้ข้อมูลเชิงลึกมากนัก
whuber

นอกจากนี้มันเป็นเรื่องจริงสำหรับประชากรที่กระจายตัวตามปกติเท่านั้น จากตรงนั้นคุณสามารถคำนวณตัวเลขโดยพลการได้อย่างอิสระโดยการหาอินทิกรัลสำหรับรูปแบบไฟล์ PDF ปกติโดยมีขอบเขตที่ sd กำหนดรอบค่าเฉลี่ย ไม่เป็นประโยชน์จริงๆที่นี่
Douba
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.