แน่นอนค่าเฉลี่ยบวกหนึ่ง sd สามารถเกินการสังเกตที่ใหญ่ที่สุด
พิจารณาตัวอย่างที่ 1, 5, 5, 5 -
มันมีค่าเฉลี่ย 4 และส่วนเบี่ยงเบนมาตรฐาน 2 ดังนั้นค่าเฉลี่ย + sd คือ 6 หนึ่งมากกว่าค่าสูงสุดตัวอย่าง นี่คือการคำนวณใน R:
> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6
มันเป็นเรื่องธรรมดา มันมีแนวโน้มที่จะเกิดขึ้นเมื่อมีค่าสูงและหางออกไปทางซ้าย (เช่นเมื่อมีความเบ้ด้านซ้ายและจุดสูงสุดใกล้จุดสูงสุด)
-
ความเป็นไปได้เดียวกันนี้ใช้กับการแจกแจงความน่าจะเป็นไม่ใช่แค่ตัวอย่าง - ค่าเฉลี่ยประชากรบวกกับประชากร sd สามารถเกินค่าสูงสุดที่เป็นไปได้อย่างง่ายดาย
นี่คือตัวอย่างของความหนาแน่นซึ่งมีค่าสูงสุดที่เป็นไปได้ 1:เบต้า( 10 , 1)2)
ในกรณีนี้เราสามารถดูที่หน้า Wikipedia สำหรับการแจกแจงเบต้าซึ่งระบุว่าค่าเฉลี่ยคือ:
E[ X] = αα + β
และความแปรปรวนคือ:
var[ X] = อัลฟ่าบีตา( α + β)2( α + β+ 1 )
(แม้ว่าเราไม่จำเป็นต้องพึ่งพาวิกิพีเดียเนื่องจากมันค่อนข้างง่ายที่จะหามา)
ดังนั้นสำหรับและเรามีค่าเฉลี่ยและ SD + SD จึงหมายถึงมากกว่าเป็นไปได้สูงสุด 1β = 1α = 10 ≈0.9523≈0.0628≈1.0152β= 12≈ 0.9523≈ 0.0628≈ 1.0152
นั่นคือมันได้อย่างง่ายดายไปได้ที่จะมีค่าเฉลี่ย + SD ที่ไม่สามารถสังเกตเห็นเป็นข้อมูลที่มีค่า
-
สำหรับทุกสถานการณ์ที่โหมดมีค่าสูงสุดค่าความเบ้ของโหมดเพียร์สันจะต้องเป็น สำหรับค่าเฉลี่ย + sd เกินค่าสูงสุด มันสามารถรับค่าใด ๆ บวกหรือลบดังนั้นเราจึงเห็นว่าเป็นไปได้อย่างง่ายดาย<- 1
-
ปัญหาที่เกี่ยวข้องอย่างใกล้ชิดมักจะมองเห็นได้ด้วยช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามซึ่งเป็นช่วงเวลาที่ใช้กันทั่วไปในช่วงเวลาประมาณปกติสามารถผลิตนอกขีด จำกัด[0,1][ 0 , 1 ]
ตัวอย่างเช่นให้พิจารณาช่วงเวลาประมาณ 95.4% ปกติสำหรับสัดส่วนประชากรของความสำเร็จในการทดลองของ Bernoulli (ผลลัพธ์คือ 1 หรือ 0 แสดงถึงเหตุการณ์ความสำเร็จและความล้มเหลวตามลำดับ) โดยที่ 3 จาก 4 การสังเกตคือ " " และหนึ่งการสังเกตคือ " "010
จากนั้นขีด จำกัด สูงสุดสำหรับช่วงเวลาคือพี^+ 2 × 14พี^( 1 - p^)---------√= p^+ p^( 1 - p^)-------√= 0.75 + 0.433 = 1.183
นี่เป็นเพียงค่าเฉลี่ยตัวอย่าง + ค่าประมาณปกติของ sd สำหรับทวินาม ... และสร้างค่าที่เป็นไปไม่ได้
ตัวอย่าง SD ปกติสำหรับ 0,1,1,1 คือ 0.5 มากกว่า 0.433 (พวกมันต่างกันเพราะค่าทวินาม ML ของค่าเบี่ยงเบนมาตรฐานสอดคล้องกับการหารความแปรปรวนโดยแทนที่จะเป็น ) แต่มันก็ไม่ได้ทำให้แตกต่าง - ในทั้งสองกรณีหมายความว่า + sd เกินสัดส่วนที่ใหญ่ที่สุดnn-1พี^( 1 - p^)nn - 1
ความจริงเรื่องนี้ - ว่าช่วงปกติประมาณสำหรับทวินามสามารถผลิต "ค่าที่เป็นไปไม่ได้" มักจะถูกบันทึกไว้ในหนังสือและเอกสาร อย่างไรก็ตามคุณไม่ได้จัดการกับข้อมูลทวินาม อย่างไรก็ตามปัญหา - นั่นหมายถึง + ค่าเบี่ยงเบนมาตรฐานจำนวนหนึ่งไม่ใช่ค่าที่เป็นไปได้ - นั้นคล้ายคลึงกัน
-
ในกรณีของคุณค่า "0" ที่ผิดปกติในตัวอย่างของคุณคือการทำให้ sd มีขนาดใหญ่กว่าที่จะดึงค่าเฉลี่ยลงมาซึ่งเป็นสาเหตุที่ค่าเฉลี่ย + sd สูง
-
(คำถามจะเป็นไปได้ - โดยเหตุผลอะไรมันเป็นไปไม่ได้ - เพราะไม่รู้ว่าทำไมไม่มีใครคิดว่ามีปัญหาเราจะจัดการกับอะไร?)
แน่นอนมีเหตุผลหนึ่งแสดงให้เห็นว่าเป็นไปได้โดยให้ตัวอย่างที่เกิดขึ้น คุณทำสิ่งนั้นไปแล้ว ในกรณีที่ไม่มีเหตุผลที่ระบุว่าทำไมมันควรเป็นอย่างอื่นคุณจะทำอย่างไร?
หากตัวอย่างไม่เพียงพอหลักฐานอะไรที่จะยอมรับได้?
ไม่มีจุดไหนที่ชี้ไปที่ข้อความในหนังสือเนื่องจากหนังสือใด ๆ ที่อาจทำให้เกิดข้อผิดพลาด - ฉันเห็นพวกเขาตลอดเวลา เราต้องพึ่งพาการสาธิตโดยตรงว่าเป็นไปได้ไม่ว่าจะเป็นหลักฐานในพีชคณิต (เราสามารถสร้างจากตัวอย่างเบต้าด้านบนตัวอย่าง *) หรือตามตัวอย่างตัวเลข (ซึ่งคุณได้ให้ไว้แล้ว) ซึ่งทุกคนสามารถตรวจสอบความจริงของตนเองได้ .
* whuber แสดงเงื่อนไขที่แม่นยำสำหรับเคสเบต้าในความคิดเห็น