อาจหมายถึงการบวกส่วนเบี่ยงเบนมาตรฐานหนึ่งค่าเกินค่าสูงสุดหรือไม่


19

ฉันมีค่าเฉลี่ย 74.10 และส่วนเบี่ยงเบนมาตรฐาน 33.44 สำหรับตัวอย่างที่มีค่าต่ำสุด 0 และสูงสุด 94.33

อาจารย์ของฉันถามฉันว่าค่าเฉลี่ยบวกหนึ่งส่วนเบี่ยงเบนมาตรฐานสูงกว่าค่าสูงสุดได้อย่างไร

ฉันแสดงตัวอย่างมากมายเกี่ยวกับเรื่องนี้ แต่เธอไม่เข้าใจ ฉันต้องการการอ้างอิงเพื่อแสดงให้เธอเห็น อาจเป็นบทหรือย่อหน้าใด ๆ จากหนังสือสถิติที่พูดถึงเรื่องนี้โดยเฉพาะ


ทำไมคุณต้องการเพิ่ม (หรือลบ) ส่วนเบี่ยงเบนมาตรฐานหนึ่งค่าจากค่าเฉลี่ย SD คือการวัดการแพร่กระจายของข้อมูล คุณต้องการข้อผิดพลาดมาตรฐานของค่าเฉลี่ยแทนหรือไม่?
Reinstate Monica - G. Simpson

ฉันไม่ต้องการเพิ่มหรือลบอันที่ต้องการคือศาสตราจารย์ของฉัน นั่นคือวิธีที่เธอเข้าใจความเบี่ยงเบนมาตรฐาน
Boyun Omuru

5
ตัวอย่างที่น่าสนใจคือตัวอย่าง (0.01,0.02,0.98,0.99) ทั้งค่าเฉลี่ยบวกค่าเบี่ยงเบนมาตรฐานและค่าเฉลี่ยลบค่าเบี่ยงเบนมาตรฐานอยู่นอก [0,1]
Glen_b -Reinstate Monica

บางทีเธออาจจะคิดถึงการกระจายตัวแบบปกติเหรอ?
user765195

คำตอบ:


28

แน่นอนค่าเฉลี่ยบวกหนึ่ง sd สามารถเกินการสังเกตที่ใหญ่ที่สุด

พิจารณาตัวอย่างที่ 1, 5, 5, 5 -

มันมีค่าเฉลี่ย 4 และส่วนเบี่ยงเบนมาตรฐาน 2 ดังนั้นค่าเฉลี่ย + sd คือ 6 หนึ่งมากกว่าค่าสูงสุดตัวอย่าง นี่คือการคำนวณใน R:

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

มันเป็นเรื่องธรรมดา มันมีแนวโน้มที่จะเกิดขึ้นเมื่อมีค่าสูงและหางออกไปทางซ้าย (เช่นเมื่อมีความเบ้ด้านซ้ายและจุดสูงสุดใกล้จุดสูงสุด)

-

ความเป็นไปได้เดียวกันนี้ใช้กับการแจกแจงความน่าจะเป็นไม่ใช่แค่ตัวอย่าง - ค่าเฉลี่ยประชากรบวกกับประชากร sd สามารถเกินค่าสูงสุดที่เป็นไปได้อย่างง่ายดาย

นี่คือตัวอย่างของความหนาแน่นซึ่งมีค่าสูงสุดที่เป็นไปได้ 1:เบต้า(10,12)

ป้อนคำอธิบายรูปภาพที่นี่

ในกรณีนี้เราสามารถดูที่หน้า Wikipedia สำหรับการแจกแจงเบต้าซึ่งระบุว่าค่าเฉลี่ยคือ:

E[X]=αα+β

และความแปรปรวนคือ:

var[X]=αβ(α+β)2(α+β+1)

(แม้ว่าเราไม่จำเป็นต้องพึ่งพาวิกิพีเดียเนื่องจากมันค่อนข้างง่ายที่จะหามา)

ดังนั้นสำหรับและเรามีค่าเฉลี่ยและ SD + SD จึงหมายถึงมากกว่าเป็นไปได้สูงสุด 1β = 1α=100.95230.06281.0152β=120.95230.06281.0152

นั่นคือมันได้อย่างง่ายดายไปได้ที่จะมีค่าเฉลี่ย + SD ที่ไม่สามารถสังเกตเห็นเป็นข้อมูลที่มีค่า

-

สำหรับทุกสถานการณ์ที่โหมดมีค่าสูงสุดค่าความเบ้ของโหมดเพียร์สันจะต้องเป็น สำหรับค่าเฉลี่ย + sd เกินค่าสูงสุด มันสามารถรับค่าใด ๆ บวกหรือลบดังนั้นเราจึงเห็นว่าเป็นไปได้อย่างง่ายดาย<-1

-

ปัญหาที่เกี่ยวข้องอย่างใกล้ชิดมักจะมองเห็นได้ด้วยช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามซึ่งเป็นช่วงเวลาที่ใช้กันทั่วไปในช่วงเวลาประมาณปกติสามารถผลิตนอกขีด จำกัด[0,1][0,1]

ตัวอย่างเช่นให้พิจารณาช่วงเวลาประมาณ 95.4% ปกติสำหรับสัดส่วนประชากรของความสำเร็จในการทดลองของ Bernoulli (ผลลัพธ์คือ 1 หรือ 0 แสดงถึงเหตุการณ์ความสำเร็จและความล้มเหลวตามลำดับ) โดยที่ 3 จาก 4 การสังเกตคือ " " และหนึ่งการสังเกตคือ " "010

จากนั้นขีด จำกัด สูงสุดสำหรับช่วงเวลาคือพี^+2×14พี^(1-พี^)=พี^+พี^(1-พี^)=0.75+0.433=1.183

นี่เป็นเพียงค่าเฉลี่ยตัวอย่าง + ค่าประมาณปกติของ sd สำหรับทวินาม ... และสร้างค่าที่เป็นไปไม่ได้

ตัวอย่าง SD ปกติสำหรับ 0,1,1,1 คือ 0.5 มากกว่า 0.433 (พวกมันต่างกันเพราะค่าทวินาม ML ของค่าเบี่ยงเบนมาตรฐานสอดคล้องกับการหารความแปรปรวนโดยแทนที่จะเป็น ) แต่มันก็ไม่ได้ทำให้แตกต่าง - ในทั้งสองกรณีหมายความว่า + sd เกินสัดส่วนที่ใหญ่ที่สุดnn-1พี^(1-พี^)nn-1

ความจริงเรื่องนี้ - ว่าช่วงปกติประมาณสำหรับทวินามสามารถผลิต "ค่าที่เป็นไปไม่ได้" มักจะถูกบันทึกไว้ในหนังสือและเอกสาร อย่างไรก็ตามคุณไม่ได้จัดการกับข้อมูลทวินาม อย่างไรก็ตามปัญหา - นั่นหมายถึง + ค่าเบี่ยงเบนมาตรฐานจำนวนหนึ่งไม่ใช่ค่าที่เป็นไปได้ - นั้นคล้ายคลึงกัน

-

ในกรณีของคุณค่า "0" ที่ผิดปกติในตัวอย่างของคุณคือการทำให้ sd มีขนาดใหญ่กว่าที่จะดึงค่าเฉลี่ยลงมาซึ่งเป็นสาเหตุที่ค่าเฉลี่ย + sd สูง

ป้อนคำอธิบายรูปภาพที่นี่

-

(คำถามจะเป็นไปได้ - โดยเหตุผลอะไรมันเป็นไปไม่ได้ - เพราะไม่รู้ว่าทำไมไม่มีใครคิดว่ามีปัญหาเราจะจัดการกับอะไร?)

แน่นอนมีเหตุผลหนึ่งแสดงให้เห็นว่าเป็นไปได้โดยให้ตัวอย่างที่เกิดขึ้น คุณทำสิ่งนั้นไปแล้ว ในกรณีที่ไม่มีเหตุผลที่ระบุว่าทำไมมันควรเป็นอย่างอื่นคุณจะทำอย่างไร?

หากตัวอย่างไม่เพียงพอหลักฐานอะไรที่จะยอมรับได้?

ไม่มีจุดไหนที่ชี้ไปที่ข้อความในหนังสือเนื่องจากหนังสือใด ๆ ที่อาจทำให้เกิดข้อผิดพลาด - ฉันเห็นพวกเขาตลอดเวลา เราต้องพึ่งพาการสาธิตโดยตรงว่าเป็นไปได้ไม่ว่าจะเป็นหลักฐานในพีชคณิต (เราสามารถสร้างจากตัวอย่างเบต้าด้านบนตัวอย่าง *) หรือตามตัวอย่างตัวเลข (ซึ่งคุณได้ให้ไว้แล้ว) ซึ่งทุกคนสามารถตรวจสอบความจริงของตนเองได้ .

* whuber แสดงเงื่อนไขที่แม่นยำสำหรับเคสเบต้าในความคิดเห็น


5
+1 ตัวอย่างเบต้าเป็นความคิดที่ดี ในความเป็นจริงให้และ , ใด ๆ Betaการจัดจำหน่ายจะมีค่าเฉลี่ย + SD เกิน . α > β ( 1 + β ) / ( 1 - β ) ( α , β ) 10<β<1α>β(1+β)/(1β)(α,β)1
whuber

ให้ฉันอธิบายเพิ่มเติม ฉันกำลังมองหาเปอร์เซ็นต์ความแม่นยำของอุปกรณ์เฉพาะที่ใช้สำหรับการแก้ไขฟัน และเครื่องมือนี้ทำเปอร์เซ็นต์ความแม่นยำสำหรับ 7 ฟันดังนี้:% 76,19,% 77,41,% 94,33,% 91,06,% 0,% 87,77,% 91,96 อาจารย์ของฉันเพิ่มค่าเบี่ยงเบนมาตรฐานหนึ่งค่าลงในค่าเฉลี่ยและระบุว่าผลลัพธ์ต้องไม่เกินค่าสูงสุดแม้แต่% 100 เพราะ% 100 เป็นเปอร์เซ็นต์ความแม่นยำสูงสุดที่อุปกรณ์สามารถทำงานได้
Boyun Omuru

2
เธอพูดถูกว่าร้อยละ> 100% ไม่สมเหตุสมผลกับสถานการณ์ของคุณ ปัญหาที่เกิดขึ้นเป็นจริงหลักฐานอันเป็นที่เพิ่มหนึ่ง SD จะหมายถึงควรให้ความรู้สึกในบริบทนี้เมื่อมันไม่ได้ นั่นคือสิ่งที่ฉันเชื่อว่าความยากของคุณมา หากเราเข้าใจว่าหลักฐานมาจากที่ใดมันอาจนำไปสู่การแก้ไขที่ดีขึ้น เป็นไปได้ว่ามีการระบุข้อเท็จจริงง่ายๆไว้ในหนังสือสักเล่ม (เป็นการสังเกตเล็กน้อยดังนั้นจึงเป็นไปได้ที่มันจะไม่เป็นเช่นนั้น) แต่ฉันสงสัยว่ามันจะถูกใส่เข้าไปในวิธีที่จะทำให้เธอพึงพอใจเพราะความเท็จของเธอ หลักฐานเป็นแหล่งที่มาของปัญหา
Glen_b -Reinstate Monica

1
อันที่จริง - ประเด็นย่อยของฉันคือความอยากรู้นี้เป็นผลมาจากการเบี่ยงเบนมาตรฐานที่แสดงถึงการแจกแจงแบบไม่สมมาตรอย่างรุนแรงแทนที่จะเป็นผลมาจากการเก็บตัวอย่าง แต่โดยทั่วไปแล้วฉันคิดว่าคำตอบของคุณยอดเยี่ยม
เฮนรี่

2
@ Tomka ฉันพยายามช่วยนักเรียนหลายคนในตำแหน่งที่คล้ายกัน ในที่สุดฉันก็ได้เรียนรู้กฎง่ายๆที่เป็นไปไม่ได้ที่จะสอนผู้บังคับบัญชาผ่านทางสื่อกลางของนักเรียนของพวกเขา
Glen_b -Reinstate Monica

4

ความไม่เท่าเทียมกันของ Chebyshev นั้นน้อยกว่าk -2คะแนนอาจมากกว่าค่าเบี่ยงเบนมาตรฐานk ดังนั้นสำหรับk = 1 ซึ่งหมายความว่าตัวอย่างของคุณน้อยกว่า 100% สามารถเบี่ยงเบนมาตรฐานได้มากกว่าหนึ่งค่า

มันน่าสนใจมากกว่าที่จะดูที่ขอบเขตต่ำ อาจารย์ของคุณควรแปลกใจมากขึ้นที่มีคะแนนซึ่งอยู่ที่ประมาณ 2.5 ส่วนเบี่ยงเบนมาตรฐานด้านล่างหมายถึง แต่ตอนนี้เรารู้ว่ามีเพียง 1 ใน 6 ของตัวอย่างของคุณที่สามารถเป็น 0


3

สาระสำคัญของปัญหาอาจเกิดจากการแจกจ่ายของคุณไม่ใช่การแจกแจงแบบปกติซึ่งค่าเบี่ยงเบนมาตรฐานจะถือว่า การกระจายของคุณมีแนวโน้มที่จะได้ใส่เบ้ดังนั้นคุณจึงจำเป็นที่จะเปลี่ยนชุดของคุณลงในการกระจายปกติเป็นครั้งแรกโดยการเลือกฟังก์ชั่นที่เหมาะสมเปลี่ยนกระบวนการนี้เรียกว่าการเปลี่ยนแปลงจะปกติ ฟังก์ชันตัวเลือกหนึ่งอย่างในกรณีของคุณอาจเป็นการแปลงบันทึกแบบมิร์เรอร์ เมื่อชุดของคุณผ่านการทดสอบตามปกติคุณสามารถทำการเบี่ยงเบนมาตรฐาน จากนั้นใช้ 1หรือ 2σσσค่าที่คุณต้องแปลงให้กลับเป็นพื้นที่ข้อมูลดั้งเดิมของคุณโดยใช้ค่าผกผันของฟังก์ชันแปลงของคุณ ฉันคิดว่านี่คือสิ่งที่อาจารย์ของคุณพูดถึง


5
นี่คือผลงานที่ดี ฉันไม่แน่ใจว่า SD จริงๆ "ถือว่า" การกระจายปกติ
gung - Reinstate Monica

3
"การจัดจำหน่ายที่เหมาะสม" และการค้นหาการเปลี่ยนแปลงสู่ภาวะปกติเป็นขั้นตอนที่แตกต่างกันโดยมีเป้าหมายที่แตกต่าง
whuber

2

โดยทั่วไปสำหรับตัวแปรสุ่ม Bernoulliที่ใช้ค่ากับความน่าจะเป็นและค่ากับความน่าจะเป็นเรามีX10<พี<101-พี

E(X)=พี,SE(X)=พี(1-พี)

และเราต้องการ

E(X)+SE(X)>1พี+พี(1-พี)>1

พี(1-พี)>(1-พี)

สแควร์ทั้งสองด้านที่จะได้รับ

พี(1-พี)>(1-พี)2พี>1-พีพี>12

ในคำพูดสำหรับตัวแปรสุ่ม Bernoulli ใด ๆ ที่มีนิพจน์เชิงทฤษฎีถือE ( X ) + S E ( X ) > Max Xพี>1/2E(X)+SE(X)>สูงสุดX

ตัวอย่างเช่นสำหรับตัวอย่างใด ๆ ที่ดึงมาจาก Bernoulli ด้วย, พูด, , ในกรณีส่วนใหญ่ค่าเฉลี่ยตัวอย่างบวกค่าเบี่ยงเบนมาตรฐานตัวอย่างจะสูงกว่าค่าซึ่งจะเป็นค่าสูงสุดที่สังเกตได้ (bar กรณีของ ตัวอย่างศูนย์ทั้งหมด!)1พี=0.71

สำหรับการแจกแจงอื่น ๆ เรามักจะมีทิศทางที่ตรงข้ามในความไม่เท่าเทียมกันเช่นหาชุดก็มักจะเป็นกรณีที่ b ดังนั้นจึงไม่มีกฎทั่วไปE ( U ) + S E ( U ) < max U = bยู(a,)E(ยู)+SE(ยู)<สูงสุดยู=

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.