ค่าเบี่ยงเบนมาตรฐานผิดอย่างสิ้นเชิงหรือไม่? คุณสามารถคำนวณ std สำหรับความสูงจำนวนและอื่น ๆ (จำนวนบวก) ได้อย่างไร


13

สมมติว่าฉันคำนวณความสูง (หน่วยเป็นซม.) และตัวเลขต้องสูงกว่าศูนย์

นี่คือรายการตัวอย่าง:

0.77132064
0.02075195
0.63364823
0.74880388
0.49850701
0.22479665
0.19806286
0.76053071
0.16911084
0.08833981

Mean: 0.41138725956196015
Std: 0.2860541519582141

ในตัวอย่างนี้ตามการแจกแจงปกติ 99.7% ของค่าต้องอยู่ระหว่าง± 3 เท่าของค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย อย่างไรก็ตามค่าเบี่ยงเบนมาตรฐานจะเป็นลบสองเท่า

-2 x std calculation = 0.41138725956196015 - 0.2860541519582141 x 2 = -0,160721044354468

อย่างไรก็ตามตัวเลขของฉันต้องเป็นค่าบวก ดังนั้นพวกเขาต้องอยู่เหนือ 0 ฉันสามารถเพิกเฉยกับจำนวนลบได้ แต่ฉันสงสัยว่านี่เป็นวิธีที่ถูกต้องในการคำนวณความน่าจะเป็นโดยใช้ค่าเบี่ยงเบนมาตรฐาน

มีใครช่วยให้ฉันเข้าใจถ้าฉันใช้สิ่งนี้ในวิธีที่ถูกต้อง? หรือฉันต้องเลือกวิธีอื่น

ความจริงแล้วคณิตศาสตร์เป็นคณิตศาสตร์ มันไม่สำคัญว่าจะเป็นการแจกแจงแบบปกติหรือไม่ หากทำงานกับตัวเลขที่ไม่ได้ลงชื่อก็ควรทำงานกับตัวเลขบวกเช่นกัน! ฉันผิดหรือเปล่า?

EDIT1: เพิ่มฮิสโตแกรม

เพื่อความชัดเจนยิ่งขึ้นฉันได้เพิ่มฮิสโตแกรมข้อมูลจริงของฉัน ป้อนคำอธิบายรูปภาพที่นี่

EDIT2: ค่าบางอย่าง

Mean: 0.007041500928135767
Percentile 50: 0.0052000000000000934
Percentile 90: 0.015500000000000047
Std: 0.0063790857035425025
Var: 4.06873389299246e-05

28
ฉันคิดว่าความเข้าใจผิดที่นี่คือการแจกแจงที่สามารถมีตัวเลขที่เป็นบวกเท่านั้นนั้นไม่ปกติดังนั้นกฎ 99.7% ที่คุณระบุไม่ได้ใช้ ประการที่สองจากสูตรเบี่ยงเบนมาตรฐาน (ตัวอย่าง) คุณจะเห็นว่าไม่มีเงื่อนไขใด ๆ ของค่าดั้งเดิมที่เป็นค่าบวก - ดังนั้นทำไมจึงควรผิด อาจเป็นไปได้ว่ามีการใช้งานผิด แต่สถิติส่วนใหญ่ไม่เชื่อเรื่องพระเจ้าและไม่ควรใช้อย่างไร้เหตุผล
Momo

8
ความงามของกฎ 68-95-99.7, @Momo คือว่ามันไม่ใช้แม้กระทั่งหลายกระจายเด็ดที่ไม่ปกติ ในกรณีนี้ 50% ของตัวเลขอยู่ภายใน 1 sd ของค่าเฉลี่ยและ 100% อยู่ภายใน 2 sds ของค่าเฉลี่ย สังเกตว่า 68% มีความแม่นยำประมาณ 50% และ 95% มีความแม่นยำประมาณ 100% ภายในส่วนเบี่ยงเบนที่เราคาดหวังจากชุดข้อมูลขนาดเล็กดังกล่าว ดังนั้นตัวอย่างนี้แสดงให้เห็นถึงกฎของหัวแม่มือแม้ว่ามันอาจจะไม่น่าเชื่อถือเล็กน้อยเนื่องจากมีขนาดเล็ก
whuber

2
ฉันเห็นด้วย. ให้ฉันแก้ไขสิ่งนี้เป็น "ดังนั้นกฎ 99.7% ที่คุณระบุไม่จำเป็นต้องใช้" แหล่งที่มาของความสับสนที่นี่ดูเหมือนจะใช้สิ่งนี้เป็นมากกว่ากฎของหัวแม่มือและไม่ใช่ในแง่ของความเหมาะสมของคุณ "ประมาณภายในเบี่ยงเบนที่เราคาดหวัง" OP ความคิดเห็นล่าสุดแสดงให้เห็นว่า
Momo

4
ควรเปลี่ยนชื่อเรื่องเป็น "วิธีใช้กฎ 68-95-99.7 กับข้อมูลที่ต้องเป็นบวก" หรือไม่ ฉันคิดว่ามันรวบรวมจิตวิญญาณของคำถามได้มากกว่า (ไม่มีปัญหากับวิธีการคำนวณค่าเบี่ยงเบนมาตรฐานซึ่งเป็นสิ่งที่ชื่อแนะนำ แต่วิธีที่ใช้ในการค้นหาความน่าจะเป็น)
Silverfish

4
ค่าเบี่ยงเบนมาตรฐานไม่ใช่ "ผิด" สิ่งที่มีความแม่นยำน้อยกว่านั้นคือการปฏิบัติเหมือนสิ่งปกติซึ่งไม่ใช่; สัดส่วนนอกจำนวนเบี่ยงเบนมาตรฐานที่ระบุโดยนัยโดยปกติจะไม่แม่นยำสำหรับการแจกแจงแบบอื่น สำหรับการแจกแจงแบบ Unimodal แบบต่อเนื่องใกล้เคียงกับค่าเบี่ยงเบนมาตรฐาน 2 ค่าช่วงเวลาแบบสองด้านนั้นมักจะค่อนข้างสมเหตุสมผล
Glen_b -Reinstate Monica

คำตอบ:


23

หากตัวเลขของคุณเป็นค่าบวกเท่านั้นการสร้างแบบจำลองพวกเขาเป็นการกระจายแบบปกติอาจไม่เป็นที่ต้องการทั้งนี้ขึ้นอยู่กับกรณีการใช้งานของคุณเพราะการแจกแจงแบบปกตินั้นรองรับจำนวนจริงทั้งหมด

บางทีคุณอาจต้องการสร้างแบบจำลองความสูงเป็นการแจกแจงแบบเลขชี้กำลังหรืออาจเป็นการกระจายแบบปกติที่ถูกตัดทอน

แก้ไข: หลังจากเห็นข้อมูลของคุณแล้วดูเหมือนว่ามันจะเหมาะสมกับการแจกแจงแบบเอ็กซ์โพเนนเชียลอย่างแน่นอน! คุณสามารถประมาณค่าพารามิเตอร์โดยการใช้วิธีการโอกาสสูงสุดλ


10
ประโยคแรกไม่ถูกต้องโดยทั่วไป: จำนวนมากที่เป็นบวกอย่างเคร่งครัดมักจะประมาณโดยการกระจายปกติ หากค่าความน่าจะเป็นที่ต่ำกว่า 0 มีขนาดเล็กมากมันไม่สำคัญสำหรับวัตถุประสงค์ในทางปฏิบัติทั้งหมด ในกรณีพิเศษนี้ถูกต้องอย่างแน่นอน
COOLSerdash

13
-1 คำตอบนี้สะท้อนให้เห็นถึงความเข้าใจผิด (และ imho อันตราย) เกี่ยวกับแบบจำลองทางสถิติที่จัดขึ้นอย่างกว้างขวางและความหมายของแบบจำลองข้อมูลด้วยการแจกแจงแบบปกติคืออะไร แน่นอนถ้าเราต้องเชื่อในสิ่งที่โพสต์นี้พูดแล้วมันจะ "ผิดพลาดแน่นอน" ที่เคยประมาณการแจกแจงแบบทวินามที่มีการแจกแจงแบบปกติ - แต่นี่คือประวัติศาสตร์การใช้งานแบบเดิมและเป็นไปได้มากที่สุด! (แก้ไข: ฉันออก downvote เพราะคุณปรับเปลี่ยนการเรียกร้องเดิมเป็นหนึ่งที่ถูกต้องมากขึ้นและมีประโยชน์.)
whuber

4
ขึ้นอยู่กับสิ่งที่คุณหมายถึงโดย "ดีกว่า" ส่วนหนึ่งของค่าใช้จ่ายของแบบจำลองนั้นขึ้นอยู่กับสิ่งที่ต้องนำไปปฏิบัติ หากคุณใช้รูปแบบปกติที่ถูกตัดทอนคุณอาจต้องคำนวณตัวเลขเองมากกว่าการคำนวณเชิงวิเคราะห์ที่รวดเร็วง่ายและอาจถูกต้องแม่นยำ วัตถุประสงค์อีกประการของแบบจำลองคือการให้ข้อมูลเชิงลึก : คนหนึ่งคิดว่า "ถ้าธรรมชาติมีพฤติกรรมอย่างน้อยประมาณเช่นสมมติฐานเหล่านี้ดังนั้นผลลัพธ์ใดที่สามารถอนุมานได้จากสมมติฐานเหล่านั้น" บ่อยครั้งที่การอนุมานเช่นนั้นง่ายขึ้นด้วยการประมาณง่ายๆ
whuber

2
@whuber: หลังจาก "ถูกต้องสวยงาม" ฉันเพิ่มจิตใจ "ผิด" ขอโทษ แน่นอนยัง "แต่มีประโยชน์" ต่อกล่อง
Stephan Kolassa

2
แม้ว่าข้อมูลจะประกอบด้วยค่าที่ไม่ใช่จำนวนเต็ม?
Kevin Li

19

"วิธีที่ถูกต้องในการใช้ 68-95-99.7 กับกรณีของฉันคืออะไร"

เพียงหนึ่งเดียวที่ควรคาดหวังว่ากฎของหัวแม่มือที่ได้รับความคุ้มครองที่จะใช้ตรงเท่านั้นถ้าคุณคือ (1) การมองหาที่ทั้งหมด (อนันต์) ประชากรหรือการกระจายความน่าจะเป็นในทางทฤษฎีและ (2) การจัดจำหน่ายเป็นปกติว่า

หากคุณสุ่มตัวอย่างขนาด 20 จากการแจกแจงแบบปกติอย่างแท้จริงคุณจะไม่พบว่า 95% ของข้อมูล (19 จาก 20 รายการ) อยู่ภายในค่าเบี่ยงเบนมาตรฐาน 2 (หรือ 1.960) ในความเป็นจริงไม่มีการรับประกันว่า 19 ใน 20 รายการจะอยู่ภายในค่าเบี่ยงเบนมาตรฐานประชากร 1.960 ของค่าเฉลี่ยประชากรหรือ 19 ใน 20 รายการนั้นอยู่ในค่าเบี่ยงเบนมาตรฐานตัวอย่าง 1.960 ของค่าเฉลี่ยตัวอย่าง

หากคุณนำตัวอย่างข้อมูลจากการกระจายที่ไม่ได้กระจายตามปกติแล้วอีกครั้งหนึ่งจะไม่คาดหวังว่ากฎ 68-95-99.7 จะใช้อย่างถูกต้อง แต่มันอาจเข้าใกล้การทำเช่นนั้นโดยเฉพาะอย่างยิ่งถ้าขนาดตัวอย่างมีขนาดใหญ่ (กฎของนิ้วหัวแม่มือ "99.7%" อาจไม่มีความหมายโดยเฉพาะอย่างยิ่งกับขนาดตัวอย่างต่ำกว่า 1,000) และการแจกแจงนั้นใกล้เคียงกับมาตรฐาน ในทางทฤษฎีข้อมูลจำนวนมากเช่นส่วนสูงหรือน้ำหนักไม่สามารถมาจากการแจกแจงแบบปกติได้อย่างแม่นยำหรือนั่นอาจหมายถึงความน่าจะเป็นที่มีขนาดเล็ก แต่ไม่ใช่ศูนย์ อย่างไรก็ตามสำหรับข้อมูลที่มีการแจกแจงแบบสมมาตรและ unimodal โดยที่ค่า middling เป็นเรื่องธรรมดามากและค่าที่สูงมากหรือต่ำมากน่าจะเป็นแบบจำลองของการแจกแจงแบบปกติอาจเพียงพอสำหรับการใช้งานจริงหากฮิสโตแกรมของฉันแสดงเส้นโค้งรูประฆังฉันสามารถพูดได้ว่าข้อมูลของฉันได้รับการกระจายตามปกติ?

หากคุณต้องการขอบเขตที่มีผลผูกพันทางทฤษฎีที่ใช้กับการแจกแจงใด ๆ ให้ดูที่ความไม่เท่าเทียมกันของ Chebyshevซึ่งระบุว่าค่ามากที่สุดของค่าสามารถอยู่ได้มากกว่า k1/k2kค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย สิ่งนี้รับประกันได้ว่าอย่างน้อย 75% ของข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าและ 89% ภายในค่าเบี่ยงเบนมาตรฐานสามค่า แต่ตัวเลขเหล่านั้นเป็นเพียงการรับประกันขั้นต่ำตามหลักวิชา สำหรับการแจกแจงรูประฆังประมาณคร่าวๆคุณจะพบว่าตัวเลขการเบี่ยงเบนมาตรฐานสองค่านั้นใกล้เคียงกับ 95% มากกว่า 75% ดังนั้น "กฎแห่งหัวแม่มือ" จากการแจกแจงแบบปกติก็ยังคงมีประโยชน์ ในทางกลับกันหากข้อมูลของคุณมาจากการกระจายที่ไม่มีรูประฆังคุณอาจจะสามารถหารูปแบบทางเลือกที่อธิบายข้อมูลได้ดีขึ้นและมีกฎการครอบคลุมที่แตกต่างกัน

(สิ่งหนึ่งที่ดีเกี่ยวกับกฎ 68-95-99.7 คือมันใช้กับการแจกแจงปกติใด ๆโดยไม่คำนึงถึงพารามิเตอร์ของมันสำหรับค่าเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานในทำนองเดียวกันความไม่เท่าเทียมกันของ Chebyshev นำไปใช้โดยไม่คำนึงถึงพารามิเตอร์หรือแม้แต่การกระจาย ให้ขอบเขตที่ต่ำกว่าสำหรับการครอบคลุม แต่ถ้าคุณใช้โมเดลที่ถูกตัดทอนแบบปกติหรือแบบเอียงดังนั้นก็จะไม่เท่ากับการครอบคลุมแบบ "68-95-99.7" แบบง่าย ๆ เพราะมันจะขึ้นอยู่กับพารามิเตอร์ของการแจกแจง .)


7

มีใครช่วยให้ฉันเข้าใจถ้าฉันใช้สิ่งนี้ในวิธีที่ถูกต้อง?

โอ้นั่นง่าย ไม่คุณใช้ไม่ถูกต้อง

ก่อนอื่นคุณใช้ชุดข้อมูลที่ค่อนข้างเล็ก การพยายามหยอกล้อพฤติกรรมเชิงสถิติจากชุดขนาดนี้เป็นไปได้อย่างแน่นอน แต่ขอบเขตความเชื่อมั่นค่อนข้างมาก (อะแฮ่ม) ค่อนข้างใหญ่ สำหรับชุดข้อมูลขนาดเล็กการเบี่ยงเบนจากการแจกแจงที่คาดไว้นั้นเป็นเรื่องปกติสำหรับหลักสูตรและยิ่งชุดเล็กยิ่งปัญหาก็ยิ่งมากเท่านั้น โปรดจำไว้ว่า "กฎหมายเฉลี่ยไม่เพียง แต่อนุญาตให้เกิดความบังเอิญที่ร้ายแรงที่สุดเท่านั้น

ยิ่งไปกว่านั้นชุดข้อมูลเฉพาะที่คุณใช้นั้นดูไม่เหมือนการแจกแจงแบบปกติ ลองคิดดู - ด้วยค่าเฉลี่ยของ. 498 คุณมีสองตัวอย่างต่ำกว่า 0.1 และอีกสามตัวอย่างที่. 748 หรือสูงกว่า จากนั้นคุณจะได้กลุ่ม 3 คะแนนระหว่าง. 17 และ. 22 การดูชุดข้อมูลนี้โดยเฉพาะและให้เหตุผลว่าการแจกแจงแบบปกตินั้นเป็นกรณีที่ดีสำหรับอาร์กิวเมนต์ Procrustean นั่นดูเหมือนระฆังโค้งสำหรับคุณหรือไม่? เป็นไปได้อย่างสมบูรณ์แบบที่ประชากรขนาดใหญ่ทำตามปกติหรือแก้ไขการกระจายตัวแบบปกติและขนาดตัวอย่างที่ใหญ่กว่าจะแก้ปัญหานี้ แต่ฉันจะไม่เดิมพันโดยเฉพาะอย่างยิ่งหากไม่รู้เกี่ยวกับประชากร

ฉันพูดว่าแก้ไขแบบปกติเนื่องจากเควินหลี่ชี้ให้เห็นแล้วเทคนิคการแจกแจงแบบปกตินั้นรวมจำนวนจริงทั้งหมด ในขณะที่ยังชี้ให้เห็นในความคิดเห็นคำตอบของเขานี้ไม่ได้ป้องกันการใช้การกระจายดังกล่าวในช่วงที่ จำกัด และได้รับผลลัพธ์ที่เป็นประโยชน์ ตามคำกล่าวที่ว่า "ทุกรุ่นผิดบางอันมีประโยชน์"

แต่ชุดข้อมูลเฉพาะชุดนี้ดูเหมือนจะไม่ได้แปลว่าการแจกแจงแบบปกติ (แม้ในช่วงที่ จำกัด ) เป็นความคิดที่ดีเป็นพิเศษ หากจุดข้อมูล 10 จุดของคุณดูเหมือน. 270, .325, .375, .425, .475, .525, .575, .625, .625, .675, .2525 (เฉลี่ย 0.500) คุณจะใช้การแจกแจงแบบปกติหรือไม่?


ฉันใช้ข้อมูลแบบสุ่มเพื่ออธิบายความต้องการและปัญหาของฉัน
Don Coder

1
@ DonCoder ข้อมูลสุ่ม (เว้นแต่คุณจะบิดมันอย่างใด) จะเป็นไปตามการแจกแจงแบบสม่ำเสมอไม่ใช่การแจกแจงแบบปกติ
barrycarter

5
จำเป็นต้องสร้างข้อมูลสุ่มจากการแจกจ่ายบางอย่าง คุณเลือกแบบไหน
Peter Flom - Reinstate Monica

ฉันได้เพิ่มฮิสโตแกรมของข้อมูลจริงของฉันแล้ว
Don Coder

2

ในหนึ่งในความคิดเห็นที่คุณพูดว่าคุณใช้ "ข้อมูลสุ่ม" แต่คุณไม่ได้พูดจากการกระจายใด หากคุณกำลังพูดถึงความสูงของมนุษย์พวกมันจะกระจายตัวตามปกติ แต่ข้อมูลของคุณไม่เหมาะกับความสูงของมนุษย์จากระยะไกล - คุณเป็นเศษส่วนของเซนติเมตร!

และข้อมูลของคุณไม่ปกติจากระยะไกล ฉันเดาว่าคุณใช้การกระจายแบบสม่ำเสมอที่มีขอบเขตเป็น 0 และ 1 และคุณสร้างตัวอย่างที่มีขนาดเล็กมาก ลองด้วยตัวอย่างที่ใหญ่กว่า:

set.seed(1234)  #Sets a seed
x <- runif(10000, 0 , 1)
sd(x)  #0.28

ดังนั้นไม่มีข้อมูลใดเกินกว่า 2 sd จากค่าเฉลี่ยเนื่องจากอยู่นอกขอบเขตของข้อมูล และส่วนภายใน 1 sd จะอยู่ที่ประมาณ 0.56


1

บ่อยครั้งเมื่อคุณมีข้อ จำกัด ว่าตัวอย่างของคุณทั้งหมดต้องเป็นค่าบวกมันมีค่าควรดูที่ลอการิทึมของข้อมูลของคุณเพื่อดูว่าการกระจายของคุณสามารถประมาณโดยการแจกแจงแบบปกติ


1

การคำนวณค่าเบี่ยงเบนมาตรฐานสัมพันธ์กับค่าเฉลี่ย คุณสามารถใช้ค่าเบี่ยงเบนมาตรฐานกับตัวเลขที่เป็นค่าบวกได้หรือไม่? อย่างแน่นอน หากคุณต้องเพิ่ม 1,000 ในแต่ละค่าในชุดตัวอย่างของคุณคุณจะเห็นค่าเบี่ยงเบนมาตรฐานเดียวกัน แต่คุณจะให้ห้องหายใจที่มากกว่าศูนย์

s=i=1N(xix¯)2N1=i=1N((xi+k)(x¯+k))2N1

อย่างไรก็ตามการเพิ่มค่าคงที่โดยพลการให้กับข้อมูลของคุณนั้นเป็นเพียงผิวเผิน เมื่อใช้ค่าเบี่ยงเบนมาตรฐานสำหรับชุดข้อมูลที่มีขนาดเล็กมากคุณจะต้องคาดหวังเอาต์พุตที่ไม่เจาะจง พิจารณาค่าเบี่ยงเบนมาตรฐานเช่นเลนส์กล้องโฟกัสอัตโนมัติ: ยิ่งคุณให้ข้อมูลมากเท่าไหร่ภาพก็จะยิ่งคมชัดขึ้นเท่านั้น หากหลังจากที่คุณติดตาม 1000000 จุดข้อมูลค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของคุณจะยังคงเท่ากับ 10 ดังนั้นฉันอาจเริ่มตั้งคำถามเกี่ยวกับความถูกต้องของการทดสอบของคุณ


1

ฮิสโตแกรมของคุณแสดงให้เห็นว่าการแจกแจงแบบปกตินั้นไม่เหมาะสม คุณสามารถลอง lognormal หรืออย่างอื่นที่ไม่สมดุลและเป็นบวกอย่างเคร่งครัด


1

ประเด็นหลักคือพวกเราหลายคนขี้เกียจ * และการแจกแจงแบบปกตินั้นสะดวกที่จะทำงานร่วมกับคนขี้เกียจของเรา มันง่ายในการคำนวณโดยใช้การแจกแจงแบบปกติและมีพื้นฐานทางคณิตศาสตร์ที่ดี เช่นนี้มันเป็น "รุ่น" สำหรับวิธีการทำงานกับข้อมูล รุ่นนี้ใช้งานได้ดีอย่างน่าประหลาดใจและบางครั้งก็ตกลงบนใบหน้า

เป็นที่ชัดเจนว่าตัวอย่างของคุณไม่ได้ระบุการแจกแจงแบบปกติในข้อมูล ดังนั้นทางออกสำหรับคุณคือการเลือก "รุ่น" ที่แตกต่างกันและทำงานกับการกระจายที่แตกต่างกัน การกระจาย Weibull อาจเป็นไปในทิศทางมีคนอื่น

  • ขี้เกียจไม่เข้าใจข้อมูลและเลือกแบบจำลองที่ดีกว่าเมื่อจำเป็น

0

โดยทั่วไปคุณกำลังใช้ข้อมูลอัตราส่วนต่างจากข้อมูลช่วงเวลา นักภูมิศาสตร์ใช้เวลาตลอดเวลาในการคำนวณ S / D สำหรับปริมาณน้ำฝนประจำปีในสถานที่เฉพาะ (100 ปีของคะแนนตัวอย่างที่ LA Civic Center) หรือปริมาณหิมะ (100 ตัวอย่างของทะเลสาบหิมะที่ Big Bear Lake) เรามีได้แค่ตัวเลขบวกนั่นคือวิธีที่มันเป็น


0

ในอุตุนิยมวิทยาการกระจายของความเร็วลมมีลักษณะเช่นนี้มาก โดยความหมายความเร็วลมก็ไม่เป็นลบ

ดังนั้นในกรณีของคุณฉันจะดูการกระจาย Weibullอย่างแน่นอน


0

คุณเริ่มต้นด้วย "ตามการแจกแจงปกติ" เมื่อข้อมูลของคุณไม่ชัดเจนว่าเป็นการแจกแจงปกตินั่นเป็นปัญหาแรก คุณพูดว่า "มันไม่สำคัญว่าจะเป็นการแจกแจงแบบปกติหรือไม่" ซึ่งเป็นเรื่องไร้สาระแน่นอน คุณไม่สามารถใช้คำสั่งเกี่ยวกับข้อมูลที่แจกจ่ายแบบปกติหากข้อมูลของคุณไม่ได้รับการเผยแพร่แบบปกติ

และคุณตีความคำแถลงนั้นผิด "99.7% จะต้องอยู่ภายในสามส่วนเบี่ยงเบนมาตรฐาน" และ 99.7% ของข้อมูลของคุณเป็นจริงภายในสามส่วนเบี่ยงเบนมาตรฐาน ยิ่งไปกว่านั้นมันเป็น 100% ภายในสองส่วนเบี่ยงเบนมาตรฐาน ดังนั้นคำสั่งที่เป็นความจริง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.