วิธีทั่วไปสำหรับการรับข้อผิดพลาดมาตรฐาน


11

ฉันไม่สามารถหาวิธีทั่วไปในการรับข้อผิดพลาดมาตรฐานได้ทุกที่ ฉันดูใน google เว็บไซต์นี้และแม้แต่ในตำราเรียน แต่สิ่งที่ฉันสามารถค้นหาได้คือสูตรข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยความแปรปรวนสัดส่วนสัดส่วนความเสี่ยง ฯลฯ ... และไม่ใช่ว่าสูตรเหล่านี้มาถึงอย่างไร

หากร่างกายใด ๆ สามารถอธิบายได้ด้วยคำง่ายๆหรือแม้กระทั่งเชื่อมโยงฉันไปยังแหล่งข้อมูลที่ดีซึ่งอธิบายว่าฉันจะขอบคุณ


2
ผมมีรูปแบบที่เรียบง่ายทั่วไปและใช้มันมีรายละเอียดทั้งหมดทำงานออกในโพสต์ที่stats.stackexchange.com/a/18609/919 ข้อความนี้และโพสต์อื่น ๆ อีกมากมายเกี่ยวกับข้อผิดพลาดมาตรฐาน (เกือบหนึ่งพันจนถึงปัจจุบัน) สามารถพบได้โดยการค้นหา"ข้อผิดพลาดมาตรฐาน"
whuber

คำตอบ:


22

สิ่งที่คุณต้องการหาคือค่าเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่างของค่าเฉลี่ย เช่นในภาษาอังกฤษธรรมดากระจายการสุ่มตัวอย่างคือเมื่อคุณเลือกรายการจากประชากรของคุณเพิ่มพวกเขาร่วมกันและแบ่งผลรวมโดยnเราพบความแปรปรวนของปริมาณนี้มากกว่าและรับส่วนเบี่ยงเบนมาตรฐานโดยการหาสแควร์รูทของความแปรปรวนnnn

ดังนั้นขอรายการที่คุณเลือกจะแสดงโดยตัวแปรสุ่มแต่ละของพวกเขาเหมือนกันกระจายกับความแปรปรวน 2 พวกมันสุ่มตัวอย่างอย่างอิสระดังนั้นความแปรปรวนของผลรวมจึงเป็นเพียงผลรวมของความแปรปรวน σ 2 Var ( n i = 1 X i ) = n i = 1 Var ( X i ) = n i = 1 σ 2 = n σ 2Xi,1inσ2

Var(i=1nXi)=i=1nVar(Xi)=i=1nσ2=nσ2

ต่อไปเราหารด้วยnเรารู้โดยทั่วไปแล้วว่าดังนั้นการใส่เรามีVar ( k Y ) = k 2 Var ( Y ) k = 1 / nnVar(kY)=k2Var(Y)k=1/n

Var(i=1nXin)=1n2Var(i=1nXi)=1n2nσ2=σ2n

สุดท้ายใช้รากที่จะได้รับค่าเบี่ยงเบนมาตรฐาน{n}} เมื่อค่าเบี่ยงเบนมาตรฐานของประชากรที่ไม่สามารถใช้ได้ค่าเบี่ยงเบนมาตรฐานตัวอย่างใช้เป็นประมาณการให้{n}} ssσnssn

ทั้งหมดข้างต้นเป็นจริงโดยไม่คำนึงถึงการกระจายของ s แต่มันเป็นคำถามของสิ่งที่คุณต้องการจะทำอย่างไรกับข้อผิดพลาดมาตรฐาน? โดยทั่วไปคุณอาจต้องการสร้างช่วงความมั่นใจและจากนั้นจึงกำหนดความน่าจะเป็นในการสร้างช่วงความมั่นใจที่มีค่าเฉลี่ยXi

ถ้า s ของคุณกระจายแบบปกตินี่เป็นเรื่องง่ายเพราะจากนั้นการกระจายตัวตัวอย่างก็จะกระจายแบบปกติเช่นกัน คุณสามารถพูดได้ว่า 68% ของตัวอย่างของค่าเฉลี่ยจะอยู่ภายใน 1 ข้อผิดพลาดมาตรฐานของค่าเฉลี่ยจริง 95% จะอยู่ใน 2 ข้อผิดพลาดมาตรฐาน ฯลฯXi

หากคุณมีตัวอย่างที่มีขนาดใหญ่พอ (หรือตัวอย่างที่มีขนาดเล็กกว่าและนั้นไม่ผิดปกติมากเกินไป) จากนั้นคุณสามารถเรียกใช้ทฤษฎีขีด จำกัด กลางและบอกว่าการกระจายตัวตัวอย่างนั้นกระจายโดยทั่วไปประมาณและความน่าจะเป็นของคุณXi

กรณีในจุดประมาณสัดส่วนที่คุณวาดรายการแต่ละรายการจากการกระจาย Bernouilli ความแปรปรวนของการแจกแจงแต่ละรายการคือและดังนั้นข้อผิดพลาดมาตรฐานคือ (สัดส่วนถูกประมาณโดยใช้ข้อมูล) หากต้องการข้ามไปที่การบอกว่าประมาณร้อยละของกลุ่มตัวอย่างอยู่ในส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ยคุณต้องเข้าใจเมื่อการกระจายตัวตัวอย่างเป็นปกติประมาณ การสุ่มตัวอย่างซ้ำ ๆ จากการแจกแจงเบอร์นูอิลลีนั้นเหมือนกับการสุ่มตัวอย่างจากการแจกแจงแบบทวินามและกฎทั่วไป 1 ข้อที่ใช้กันก็คือประมาณเมื่อและคือn X i p ( 1 - p ) pnXip(1p)p(1p)/npnpn(1p)5. (ดูวิกิพีเดียสำหรับการสนทนาในเชิงลึกเพิ่มเติมเกี่ยวกับการประมาณทวินามด้วยปกติดูที่นี่สำหรับตัวอย่างการทำงานของข้อผิดพลาดมาตรฐานที่มีสัดส่วน)

หากในอีกทางหนึ่งการแจกแจงตัวอย่างของคุณไม่สามารถประมาณได้ด้วยการแจกแจงแบบปกติดังนั้นข้อผิดพลาดมาตรฐานจะมีประโยชน์น้อยกว่ามาก ตัวอย่างเช่นด้วยการแจกแจงแบบอสมมาตรคุณไม่สามารถบอกได้ว่า% ของตัวอย่างเดียวกันจะเป็นค่าเบี่ยงเบนมาตรฐานทั้งสองด้านของค่าเฉลี่ยและคุณอาจต้องการหาวิธีอื่นในการเชื่อมโยงความน่าจะเป็นกับตัวอย่าง±1


ขอบคุณวิธีนี้เหมาะสมและฉันสามารถดูว่ามันใช้กับค่าเฉลี่ย แต่ฉันไม่สามารถดูวิธีการขยายไปยังสถิติอื่น ๆ ตัวอย่างเช่นฉันจะค้นหาข้อผิดพลาดมาตรฐานของอัตราได้อย่างไร หรืออัตราส่วนอัตรา
Daniel Gardiner

ฉันอัพเดทโพสต์แล้ว จุดสำคัญคือปริมาณเช่นค่าเฉลี่ยความแปรปรวน ฯลฯ - และดังนั้น stderr - สามารถพบได้สำหรับการแจกแจงใด ๆ แต่เพื่อสร้างประโยคความน่าจะเป็นคุณต้องรู้อะไรเกี่ยวกับการแจกแจงไม่ว่าจะเป็นเรื่องปกติทวินามหรืออะไรก็ตาม ดังนั้น stderr สามารถพบได้เสมอ แต่มีประโยชน์อย่างไรขึ้นอยู่กับสถานการณ์
TooTone

ถ้า n ได้รับการแก้ไขและแสดงเพียงเศษเสี้ยวของประชากรทั้งหมดของคุณทำไมคุณถึงเขียน ? และไม่ใช่var(Xi)=σ2s2
Oleg

1
@Olegเป็นตัวแปรสุ่มและมีความแปรปรวนแม้ว่าคุณจะไม่รู้ว่ามันคืออะไร มันไม่ถูกต้องในการเขียนความแปรปรวน ( ) =เพราะเป็นค่าประมาณของความแปรปรวนซึ่งเกือบจะแน่นอนไม่ใช่ความแปรปรวนประชากร มันง่ายกว่าที่จะใช้ความแปรปรวนแม้ว่าโดยทั่วไปแล้วพวกเขาจะไม่ทราบความแปรปรวนของผลรวมของตัวอย่างหรือค่าเฉลี่ยของตัวอย่างเพราะคุณใช้กฎความน่าจะเป็นแบบตรงไปตรงมา คุณแค่ใช้ลิเนียริตี้นั่นคือความแปรปรวนของผลรวม = ผลรวมของความแปรปรวน เมื่อคุณได้รับความแปรปรวนคุณจะ "จำ" คุณไม่ทราบความแปรปรวน ( ) ดังนั้นคุณจึงใช้XiXis2s2Xis2
TooTone

4

ข้อผิดพลาดมาตรฐานคือค่าเบี่ยงเบนมาตรฐานของสถิติ (ภายใต้สมมติฐานว่างถ้าคุณกำลังทดสอบ) วิธีการทั่วไปในการค้นหาข้อผิดพลาดมาตรฐานคือการหาฟังก์ชันการแจกแจงหรือโมเมนต์สร้างสถิติของคุณก่อนค้นหาช่วงเวลากลางที่สองและนำสแควร์รูท

ตัวอย่างเช่นหากคุณสุ่มตัวอย่างจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนตัวอย่างค่าเฉลี่ยมีการกระจายตามปกติที่มีค่าเฉลี่ยและความแปรปรวน n สิ่งนี้สามารถได้มาจากคุณสมบัติสามอย่าง:μσ2X¯=1ni=1nXiμσ2/n

  1. ผลรวมของตัวแปรสุ่มอิสระเป็นเรื่องปกติ
  2. E[i=1naiXi]=i=1naiE[Xi] ,
  3. ถ้าและเป็นอิสระขวา)X1X2Var(a1X1+a2X2)=a12Var(X1)+a22Var(X2)

ดังนั้นข้อผิดพลาดมาตรฐานของค่าเฉลี่ยของกลุ่มตัวอย่างซึ่งเป็นรากที่สองของความแปรปรวนของมันคือ{n}σ/n

มีทางลัดเช่นคุณไม่จำเป็นต้องค้นหาการกระจายตัวของสถิติ แต่ฉันคิดว่าแนวคิดมีประโยชน์ที่จะมีการแจกแจงในใจคุณถ้าคุณรู้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.