เราจะอธิบายได้อย่างไรว่าตัวประเมินที่ไม่เอนเอียงคืออะไรสำหรับคนธรรมดา?


10

สมมติว่าเป็นประมาณการที่เป็นกลางสำหรับ\แล้วแน่นอน\ θE[ θ |θ]=θθ^θE[θ^θ]=θ

เราอธิบายเรื่องนี้กับคนทั่วไปได้อย่างไร? ในอดีตสิ่งที่ฉันพูดคือถ้าคุณเฉลี่ยค่าของเป็นจำนวนมากเมื่อขนาดตัวอย่างใหญ่ขึ้นคุณจะได้ประมาณดีขึ้น θθ^θ

สำหรับฉันแล้วนี่เป็นปัญหา ฉันคิดว่าสิ่งที่ฉันอธิบายจริง ๆ นี่คือปรากฏการณ์ของการเป็นแบบไม่ลำเอียงแบบไม่มีสัญญาณแทนที่จะเป็นแบบไม่เอนเอียงคือ ที่\ hat {\ theta}มีแนวโน้มที่จะขึ้นอยู่กับn

limnE[θ^θ]=θ,
θ^n

ดังนั้นเราจะอธิบายได้อย่างไรว่าตัวประมาณที่เป็นกลางคืออะไรกับคนธรรมดา?


2
มันเป็นวิธีการประมาณค่าที่ถูกต้อง: โดยปกติแล้วจะไม่ถูกต้อง แต่โดยรวมแล้วมันไม่ได้ประเมินค่ามากไปกว่าค่าที่ประเมินต่ำไป ฉันรู้ว่าสิ่งนี้ทำให้ดูเหมือนว่าθเป็นค่ามัธยฐานของθ^มากกว่าค่าเฉลี่ย แต่ฉันคิดว่ามันเป็นจุดสำคัญ
jwimberley

3
ฉันชอบ "สามสถิติการล่าสัตว์" ตลก (รุ่นที่นี่ ) สำหรับเรื่องนี้ ...
เบน Bolker

2
คำอธิบายของคุณคือกฎจำนวนมากมันไม่เกี่ยวกับความเป็นกลาง
ซีอาน

@ ซีอาน: หากประมาณการลำเอียง จำกัด จะไม่\θ
user2357112 รองรับ Monica

@ user2357112: ในความเข้าใจของฉัน (และอื่น ๆ 'ตามที่แสดงโดยคำตอบจนถึง) ในขณะที่ขนาดของกลุ่มตัวอย่างมีขนาดใหญ่ขึ้นหมายถึงการพิจารณาเมื่อเติบโตเป็นอินฟินิตี้นั่นคือตัวประมาณตามการสังเกตตอนนี้ฉันเห็นว่าประโยคสามารถตีความได้แตกต่างกัน θ^nnn
ซีอาน

คำตอบ:


14

ในทางเทคนิคสิ่งที่คุณกำลังอธิบายเมื่อคุณพูดว่าตัวประมาณของคุณเข้าใกล้มูลค่าที่แท้จริงเมื่อขนาดตัวอย่างเพิ่มขึ้นคือความสอดคล้อง (ตามที่คนอื่นพูดถึง) ความสม่ำเสมอหรือการลู่เข้าของตัวประมาณทางสถิติ การบรรจบกันนี้อาจเป็นการรวมกันของความน่าจะเป็นซึ่งบอกว่าสำหรับหรือเกือบทั้งหมด แน่ใจบรรจบกันที่บอกว่า0 สังเกตว่าขีด จำกัด นั้นอยู่ข้างในอย่างไรε > 0 P ( Lim n →การ | θ n - θ | > ε ) = 0limnP(|θ^nθ|>ϵ)=0ϵ>0P(limn|θ^nθ|>ϵ)=0ความน่าจะเป็นในกรณีที่สอง ปรากฎว่ารูปแบบการบรรจบกันหลังนี้มีความแข็งแกร่งกว่าอีกรูปแบบหนึ่ง แต่ทั้งคู่ก็มีความหมายเหมือนกันซึ่งก็คือค่าประมาณนั้นมีแนวโน้มที่จะเข้าใกล้สิ่งที่เราประเมินมากขึ้นเมื่อเรารวบรวมตัวอย่างมากขึ้น

จุดที่ลึกซึ้งที่นี่คือแม้ในขณะที่ไม่ว่าจะในความเป็นไปได้หรือเกือบจะแน่นอนมันไม่เป็นความจริงโดยทั่วไปว่าดังนั้นความสอดคล้องจึงไม่ได้บ่งบอกถึงความเป็นกลางที่ไม่แสดงอาการเชิงเส้นประสาทตามที่คุณแนะนำ คุณต้องระวังเมื่อย้ายระหว่างลำดับของตัวแปรสุ่ม (ซึ่งเป็นฟังก์ชัน) ไปยังลำดับของความคาดหวัง (ซึ่งเป็นอินทิกรัล)ลิมn→การE( θ n)=θθ^nθlimnE(θ^n)=θ

ทุกสิ่งที่ทางเทคนิคกันเพียงวิธีการที่เป็นกลางว่า\ ดังนั้นเมื่อคุณอธิบายให้ใครบางคนเพียงแค่บอกว่าหากการทดสอบซ้ำภายใต้เงื่อนไขที่เหมือนกันหลายครั้งว่าค่าเฉลี่ยของการประมาณจะใกล้เคียงกับมูลค่าที่แท้จริงE(θ^n)=θ


5
วิสัยทัศน์ของท่านเกี่ยวกับฆราวาสนั้นน่าชื่นชมมาก เขารู้ว่าอะไรคือ "การลู่เข้าในความน่าจะเป็น", "การบรรจบกัน", จำกัด ... มันคือผู้ชายจากอนาคต
Aksakal

2
ฉันไม่คิดว่าคนธรรมดารู้จักสิ่งเหล่านี้ฉันพยายามแก้ไขความเข้าใจผิดบางอย่างในโพสต์ต้นฉบับ ข้อเสนอแนะของฉันเกี่ยวกับวิธีการอธิบายสิ่งต่าง ๆ ให้กับบุคคลทั่วไปอยู่ในย่อหน้าสุดท้าย
dsaxton

ย่อหน้าสุดท้ายแม้ว่าจะยุ่งเกี่ยวกับแนวคิดอคติด้วยความมั่นคงของตัวประมาณซึ่งอาจเป็นหนึ่งใน confusions ของ OP เพื่อเริ่มต้นด้วย
Aksakal

3
งั้นเหรอ ทำซ้ำการทดสอบภายใต้เงื่อนไขที่เหมือนกันนั่นหมายความว่าขนาดตัวอย่างได้รับการแก้ไขดังนั้นเราจึงไม่ได้พูดถึงเรื่องความสอดคล้อง
dsaxton

1
ตกลงคุณพูดถูก แต่ก็หมายความว่าคุณกำลังนำเสนอมุมมองความน่าจะเป็นประจำ
Aksakal

9

ฉันไม่แน่ใจว่าคุณสับสนและมั่นคงหรือไม่

ความสอดคล้อง:ยิ่งขนาดตัวอย่างใหญ่เท่าใดความแปรปรวนของตัวประมาณก็จะน้อยลง

  • ขึ้นอยู่กับขนาดตัวอย่าง

ความเป็นกลาง:ค่าที่คาดหวังของตัวประมาณเท่ากับค่าที่แท้จริงของพารามิเตอร์

  • ไม่ได้ขึ้นอยู่กับขนาดตัวอย่าง

ดังนั้นประโยคของคุณ

ถ้าคุณเฉลี่ยค่าของจำนวนเมื่อขนาดของกลุ่มตัวอย่างใหญ่ขึ้นคุณจะได้ประมาณดีขึ้นθ^θ

ไม่ถูกต้อง. แม้ว่าขนาดตัวอย่างจะไม่มีที่สิ้นสุดตัวประมาณที่เป็นกลางจะยังคงตัวประมาณแบบเอนเอียงเช่นถ้าคุณประมาณค่าเฉลี่ยว่า "หมายถึง +1" คุณสามารถเพิ่มการสังเกตหนึ่งพันล้านครั้งในตัวอย่างของคุณและตัวประมาณของคุณจะไม่ให้คุณค่าที่แท้จริง

ที่นี่คุณสามารถค้นหาการสนทนาที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับความแตกต่างระหว่างความสอดคล้องและความเป็นกลาง

อะไรคือความแตกต่างระหว่างตัวประมาณค่าที่สอดคล้องกันและตัวประมาณที่ไม่เอนเอียง?


2
จริง ๆ แล้วฉันไม่รู้อะไรเลยเกี่ยวกับความมั่นคง แต่ขอบคุณอย่างไรก็ตาม
คลาริเน็ตใน

1
@Clarinetist Consistencyอาจเป็นคุณสมบัติที่สำคัญที่สุดของตัวประมาณว่าหากมีข้อมูลเพียงพอคุณจะได้รับคำตอบที่ถูกต้องโดยพลการ
Matthew Gunn

7

@Ferdiได้ให้คำตอบที่ชัดเจนสำหรับคำถามของคุณแล้ว แต่ขอให้เป็นทางการขึ้นอีกหน่อย

ให้เป็นตัวอย่างของคุณของอิสระและกันกระจายตัวแปรสุ่มจากการกระจายFคุณมีความสนใจในการประมาณไม่ทราบ แต่คงปริมาณใช้ประมาณการเป็นฟังก์ชั่นของX_1,เนื่องจากเป็นฟังก์ชันของตัวแปรสุ่มให้ประมาณX1,,XnFθg X 1 , , X n g gX1,,Xng

θ^n=g(X1,,Xn)

ก็เป็นตัวแปรสุ่ม เรากำหนดอคติเป็น

bias(θ^n)=Eθ(θ^n)θ

ประมาณการเป็นกลางเมื่อ\Eθ(θ^n)=θ

การพูดเป็นภาษาอังกฤษธรรมดา: เรากำลังเผชิญกับตัวแปรสุ่มดังนั้นถ้ามันแย่ลงถ้าเราสุ่มตัวอย่างที่แตกต่างกันเราอาจคาดว่าจะสังเกตข้อมูลที่แตกต่างกันและประมาณต่างกัน อย่างไรก็ตามเราสามารถคาดหวังว่าในตัวอย่างที่แตกต่างกัน "โดยเฉลี่ย" โดยประมาณจะเป็น "ถูกต้อง" หากตัวประมาณไม่มีอคติ ดังนั้นมันจะไม่ถูกต้องเสมอไป แต่ "โดยเฉลี่ย" มันจะถูกต้อง มันไม่สามารถเป็น "ถูกต้อง" เสมอไปได้เนื่องจากการสุ่มที่เกี่ยวข้องกับข้อมูลθ^n

เป็นคนอื่น ๆ ที่ระบุไว้แล้วความจริงที่ว่าประมาณการของคุณได้รับ "ใกล้ชิด" กับปริมาณประมาณเป็นตัวอย่างของคุณเติบโตขึ้นเช่นว่าในลู่ในความน่าจะเป็น

θ^nPθ

เกี่ยวข้องกับตัวประมาณความสม่ำเสมอไม่ใช่ความเป็นกลาง ความลำเอียงเพียงอย่างเดียวไม่ได้บอกอะไรเราเกี่ยวกับขนาดตัวอย่างและความสัมพันธ์กับการประมาณที่ได้รับ นอกจากนี้ประมาณเป็นกลางมีไม่เคยมีและไม่เคยที่นิยมกว่าคนลำเอียง ตัวอย่างเช่นหลังจากพิจารณาการแลกเปลี่ยนความแปรปรวนแบบอคติคุณอาจเต็มใจพิจารณาการใช้ตัวประมาณที่มีความลำเอียงมากกว่า แต่ความแปรปรวนน้อยลงดังนั้น "โดยเฉลี่ย" มันจะอยู่ไกลจากมูลค่าที่แท้จริง แต่บ่อยครั้งกว่า (ความแปรปรวนน้อยกว่า) จะใกล้เคียงกับมูลค่าที่แท้จริงจากนั้นในกรณีของการประเมินที่เป็นกลาง


(+1): จุดที่ดีมากในการนำความจริงที่ว่ามีการประมาณค่าที่ไม่เอนเอียง และกล่าวถึงการต่อต้านอคติ / ความแปรปรวน
ซีอาน

2

ก่อนอื่นคุณต้องแยกแยะอคติที่เข้าใจผิดออกจากอคติเชิงสถิติโดยเฉพาะอย่างยิ่งสำหรับคนธรรมดา

ตัวเลือกการพูดโดยใช้ค่ามัธยฐานค่าเฉลี่ยหรือโหมดเป็นตัวประมาณค่าเฉลี่ยของประชากรมักประกอบด้วยอคติความเชื่อทางการเมืองศาสนาหรือวิทยาศาสตร์ การคำนวณว่าตัวประมาณตัวใดเป็นรูปแบบค่าเฉลี่ยที่ดีที่สุดคือชนิดที่แตกต่างกันของเลขคณิตที่มีผลต่ออคติทางสถิติ

เมื่อคุณผ่านอคติการเลือกวิธีแล้วคุณสามารถแก้ไขอคติที่อาจเกิดขึ้นได้ในวิธีการประเมิน ก่อนอื่นคุณต้องเลือกวิธีที่มีอคติและกลไกที่นำไปสู่อคตินั้นได้ง่าย

มันง่ายกว่าที่จะใช้มุมมองแบบแยกส่วนที่ชัดเจนเมื่อขนาดตัวอย่างเล็กลงการประมาณลำเอียงจะชัดเจนขึ้น ตัวอย่างเช่นปัจจัย n-1 (เทียบกับปัจจัย 'n') ในตัวประมาณค่าสเปรดตัวอย่างจะชัดเจนเมื่อ n ลดลงจาก 3 เป็น 2 ถึง 1!

ทุกอย่างขึ้นอยู่กับว่า 'วาง' คน ๆ นั้นเป็นอย่างไร


ฉันกลัวว่าคุณอาจจะพูดถึงอคติชนิดต่าง ๆ ที่เป็นปัญหา คุณลองเป็นคนที่เจาะจงมากขึ้นเกี่ยวกับความลำเอียงคืออะไร? คุณเขียนเกี่ยวกับ "ความเอนเอียงที่อาจเกิดขึ้นในวิธีการประมาณค่า" และสิ่งนี้ดูเหมือนจะไม่สอดคล้องกับคำจำกัดความของความลำเอียง ในที่สุดสิ่งนี้ทำให้คำตอบของคุณสับสน ...
ทิม

@ ทิมขั้นตอนแรกก็เพื่อให้แน่ใจว่าอคติของมนุษย์ได้รับการคุ้มครอง ขั้นตอนที่สองคือ (และบางส่วนติดตามประเด็นของขั้นตอนที่ 1) เพื่อให้แน่ใจว่าคำสอนของบุคคลทั่วไปไม่ได้ใช้วิธีการ X (อันที่เป็นกลาง) แล้ว เช่นส่วนเบี่ยงเบนมาตรฐานคือ 1 / n * sum ((x-mean) ^ 2) แต่ที่ (อย่างระมัดระวัง) ไม่ได้แยกความแตกต่างระหว่างประชากรและกลุ่มตัวอย่าง 'คนธรรมดา' ส่วนใหญ่ได้รับการสอนรุ่นที่คิดไม่ถึง 1 / (N-1) สำหรับตัวอย่าง หากคุณมีเพียงวิธีเดียวคุณ (บุคคลทั่วไป) ไม่มีทางเลือกที่จะทำดังนั้นการประเมินความลำเอียงไม่สามารถเป็นปัญหาได้ ... มันเป็นขั้นตอนของ Kruger-Dunning
Philip Oakley
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.