ปัญหาหรือเกมใดที่เป็นวิธีแก้ไขปัญหาความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานที่ดีที่สุด


9

สำหรับตัวแปรสุ่มที่กำหนด (หรือประชากรหรือกระบวนการสุ่ม) ความคาดหวังทางคณิตศาสตร์คือคำตอบสำหรับคำถามการคาดการณ์จุดใดที่ช่วยลดการสูญเสียกำลังสองที่คาดการณ์ไว้ได้? . นอกจากนี้มันเป็นทางออกที่ดีที่สุดสำหรับเกมเดาการตระหนักถึงตัวแปรสุ่มต่อไป (หรือการจับฉลากใหม่จากประชากร) และฉันจะลงโทษคุณด้วยระยะห่างกำลังสองระหว่างค่าและการเดาของคุณหากคุณมีความไม่ตรงเชิงเส้นในแง่ ของการลงโทษ ค่ามัธยฐานคือคำตอบของคำถามที่เกี่ยวข้องภายใต้การสูญเสียที่แน่นอนและโหมดคือคำตอบภายใต้การสูญเสีย "ทั้งหมดหรือไม่มีอะไร"

คำถาม:ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานตอบคำถามที่คล้ายกันหรือไม่ พวกเขาคืออะไร

แรงจูงใจสำหรับคำถามนี้เกิดขึ้นจากการสอนมาตรการพื้นฐานของแนวโน้มกลางและการแพร่กระจาย ในขณะที่มาตรการของแนวโน้มกลางสามารถถูกกระตุ้นด้วยปัญหาการตัดสินใจเชิงทฤษฎีข้างต้นฉันสงสัยว่าจะกระตุ้นให้เกิดมาตรการแพร่กระจายได้อย่างไร


1
คำถามที่น่าสนใจมาก วิธีการเริ่มต้นของฉันน่าจะเป็น "เกม" ในเชิงคุณภาพเหมือนกับที่คุณอธิบายไปแล้วยกเว้นคำถามที่คาดหวัง (ไม่มีคำว่าปุนตั้งใจ) คำตอบนั้นเกี่ยวกับช่วงของค่าแทนที่จะเป็นจุดเดียวตั้งแต่แพร่กระจายโดยไม่มีจุด ข้อมูลอ้างอิงค่อนข้างไม่สมบูรณ์ (หากไม่มีความหมาย) ข้อมูล
Emil

โปรดทราบว่าความแปรปรวนเป็นความคาดหวังเอง - ถ้า Y=(X-μ)2 แล้วก็ var(X)=E(Y).
Glen_b -Reinstate Monica

@Glen_b คุณพูดถูกและฉันเข้าใจแล้ว (ฉันควรรวมไว้ในข้อความคำถาม) "เดาความแตกต่างระหว่างค่าต่อไปและความคาดหวังและฉันจะลงโทษคุณเป็นกำลังสอง" จะเป็นเกม นั่นคือสิ่งที่ดีที่สุดใช่ไหม? ไม่ได้ฟังเกมที่ใช้งานได้จริงหรือสนุกมาก IMHO
Richard Hardy

คำตอบ:


2

หากฉันเข้าใจคำถามตามที่ตั้งใจไว้คุณจะต้องคำนึงถึงการตั้งค่าที่คุณสามารถรับรู้ถึงตัวแปรสุ่มแบบอิสระได้ X กับการกระจายใด ๆ F มีความแปรปรวนแน่นอน σ2(F)) "เกม" ถูกกำหนดโดยฟังก์ชั่นชั่วโมง และ Lที่จะอธิบาย ประกอบด้วยขั้นตอนและกฎต่อไปนี้:

  1. ฝ่ายตรงข้ามของคุณ ("ธรรมชาติ") เปิดเผย F.

  2. ในการตอบสนองคุณผลิตจำนวน เสื้อ(F), "การคาดคะเน" ของคุณ

เพื่อประเมินผลลัพธ์ของเกมจะทำการคำนวณต่อไปนี้:

  • ตัวอย่างของ n การสังเกต iid X=X1,X2,...,Xn มาจาก F.

  • ฟังก์ชั่นที่กำหนดไว้ล่วงหน้า ชั่วโมง ถูกนำไปใช้กับตัวอย่างการผลิตจำนวน ชั่วโมง(X), "สถิติ"

  • "ฟังก์ชั่นการสูญเสีย" L เปรียบเทียบ "การทำนาย" ของคุณ เสื้อ(F) เพื่อสถิติ ชั่วโมง(X), สร้างตัวเลขที่ไม่ใช่ลบ L(เสื้อ(F),ชั่วโมง(X)).

  • ผลลัพธ์ของเกมคือการสูญเสียที่คาดหวัง (หรือ "ความเสี่ยง")

    R(L,ชั่วโมง)(เสื้อ,F)=E(L(เสื้อ(F),ชั่วโมง(X))).

วัตถุประสงค์ของคุณคือการตอบสนองต่อการเคลื่อนไหวของธรรมชาติโดยการระบุบางอย่าง เสื้อ ที่ช่วยลดความเสี่ยง

ตัวอย่างเช่นในเกมที่มีฟังก์ชั่น ชั่วโมง(X1)=X1 และการสูญเสียใด ๆ ของแบบฟอร์ม L(เสื้อ,ชั่วโมง)=λ(เสื้อ-ชั่วโมง)2 สำหรับจำนวนบวก λ, การเคลื่อนไหวที่ดีที่สุดของคุณคือการเลือก เสื้อ(F) จะเป็นความคาดหวังของ F.

คำถามต่อหน้าเราคือ

มีอยู่จริง L และ ชั่วโมง ซึ่งการเลือกที่ดีที่สุดคือการเลือก เสื้อ(F) ที่จะเป็นความแปรปรวน σ2(F)?

นี่คือคำตอบที่พร้อมโดยแสดงความแปรปรวนเป็นความคาดหวัง วิธีหนึ่งคือการกำหนดว่า

ชั่วโมง(X1,X2)=12(X1-X2)2
และใช้การสูญเสียกำลังสองต่อไป
L(เสื้อ,ชั่วโมง)=(เสื้อ-ชั่วโมง)2.
เมื่อสังเกตได้ว่า

E(ชั่วโมง(X))=σ2(F),

ตัวอย่างช่วยให้เราสามารถสรุปได้ว่าสิ่งนี้ ชั่วโมง และนี่ L ตอบคำถามเกี่ยวกับความแปรปรวน


ส่วนเบี่ยงเบนมาตรฐานคืออะไร σ(F)? อีกครั้งเราต้องการเพียงแสดงสิ่งนี้เป็นความคาดหวังของสถิติตัวอย่าง อย่างไรก็ตามนั่นเป็นไปไม่ได้เพราะถึงแม้เราจะ จำกัดF ถึงครอบครัวของเบอร์นูลี(พี) การแจกแจงเราสามารถรับฟังก์ชั่นพหุนามของ พี, แต่ σ(F)=พี(1-พี) ไม่ใช่ฟังก์ชันพหุนามในโดเมน พี(0,1). (ดูสำหรับการแจกแจงทวินามเหตุใดจึงไม่มีตัวประมาณค่าที่เป็นกลางสำหรับ1/พี? สำหรับข้อโต้แย้งทั่วไปเกี่ยวกับการแจกแจงแบบทวินามซึ่งคำถามนี้สามารถลดลงได้หลังจากหาค่าเฉลี่ยชั่วโมง ตลอดการเปลี่ยนลำดับของ Xผม.)


ขอบคุณสำหรับคำถามที่ชัดเจนของฉันและคำตอบที่ชัดเจนอย่างเท่าเทียมกัน คุณจะมีตัวอย่างของชั่วโมง ที่ขึ้นอยู่กับทั้งหมด nจุดตัวอย่างไม่ใช่แค่สองอัน?
Richard Hardy

2
มีวิธีมาตรฐานให้เลือก 2 ถึง n: คำนวณสถิติสำหรับทุกคู่และค่าเฉลี่ย อันที่จริงที่ก่อให้ตัวละครของฉันแปรปรวนที่stats.stackexchange.com/a/18200/919 สำหรับทฤษฎีอย่างเป็นทางการนี้อ่านเกี่ยวกับสถิติ U
whuber

1
ขอบคุณมาก!
Richard Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.