ทำไมเราถึงรักษาความแปรปรวนได้


15

ฉันมาข้ามความแปรปรวนเปลี่ยนแปลงการรักษาเสถียรภาพในขณะที่อ่านKaggle เรียงความวิธี พวกเขาใช้การแปลงความเสถียรของผลต่างเพื่อแปลงค่าคัปปาก่อนที่จะรับค่าเฉลี่ยแล้วเปลี่ยนกลับ แม้หลังจากอ่านวิกิเกี่ยวกับความแปรปรวนของการแปรปรวนที่ทำให้เกิดความแปรปรวนฉันไม่เข้าใจทำไมเราถึงทำให้ความแปรปรวนของความมั่นคงมีอยู่จริง? เราได้รับประโยชน์อะไรจากสิ่งนี้?


6
โดยปกติแล้วความตั้งใจคือการทำให้ความแปรปรวน (asymptotic) เป็นอิสระจากพารามิเตอร์ที่น่าสนใจ สิ่งนี้มีความสำคัญอย่างยิ่งในการอนุมานที่เราจำเป็นต้องรู้การแจกแจงอ้างอิงเพื่อคำนวณจำนวนดอกเบี้ยที่เกี่ยวข้อง
พระคาร์ดินัล

คำตอบ:


13

นี่คือหนึ่งคำตอบ: โดยปกติวิธีที่มีประสิทธิภาพมากที่สุดในการดำเนินการอนุมานทางสถิติคือเมื่อข้อมูลของคุณเป็น iid หากไม่เป็นเช่นนั้นคุณจะได้รับข้อมูลจำนวนต่าง ๆ จากการสังเกตที่ต่างกันและมีประสิทธิภาพน้อยกว่า อีกวิธีในการดูที่กล่าวคือถ้าคุณสามารถเพิ่มข้อมูลพิเศษลงในการอนุมานของคุณ (เช่นรูปแบบการทำงานของความแปรปรวนผ่านการแปลงความแปรปรวนที่ทำให้เกิดความแปรปรวน) คุณจะปรับปรุงความถูกต้องของการประมาณการของคุณอย่างน้อยที่สุด ในตัวอย่างขนาดเล็กมากการใส่ใจกับการสร้างแบบจำลองความแปรปรวนอาจเพิ่มอคติตัวอย่างเล็ก ๆ ของคุณ นี่เป็นอาร์กิวเมนต์ประเภท GMM ประเภทเศรษฐมิติ: หากคุณเพิ่มช่วงเวลาเพิ่มเติมความแปรปรวนเชิงซีโมติกของคุณจะไม่สามารถสูงขึ้นได้ และความเอนเอียงตัวอย่างอัน จำกัด ของคุณจะเพิ่มขึ้นด้วยองศาอิสระ

คำตอบอีกข้อหนึ่งได้รับจากคาร์ดินัล: หากคุณมีความแปรปรวนที่ไม่รู้จักแขวนอยู่ในนิพจน์ความแปรปรวนแบบซีโมติกของคุณการลู่เข้าสู่การแจกแจงแบบอะซิมโทติคจะช้าลงและคุณจะต้องประมาณความแปรปรวนนั้น การหมุนข้อมูลหรือสถิติของคุณล่วงหน้าจะช่วยปรับปรุงความแม่นยำของการประมาณเชิงเส้นกำกับ


ฉันคิดว่าฉันเข้าใจประโยคแรกในคำตอบของคุณและมันดึงดูดความสนใจของฉันอย่างสังหรณ์ใจ มีชื่อสำหรับการสังเกตนี้ที่ฉันสามารถ google หรือไม่? ฉันต้องการค้นหาการทดลองทางความคิดหรือตัวอย่างที่แสดงว่าเกิดอะไรขึ้นเมื่อคุณมีจำนวนข้อมูลที่แตกต่างกันในการสังเกตที่แตกต่างกันและวิธีการที่ไม่มีประสิทธิภาพ
Pushpendre

Korn & Graubard (1999) ข้อความเกี่ยวกับสถิติการสำรวจอธิบายว่า
StasK

-1(1nΣผม(κผม))

@PushpendreRastogi คุณอาจต้องการอ่านบทความ wikipediaเกี่ยวกับการเปลี่ยนแปลงครั้งนี้ มันได้รับการแนะนำให้รู้จักกับชาวประมงเพื่อรักษาเสถียรภาพความแปรปรวนของสัมประสิทธิ์สหสัมพันธ์เชิงประจักษ์ (ระหว่างตัวแปรปกติ) ในกรณีนั้นตัวแปรแปรสภาพจะประมาณปกติโดยมีความแปรปรวนขึ้นอยู่กับขนาดตัวอย่างเท่านั้นและไม่ได้อยู่ในค่าสัมประสิทธิ์สหสัมพันธ์ที่ไม่รู้จัก (นี่คือสาเหตุที่“ ความเสถียร” ความแปรปรวน)
Elvis

@Elvis ฉันให้ตัวอย่างความสัมพันธ์ในบทความวิกิพีเดียในสถิติสำคัญ ( en.wikipedia.org/wiki/Pivotal_statistic ) [คุณให้ลิงก์ที่ดีในความคิดเห็นได้อย่างไรบนโลกนี้? ฉันลอง href มันดูน่าเกลียด]
StasK
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.