เหตุใดการแจกแจงจึงมีความสำคัญ


10

นี่อาจเป็นไปได้ว่าเป็นคำถามที่งี่เง่าที่สุดที่เคยถามในฟอรัมนี้ แต่หลังจากได้รับเสียงและคำตอบที่มีความหมายกับคำถามก่อนหน้านี้ฉันคิดว่าฉันจะทำให้โชคดีขึ้นอีกครั้ง

ฉันสับสนมากในบางครั้งเกี่ยวกับความสำคัญของการแจกแจงเชิงสถิติโดยเฉพาะอย่างยิ่งเมื่อพวกเขาเกี่ยวข้องกับผลตอบแทนของสินทรัพย์และโดยเฉพาะอย่างยิ่งในการจัดสรรสินทรัพย์

คำถามที่เฉพาะเจาะจงของฉันคือ: สมมติว่าฉันมีข้อมูลผลตอบแทนรายเดือน S&P เป็นเวลา 20 ปีทำไมฉันต้องสมมติการกระจายบางประเภท (เช่นเที่ยวบินปกติ / เที่ยวบิน Johnson / Levy เป็นต้น) สำหรับการตัดสินใจจัดสรรสินทรัพย์เมื่อฉันสามารถ เพิ่งตัดสินใจจัดสรรสินทรัพย์ตามข้อมูลย้อนหลังที่ฉันมีกับฉัน


3
โปรดจำไว้ว่าหากคุณพบคำตอบสำหรับคำถามก่อนหน้านี้ของคุณมีประโยชน์คุณสามารถทำเครื่องหมายว่า 'ยอมรับ' โดยคลิกที่ช่องทำเครื่องหมายถัดจากคำตอบ วิธีนี้ช่วยให้ผู้อื่นทราบว่าคำถามของคุณได้รับการแก้ไขแล้ว
เจฟฟ์

2
จริงๆแล้วมีโพสต์ล่าสุดจากJDCookในเรื่องนั้น เพื่อสรุปความเกี่ยวข้องกับคำถามของคุณฉันจะอ้างอิงจากย่อหน้าแรก"เมื่อนักสถิติวิเคราะห์ข้อมูลพวกเขาไม่เพียงแค่ดูข้อมูลที่คุณนำมาให้พวกเขาเท่านั้นพวกเขายังพิจารณาข้อมูลสมมุติที่คุณอาจนำมากล่าวอีกนัยหนึ่ง พวกเขาพิจารณาว่าจะเกิดอะไรขึ้นเช่นเดียวกับสิ่งที่เกิดขึ้นจริง "
user603

ฉันเชื่อว่าTalebมีบางสิ่งที่ตรงประเด็นที่จะพูดเกี่ยวกับปัญหาในการตัดสินใจ แต่เพียงผู้เดียวจากข้อมูลในอดีต :-) (โดยทั่วไปข้อมูลในอดีตจะไม่เปิดเผยเหตุการณ์ "หงส์ดำ" ที่หายาก แต่อาจเป็นอันตรายถึงชีวิตได้จนกว่าจะสายเกินไป)
whuber

2
... เนื่องจากไก่งวงส่วนใหญ่จะรู้ตัวในอีกไม่กี่สัปดาห์
Ryogi

หากต้องการขยายจุดของ @ user603 - คุณต้องการทำการอนุมานนอกตัวอย่างของคุณ โดยเฉพาะอย่างยิ่งประเด็นการจัดสรรสินทรัพย์ของคุณเกี่ยวข้องกับพฤติกรรมในอนาคตไม่ใช่พฤติกรรมที่ผ่านมา ซึ่งรวมถึงตัวอย่างเช่นสิ่งที่มีพฤติกรรมในหางที่คุณมีข้อสังเกตเล็กน้อย คุณสามารถนำความรู้ / ความเข้าใจ / ความเอนเอียงเพิ่มเติมเกี่ยวกับกระบวนการผ่านสมมติฐานการกระจาย หากสมมติฐานเหล่านี้อยู่ใกล้กับด้านขวาคุณสามารถเพิ่มข้อมูลจำนวนมากได้
Glen_b -Reinstate Monica

คำตอบ:


5

การใช้การแจกแจงแบบสันนิษฐาน (เช่นการวิเคราะห์ตัวแปร) จะลดต้นทุนการคำนวณของวิธีการของคุณ ฉันสมมติว่าคุณต้องการทำงานการถดถอยหรือการจัดหมวดหมู่ ซึ่งหมายความว่าในบางจุดคุณจะประมาณการกระจายตัวของข้อมูลบางอย่าง วิธีการแบบไม่มีพารามิเตอร์มีประโยชน์เมื่อข้อมูลไม่สอดคล้องกับการแจกแจงที่มีการศึกษาเป็นอย่างดี แต่โดยทั่วไปแล้วพวกเขาจะใช้เวลามากขึ้นในการคำนวณหรือเก็บหน่วยความจำเพิ่มเติม

นอกจากนี้หากข้อมูลถูกสร้างขึ้นโดยกระบวนการที่สอดคล้องกับการแจกแจงเช่นพวกเขาเป็นค่าเฉลี่ยของกระบวนการสุ่มบางอย่างสม่ำเสมอจากนั้นการใช้การแจกแจงนั้นเหมาะสมกว่า ในกรณีของการหาค่าเฉลี่ยของตัวแปรชุดการแจกแจงที่ถูกต้องน่าจะเป็นการกระจายแบบเกาส์เซียน


0

การตอบสนองของเจมส์ : โมเดลพาราเมทริกเช่นกัน (โดยปกติ) ต้องการตัวอย่างน้อยลงเพื่อให้มีขนาดที่เหมาะสม: สิ่งนี้อาจเพิ่มพลังการวางนัยทั่วไป: นั่นคือพวกเขาอาจทำนายข้อมูลใหม่ได้ดีขึ้นแม้จะผิด แน่นอนนี้ขึ้นอยู่กับสถานการณ์รูปแบบและขนาดตัวอย่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.