หากคุณใช้บันทึกส่งคืนแสดงว่าคุณมีข้อผิดพลาดในการให้น้ำหนักเล็กน้อย แต่ถ้าคุณใช้มูลค่าในอนาคตหารด้วยมูลค่าปัจจุบันแสดงว่าโอกาสของคุณไม่ถูกต้อง ที่จริงแล้วความเป็นไปได้ของคุณผิดทั้งสองกรณี มันผิดพอที่จะสำคัญ
พิจารณาว่าสถิติเป็นหน้าที่ของข้อมูลใด ๆ การส่งคืนไม่ใช่ข้อมูล แต่เป็นการแปลงข้อมูล พวกเขาคือมูลค่าในอนาคตหารด้วยมูลค่าปัจจุบัน ราคาเป็นข้อมูล ราคาจะต้องมีฟังก์ชั่นการกระจาย แต่ฟังก์ชั่นการกระจายสำหรับผลตอบแทนจะต้องขึ้นอยู่กับลักษณะของราคาเท่านั้น
พีเสื้อพีt + 1ควรกระจายตามปกติ ดังนั้นผลตอบแทนควรเป็นอัตราส่วนของ
พีt + 1พีเสื้อ- 1
ฟังก์ชันความน่าจะเป็นสำหรับการถดถอยของคุณควรเป็น
1πσσ2+ ( y- β1x1- β2x2⋯ - βnxn- α )2.
OLS บังคับให้เหมาะสมที่สุดกับข้อมูลที่สังเกตแม้ว่าจะเป็นวิธีแก้ไขที่ผิด วิธีการแบบเบย์พยายามค้นหาฟังก์ชั่นการสร้างข้อมูลผ่านความน่าจะเป็น คุณมีโอกาสผิดพลาดจึงไม่สามารถหาได้
ฉันมีเอกสารเกี่ยวกับเรื่องนี้ถ้าคุณต้องการข้อมูลเพิ่มเติม
แก้ไข
ฉันคิดว่าคุณเข้าใจผิด หากคุณจะแปลงความน่าจะเป็นของฟังก์ชั่นความหนาแน่นและคาดหวังคุณจะพบว่ามันไม่มีเลย โดยการพิสูจน์โดย Augustin Cauchy ในปี 1852 หรืออาจ 1851 รูปแบบของการแก้ปัญหากำลังสองน้อยที่สุดนั้นไม่สมบูรณ์ มันจะล้มเหลวเสมอ ไม่ใช่ว่าคุณควรใช้การถดถอยมาตรฐานเพราะ Bayesian นั้นไวต่อความเป็นไปได้ที่ว่า Bayes นั้นเป็นทางออกเดียวที่ยอมรับได้โดยมีข้อยกเว้นพิเศษสำหรับกรณีพิเศษบางอย่างที่ผิดปกติ
ในการทำการทดสอบเชิงประจักษ์เกี่ยวกับเรื่องนี้และก่อนที่ฉันจะอ่านคณิตศาสตร์เพียงพอฉันคิดอย่างไร้เดียงสาว่า Bayesian และวิธีแก้ปัญหาประจำควรตรงกับ มีทฤษฎีบทหนึ่งที่บอกว่าเมื่อกลุ่มตัวอย่างมีขนาดใหญ่พอทั้งสองจะมาบรรจบกัน ฉันใช้การค้าขายสิ้นวันทั้งหมดในจักรวาล CRSP ตั้งแต่ปีพ. ศ. 2468-2556 เพื่อทดสอบ นั่นไม่ใช่สิ่งที่ทฤษฎีบทกล่าวไว้ ฉันเข้าใจผิดกฎ
ฉันลองแก้ไขปัญหาในบันทึกแล้ว แต่ก็ยังไม่ตรงกัน ดังนั้นฉันจึงรู้ว่ามีบางอย่างการกระจายทั้งหมดเป็นรูปร่างดังนั้นฉันจึงสร้างโซลูชันเรขาคณิตเพื่อพิจารณาว่าโซลูชันใดถูกต้อง ฉันถือว่าเป็นปัญหาทางเรขาคณิตที่บริสุทธิ์เพื่อกำหนดว่าคำตอบพีชคณิตใดที่ตรงกับข้อมูล
คนเบย์จับคู่ สิ่งนี้นำฉันไปสู่เส้นทางคณิตศาสตร์อย่างมากเพราะฉันไม่สามารถเข้าใจได้ว่าทำไมตัวประมาณค่าที่เป็นกลางจึงผิด สำหรับการบันทึกการใช้ผลตอบแทนแบบกระจายในช่วงปีพ. ศ. 2468-2556 และการกำจัด บริษัท เชลล์กองทุนปิดและอื่น ๆ ความคลาดเคลื่อนระหว่างจุดศูนย์กลางของที่ตั้งคือ 2% และการวัดความเสี่ยง 4% สำหรับผลตอบแทนประจำปี . ความคลาดเคลื่อนนี้เก็บไว้ภายใต้การแปลงล็อก แต่ด้วยเหตุผลอื่น มันอาจแตกต่างกันสำหรับแต่ละดัชนีหรือชุดย่อยของข้อมูล
เหตุผลของความคลาดเคลื่อนคือสองเท่า อย่างแรกคือการแจกแจงที่เกี่ยวข้องนั้นขาดสถิติที่เพียงพอ สำหรับปัญหาบางประเภทสิ่งนี้ไม่สำคัญ สำหรับวัตถุประสงค์ที่คาดการณ์ได้เช่นการคาดการณ์หรือการจัดสรรอย่างไรก็ตามมันมีความสำคัญมาก เหตุผลที่สองคือตัวประมาณค่าที่เป็นกลางเสมอรุ่นของค่าเฉลี่ย แต่การแจกแจงไม่มีค่าเฉลี่ย
ความหนาแน่นด้านบนไม่ได้เป็นสมาชิกของตระกูลเลขชี้กำลังตามปกติหรือมีการแจกแจงแกมม่า โดยทฤษฎีบทพิตแมน –Koopman – Darmois ไม่มีสถิติจุดเพียงพอสำหรับพารามิเตอร์ นี่ก็หมายความว่าความพยายามใด ๆ ในการสร้างตัวประมาณค่าจะต้องทิ้งข้อมูล นี่ไม่ใช่ปัญหาสำหรับการแก้ปัญหาแบบเบย์เพราะด้านหลังมีความหนาแน่นทั้งหมดและหากคุณต้องการการประเมินแบบจุดคุณสามารถค้นหาความหนาแน่นแบบทำนายได้และลดฟังก์ชั่นค่าใช้จ่ายให้ต่ำลงเพื่อลดจุดเดียว ความน่าจะเป็นแบบเบย์นั้นเพียงพอเพียงเล็กน้อยเท่านั้น
ความแปรปรวนขั้นต่ำตัวประมาณค่าแบบไม่เอนเอียงสำหรับฟังก์ชันด้านบนคือการรักษาส่วนกลาง 24.6% ของข้อมูลค้นหาค่าเฉลี่ยที่ถูกตัดทิ้งและเพื่อละทิ้งข้อมูลที่เหลือ นั่นหมายความว่าข้อมูลมากกว่า 75% ถูกลบและข้อมูลสูญหาย แค่ทราบก็อาจเป็น 24.8% ในขณะที่ฉันทำงานจากหน่วยความจำ คุณสามารถค้นหากระดาษของ Rothenberg ได้ที่:
Rothenberg, TJ และ FM Fisher, และ CB Tilanus, ข้อความเกี่ยวกับการประเมินจากตัวอย่าง Cauchy, วารสารสมาคมสถิติอเมริกัน, 1964, vol 59 (306), pp 460-463
ปัญหาที่สองก็ทำให้ฉันประหลาดใจ จนกระทั่งฉันทำงานผ่านรูปทรงเรขาคณิตฉันไม่ได้ตระหนักว่าสาเหตุคืออะไร ผลตอบแทนถูกผูกไว้ที่ด้านล่างที่ -100% สิ่งนี้จะเลื่อนค่ามัธยฐาน 2% และช่วง interquartile จะถูกเลื่อนขึ้น 4% แม้ว่าครึ่งมวลจะยังคงอยู่ที่จุดเดียวกัน มวลครึ่งเป็นเครื่องชั่งที่เหมาะสม แต่ความกว้างครึ่งไม่ได้ หากไม่มีการตัดทอนดังนั้นความกว้างครึ่งและมวลครึ่งจะอยู่ที่จุดเดียวกัน ในทำนองเดียวกันค่ามัธยฐานและโหมดจะยังคงอยู่ที่จุดเดียวกัน ค่ามัธยฐานคือผลตอบแทนสำหรับนักแสดงที่มีความหมายหรืออย่างน้อยก็ค้าขายเฉลี่ย ดังนั้นจึงเป็นที่ตั้งของ MVUE เสมอและหมายถึงบันทึก
ความเข้าใจที่ถูกต้องของทฤษฎีบทคือตัวประมาณแบบเบย์ทั้งหมดเป็นตัวประมาณค่าที่ยอมรับได้ ตัวประมาณค่าความถี่เป็นตัวประมาณค่าที่ยอมรับได้หากเงื่อนไขหนึ่งในสองเงื่อนไขนั้นได้รับ อย่างแรกคือในทุกตัวอย่างการแก้ปัญหาของผู้ใช้บ่อยและเบย์นั้นเหมือนกัน อย่างที่สองก็คือถ้าการแก้ปัญหาการ จำกัด ของวิธีการแบบเบย์จับคู่กับวิธีการแก้ปัญหาประจำ
ตัวประมาณค่าที่ยอมรับได้ทั้งหมดมารวมกันเป็นโซลูชันเดียวกันเมื่อขนาดตัวอย่างมีขนาดใหญ่พอ ตัวประมาณบ่อย ๆ สันนิษฐานว่าโมเดลเป็นโมเดลจริงและข้อมูลเป็นแบบสุ่ม Bayesian สันนิษฐานว่าข้อมูลเป็นจริง แต่ตัวแบบสุ่ม หากคุณมีข้อมูลจำนวนไม่ จำกัด โมเดลแบบอัตนัยจะต้องมาบรรจบกันกับความเป็นจริง หากคุณมีข้อมูลจำนวนไม่ จำกัด แต่เป็นโมเดลที่ไม่ถูกต้องโมเดลที่ใช้บ่อยจะมาบรรจบกันในความเป็นจริงด้วยความน่าจะเป็นศูนย์
ในกรณีนี้วิธีการแก้ปัญหาแบบเบย์ภายใต้นักบวชที่สมเหตุสมผลมักจะเป็นผู้ควบคุมตัวประมาณค่าแบบสุ่มใด ๆ เสมอเนื่องจากการตัดทอนและการสูญเสียข้อมูลเพื่อสร้างตัวประมาณ
ในบันทึก, ฟังก์ชันความน่าจะเป็นคือการกระจายตัวของไฮเพอร์โบลิกซีแคนต์ มันมีความแปรปรวนแน่นอน แต่ไม่มีความแปรปรวนร่วม เมทริกซ์ความแปรปรวนร่วมที่พบโดยใช้ OLS เป็นสิ่งประดิษฐ์ของข้อมูลและไม่ได้ชี้ไปที่พารามิเตอร์ที่มีอยู่ในข้อมูลพื้นฐาน เช่นเดียวกับรูปแบบดิบไม่มีอะไรในโควารี่ฟอร์มบันทึก แต่ไม่มีอะไรเป็นอิสระเช่นกัน ความสัมพันธ์ที่ซับซ้อนยิ่งกว่านั้นมีอยู่ที่ละเมิดคำนิยามของความแปรปรวนร่วม แต่พวกเขาสามารถเข้ามาแทนที่
Markowitz และ Usman เกือบจะพบว่ามันทำงานในการกระจาย แต่การกระจายไฮเพอร์โบลิกซีแคนต์ไม่ได้อยู่ในตระกูลเพียร์สันและพวกเขาตีความข้อมูลผิดโดยไม่สังเกตว่าเมื่อคุณเปลี่ยนการกระจายจากข้อมูลดิบเพื่อบันทึกข้อมูล . โดยทั่วไปพวกเขาพบสิ่งนี้ แต่พลาดไปเพราะพวกเขาไม่มีเหตุผลที่จะมองหามันและพวกเขาไม่ได้ตระหนักถึงผลที่ไม่ได้ตั้งใจจากการใช้บันทึก
ฉันไม่มี Markowitz และ Usman อ้างถึงฉันว่าฉันอยู่ที่ไหน แต่พวกเขาทำงานได้ดีมากเพียงไม่กี่อย่างในการประเมินการกระจายที่อยู่ข้างนอก
ไม่ว่าในกรณีใดฉันจะไม่ใช้ JAGS ฉันไม่รู้ว่าจะทำอย่างไร ฉันเขียนโค้ด MCMC ทั้งหมดของฉันด้วยมือ
ฉันมีกระดาษที่สมบูรณ์และแม่นยำกว่าในหัวข้อนี้ที่:
Harris, DE (2017) การกระจายของผลตอบแทน วารสารการเงินคณิตศาสตร์, 7, 769-804
มันจะช่วยให้คุณมีวิธีในการสร้างการกระจายสำหรับสินทรัพย์หรือระดับความรับผิดใด ๆ เช่นเดียวกับอัตราส่วนทางบัญชี
ฉันพูดมาก แต่ฉันเห็นว่าคุณเข้าใจผิดเกี่ยวกับความสัมพันธ์ระหว่าง Bayes กับวิธีของ Pearson-Neyman คุณมีพวกเขากลับรายการ เบย์ใช้ได้เสมอ แต่คุณถูกขังด้วยความหนาแน่นก่อนหน้าซึ่งจะรบกวนการแก้ไขปัญหาของคุณ ด้วยความเหมาะสมก่อนที่คุณจะรับประกันตัวประมาณแบบเอนเอียงและสำหรับฟังก์ชันความน่าจะเป็นประเภทนี้ฉันเชื่อว่าคุณต้องใช้งานที่เหมาะสมก่อนที่จะรับประกันความสามารถในการผสานรวมเป็นหนึ่งเดียว วิธีการที่ใช้บ่อยเป็นไปอย่างรวดเร็วและมักจะใช้งานได้ มันไม่เอนเอียง แต่อาจไม่ถูกต้อง