ฉันกำลังทำการบ้านที่อาจารย์ของฉันต้องการให้เราสร้างแบบจำลองการถดถอยที่แท้จริงจำลองตัวอย่างข้อมูลและเขาจะพยายามหารูปแบบการถดถอยที่แท้จริงของเราโดยใช้เทคนิคบางอย่างที่เราเรียนรู้ในชั้นเรียน เราก็ต้องทำเช่นเดียวกันกับชุดข้อมูลที่เขามอบให้เรา
เขาบอกว่าเขาสามารถสร้างแบบจำลองที่แม่นยำสำหรับความพยายามในอดีตทั้งหมดเพื่อพยายามหลอกล่อเขา มีนักเรียนบางคนที่สร้างแบบจำลองบ้า ๆ บอ ๆ แต่เขาก็สามารถสร้างแบบจำลองที่เรียบง่ายขึ้นซึ่งก็เพียงพอแล้ว
ฉันจะพัฒนารูปแบบที่ยุ่งยากให้เขาค้นหาได้อย่างไร ฉันไม่ต้องการที่จะถูกสุด ๆ ด้วยการทำ 4 เทอมกำลังสองการสังเกต 3 ครั้งและความแปรปรวนอันมหาศาล? ฉันจะสร้างชุดข้อมูลที่ไม่มีอันตรายซึ่งดูเหมือนว่าจะมีโมเดลเล็ก ๆ น้อย ๆ อยู่ข้างใต้ได้อย่างไร
เขามีกฎ 3 ข้อที่ต้องปฏิบัติตาม:
ชุดข้อมูลของคุณต้องมีตัวแปร "Y" หนึ่งตัวและตัวแปร 20 "X" ที่ระบุว่าเป็น "Y", "X1", ... , "X20"
ตัวแปรตอบกลับของคุณต้องมาจากตัวแบบการถดถอยเชิงเส้นที่ตรงตาม: ที่และ21
ϵ ฉัน ∼ N ( 0 , σ 2 ) p ≤ 21Variable ทั้งหมดที่ใช้สร้างมีอยู่ในชุดข้อมูลของคุณY
ควรสังเกตว่าตัวแปร X ทั้งหมดไม่จำเป็นต้องอยู่ในแบบจำลองที่แท้จริงของคุณ
ฉันกำลังคิดที่จะใช้บางอย่างเช่นแบบจำลองปัจจัย 3 มิติของ Fama-Frenchและให้เขาเริ่มต้นด้วยข้อมูลสต็อค (SPX และ AAPL) และต้องเปลี่ยนตัวแปรเหล่านั้นให้เป็นผลตอบแทนที่ผสมกันอย่างต่อเนื่องเพื่อทำให้สับสนมากขึ้นอีกเล็กน้อย แต่นั่นทำให้ฉันมีค่าที่ขาดหายไปในการสังเกตครั้งแรกและเป็นอนุกรมเวลา (ซึ่งเรายังไม่ได้พูดคุยกันในชั้นเรียน)
ไม่แน่ใจว่านี่เป็นสถานที่ที่เหมาะสมหรือไม่ในการโพสต์สิ่งนี้ ฉันรู้สึกว่ามันสามารถสร้างการสนทนาที่ดี
แก้ไข:ฉันยังไม่ได้ขอรุ่นที่สร้างไว้ล่วงหน้าโดยเฉพาะ ฉันอยากรู้มากขึ้นเกี่ยวกับหัวข้อ / เครื่องมือในสถิติที่จะช่วยให้ใครบางคนไปเกี่ยวกับเรื่องนี้