แบบผสมมีประโยชน์เหมือนแบบจำลองทำนายหรือไม่


24

ฉันสับสนเล็กน้อยเกี่ยวกับข้อดีของแบบจำลองผสมในเรื่องการสร้างแบบจำลองการทำนาย เนื่องจากแบบจำลองการทำนายมักจะหมายถึงการคาดการณ์ค่าของการสังเกตที่ไม่ทราบมาก่อนหน้านี้ดูเหมือนว่าชัดเจนว่าวิธีเดียวที่แบบจำลองผสมอาจมีประโยชน์ก็คือความสามารถในการทำนายระดับประชากร (นั่นคือไม่เพิ่มผลกระทบแบบสุ่ม) อย่างไรก็ตามปัญหาคือในประสบการณ์ของฉันการคาดการณ์ระดับประชากรที่ใช้แบบจำลองแบบผสมนั้นแย่กว่าการคาดการณ์ตามแบบจำลองการถดถอยมาตรฐานที่มีผลกระทบคงที่เท่านั้น

ดังนั้นโมเดลของแบบผสมที่เกี่ยวข้องกับปัญหาการทำนายคืออะไร

แก้ไข ปัญหามีดังต่อไปนี้: ฉันติดตั้งโมเดลผสม (ทั้งเอฟเฟกต์คงที่และสุ่ม) และโมเดลเชิงเส้นมาตรฐานที่มีเอฟเฟกต์คงที่เท่านั้น เมื่อฉันทำการตรวจสอบข้ามฉันได้รับลำดับชั้นของความแม่นยำในการทำนายต่อไปนี้: 1) แบบจำลองผสมเมื่อทำนายโดยใช้เอฟเฟกต์แบบคงที่และแบบสุ่ม (แต่งานนี้แน่นอนสำหรับการสังเกตด้วยระดับเอฟเฟ็กต์ตัวแปรแบบสุ่มเท่านั้น) เหมาะสำหรับแอปพลิเคชั่นทำนายผลจริง!); 2) โมเดลเชิงเส้นมาตรฐาน 3) รูปแบบผสมเมื่อใช้การคาดคะเนระดับประชากร (เพื่อให้มีเอฟเฟกต์แบบสุ่มโยนออกมา) ดังนั้นความแตกต่างเพียงอย่างเดียวระหว่างแบบจำลองเชิงเส้นมาตรฐานและแบบจำลองผสมจึงมีค่าที่แตกต่างกันของค่าสัมประสิทธิ์เนื่องจากวิธีการประมาณค่าที่แตกต่างกัน (เช่นมีผลกระทบ / ตัวทำนายแบบเดียวกันในทั้งสองแบบ แต่มีสัมประสิทธิ์สัมพันธ์ต่างกัน)

ดังนั้นความสับสนของฉันจึงเพิ่มขึ้นเป็นคำถามทำไมฉันถึงเคยใช้แบบจำลองผสมเป็นแบบจำลองการทำนายเนื่องจากการใช้แบบจำลองผสมเพื่อสร้างการทำนายระดับประชากรดูเหมือนว่าเป็นกลยุทธ์ที่ด้อยกว่าเมื่อเทียบกับแบบจำลองเชิงเส้นมาตรฐาน


คุณคาดการณ์ของคุณอย่างไร คุณไม่ได้ใช้เอฟเฟกต์แบบสุ่มหรือคุณใช้เอฟเฟกต์แบบสุ่มด้วยวิธีการของพวกเขาหรือไม่? (เช่นคุณขว้างเอฟเฟกต์แบบสุ่มในเวลาที่คาดคะเนหรือไม่?)
เวย์น

เท่าที่ฉันเข้าใจเอฟเฟ็กต์แบบสุ่มได้อย่างถูกต้องการแก้ไขเอฟเฟกต์แบบสุ่มนั้นก็เหมือนกับการขว้างพวกมันออกมาเนื่องจากเอฟเฟกต์แบบสุ่ม (อย่างน้อยก็ในการตั้งพาราเมตริก แต่อย่างไรก็ตามเนื่องจากฉันไม่ทราบค่าของตัวแปรเอฟเฟกต์แบบสุ่มสำหรับการสังเกตใหม่ดังนั้นแน่นอนว่าฉันไม่ได้ใช้เอฟเฟกต์แบบสุ่มในเวลาที่คาดการณ์มีเพียงเอฟเฟกต์คงที่เท่านั้น
sztal

1
คุณอาจต้องการอ่านบทความนี้ "ในประสิทธิผลของตัวแยกประเภทลอจิสติกส์ถดถอยแบบผสมสำหรับข้อมูลระยะยาว", search.proquest.com/openview/3578d64c85f3c1c52414924d044bca2c/ …
Jon

1
sztal: ถูกต้องแน่นอน ฉันพยายามตอบกลับอย่างรวดเร็วและพูดบางสิ่งที่ไม่มีความหมาย ฉันหาบทความ ( gllamm.org/JRSSApredict_09.pdf ) ซึ่งระบุการทำนายในส่วนที่ 7 ฉันต้องบอกว่าฉันไม่สามารถสรุปลงความคิดเห็นได้ซึ่งแสดงว่าฉันไม่เข้าใจจริงๆ
Wayne

คำถามสุดท้ายหนึ่งข้อ: เมื่อคุณเปรียบเทียบเอฟเฟกต์คงที่กับเอฟเฟ็กต์แบบผสมคุณใช้เอฟเฟกต์คงที่เหมือนกันในแต่ละครั้งหรือไม่โดยเพิ่มบางอย่างเช่นการสกัดกั้นระดับบุคคลหรือไม่ รู้สึกเหมือนอยู่ในสถานการณ์นี้คุณควรมีเอฟเฟกต์ที่คล้ายกันมากยกเว้นความคิดที่ดีขึ้นเกี่ยวกับช่วงเวลาการทำนายที่แท้จริงของคุณ
Wayne

คำตอบ:


17

มันขึ้นอยู่กับลักษณะของข้อมูล แต่โดยทั่วไปฉันคาดว่าตัวแบบผสมจะมีประสิทธิภาพสูงกว่าตัวแบบคงที่เท่านั้น

ลองยกตัวอย่าง: การสร้างแบบจำลองความสัมพันธ์ระหว่างแสงแดดและความสูงของต้นข้าวสาลี เรามีการวัดจำนวนของก้านแต่ละต้น แต่ก้านหลายต้นถูกวัดที่ไซต์เดียวกัน (ซึ่งมีความคล้ายคลึงกันในดินน้ำและสิ่งอื่น ๆ ที่อาจส่งผลกระทบต่อความสูง) นี่เป็นรูปแบบที่เป็นไปได้บางส่วน:

1) ความสูง ~ แสงแดด

2) height ~ แสงแดด + ไซต์

3) ความสูง ~ แสงแดด + (1 | เว็บไซต์)

เราต้องการใช้แบบจำลองเหล่านี้เพื่อทำนายความสูงของต้นข้าวสาลีใหม่เนื่องจากการประมาณของแสงแดดที่พวกเขาจะได้สัมผัส ฉันจะเพิกเฉยต่อการลงโทษด้วยพารามิเตอร์ที่คุณจะจ่ายสำหรับการมีเว็บไซต์จำนวนมากในรูปแบบคงที่เฉพาะเอฟเฟกต์และเพียงพิจารณาพลังการทำนายแบบสัมพัทธ์ของโมเดล

คำถามที่เกี่ยวข้องมากที่สุดที่นี่คือว่าจุดข้อมูลใหม่เหล่านี้ที่คุณพยายามจะทำนายนั้นมาจากหนึ่งในเว็บไซต์ที่คุณวัดหรือไม่ คุณพูดว่านี่เป็นของหายากในโลกแห่งความเป็นจริง แต่มันเกิดขึ้น

A) ข้อมูลใหม่มาจากเว็บไซต์ที่คุณวัด

ถ้าเป็นเช่นนั้นรุ่น # 2 และ # 3 จะดีกว่า # 1 พวกเขาทั้งสองใช้ข้อมูลที่เกี่ยวข้องมากขึ้น (หมายถึงผลกระทบของไซต์) เพื่อทำการคาดการณ์

B) ข้อมูลใหม่มาจากไซต์ที่ไม่ได้วัด

ฉันยังคงคาดหวังว่าแบบจำลอง # 3 จะมีประสิทธิภาพสูงกว่า # 1 และ # 2 ด้วยเหตุผลดังต่อไปนี้

(i) รุ่น # 3 เทียบกับ # 1:

แบบจำลอง # 1 จะสร้างการประมาณการที่ลำเอียงในความโปรดปรานของเว็บไซต์ที่มีอยู่เกินจริง หากคุณมีคะแนนจำนวนเท่ากันจากแต่ละไซต์และตัวอย่างที่เป็นตัวแทนของเว็บไซต์ที่สมเหตุสมผลคุณควรได้รับผลลัพธ์ที่คล้ายกันจากทั้งสอง

(ii) รุ่น # 3 เทียบกับ # 2:

ทำไมรุ่น # 3 ถึงดีกว่ารุ่นที่ 2 ในกรณีนี้ เนื่องจากเอฟเฟกต์แบบสุ่มใช้ประโยชน์จากการหดตัว - เอฟเฟกต์ของไซต์จะ 'หด' ต่อศูนย์ กล่าวอีกนัยหนึ่งคุณจะมีแนวโน้มที่จะพบค่าที่น้อยที่สุดสำหรับเอฟเฟกต์ของไซต์เมื่อมันถูกระบุว่าเป็นเอฟเฟกต์แบบสุ่มมากกว่าเมื่อมันถูกระบุว่าเป็นเอฟเฟกต์คงที่ สิ่งนี้มีประโยชน์และปรับปรุงความสามารถในการคาดการณ์ของคุณเมื่อค่าเฉลี่ยประชากรสามารถคิดได้อย่างสมเหตุสมผลว่ามาจากการแจกแจงแบบปกติ (ดูสไตน์ความขัดแย้งในสถิติ ) หากค่าเฉลี่ยประชากรไม่คาดว่าจะเป็นไปตามการแจกแจงแบบปกตินี่อาจเป็นปัญหา แต่โดยปกติจะเป็นข้อสันนิษฐานที่สมเหตุสมผลมากและวิธีการนี้มีความทนทานต่อการเบี่ยงเบนเล็กน้อย

[หมายเหตุด้านข้าง: โดยค่าเริ่มต้นเมื่อทำการติดตั้งแบบจำลอง # 2 ซอฟต์แวร์ส่วนใหญ่จะใช้หนึ่งในไซต์เป็นข้อมูลอ้างอิงและค่าสัมประสิทธิ์การประมาณค่าสำหรับไซต์อื่นที่แสดงถึงค่าเบี่ยงเบนจากการอ้างอิง ดังนั้นจึงอาจปรากฏขึ้นราวกับว่าไม่มีวิธีในการคำนวณผลกระทบของประชากรโดยรวม แต่คุณสามารถคำนวณสิ่งนี้ได้โดยเฉลี่ยทั้งการคาดการณ์สำหรับแต่ละไซต์หรือมากกว่าเพียงแค่เปลี่ยนการเข้ารหัสของแบบจำลองเพื่อคำนวณค่าสัมประสิทธิ์สำหรับทุกไซต์]


ขอบคุณสำหรับคำตอบ. ฉันค่อนข้างมั่นใจ น่าเสียดายที่ตอนนี้ฉันจำไม่ได้ว่าเป็นกรณีที่แน่นอนที่กระตุ้นคำถามของฉัน แต่ฉันคิดว่าประสิทธิภาพที่ไม่ดีของแบบจำลองผสมในกรณีของฉันอาจเป็นเพราะการกระจายตัวทำนายที่ผิดปกติที่ฉันใช้ในแบบจำลอง ฉันจะยอมรับคำตอบในไม่ช้า แต่เนื่องจากคำถามนั้นได้รับความสนใจฉันจะให้อีกสองสามวันเพื่อให้บางคนอาจส่งคำอธิบายที่เข้มงวดมากขึ้น (บางทีอาจเป็นตัวอย่าง)
sztal

1
ใส่กัน มันควรจะสังเกตได้ว่า heirarchically ทำนายผลกระทบเฉพาะไซต์ที่ก่อให้เกิดผลแบบสุ่มเพื่อทำนายว่าการสกัดกั้นแบบสุ่มหรือความชันแบบสุ่มนั้นถูกประเมินเชิงประจักษ์จากแบบจำลองที่ควรจะเทียบเท่ากับการมีกลุ่มเฉพาะของแต่ละระดับ ในรูปแบบ
AdamO

8

การติดตามการตอบสนองที่ยอดเยี่ยมของ mkt: จากประสบการณ์ส่วนตัวของฉันเองในการพัฒนาแบบจำลองการทำนายในด้านการประกันสุขภาพการผสมผสานเอฟเฟกต์แบบสุ่มลงในแบบจำลองการทำนาย (รวมถึงแบบจำลองการเรียนรู้ด้วยเครื่อง) มีข้อดีหลายประการ

ฉันมักจะขอให้สร้างแบบจำลองเพื่อทำนายผลลัพธ์การเรียกร้องในอนาคตสำหรับ (เช่นค่าใช้จ่ายด้านสุขภาพในอนาคต, ระยะเวลาพำนัก ฯลฯ ) โดยอิงจากข้อมูลการอ้างสิทธิ์ในอดีตของแต่ละบุคคล บ่อยครั้งที่มีการเรียกร้องหลายครั้งต่อบุคคลพร้อมผลลัพธ์ที่สัมพันธ์กัน การเพิกเฉยข้อเท็จจริงที่ว่าการอ้างสิทธิ์หลายครั้งร่วมกันโดยผู้ป่วยรายเดียวกันจะทำให้ข้อมูลที่มีค่าในแบบจำลองการทำนาย

ทางออกหนึ่งคือการสร้างตัวแปรตัวบ่งชี้ผลกระทบคงที่สำหรับสมาชิกแต่ละคนในชุดข้อมูลและใช้การถดถอยเชิงลงโทษเพื่อลดขนาดของผลกระทบคงที่ระดับสมาชิกแต่ละแยกต่างหาก อย่างไรก็ตามหากข้อมูลของคุณมีสมาชิกนับพันหรือล้านคนโซลูชันที่มีประสิทธิภาพมากขึ้นจากทั้งจุดยืนและการคาดการณ์อาจจะเป็นตัวแทนของเอฟเฟกต์คงที่ระดับสมาชิกหลายคนในรูปแบบสุ่มเอฟเฟกต์แบบกระจายเดียว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.